[صفحه اصلی ]   [ English ]  
بخش‌های اصلی
درباره دانشکده::
مدیریت دانشکده::
اعضای هیات علمی ::
معرفی افراد::
امور آموزش::
امور پژوهشی::
آموزش الکترونیکی::
پردیس شماره 2::
اخبار و رویدادها::
فضاهای آموزشی و تحقیقاتی ::
تسهیلات پایگاه::
::
ورود به سایت دروس

AWT IMAGE

نام کاربری
کلمه عبور

AWT IMAGE
رمز ورود را فراموش کرده‌اید؟

..
دفاعیه کارشناسی ارشد

دفاعیه کارشناسی ارشد

..
جستجو در پایگاه

جستجوی پیشرفته
..
دریافت اطلاعات پایگاه
نشانی پست الکترونیک خود را برای دریافت اطلاعات و اخبار پایگاه، در کادر زیر وارد کنید.
..
:: جلسه دفاعیه از رساله دکترا-آقای بهزاد زمانی دهکردی ::
 | تاریخ ارسال: ۱۳۹۱/۳/۲۱ | 

 AWT IMAGE

 آقای بهزاد زمانی دهکردی دانشجوی دکترای جناب آقای دکتر احمد اکبری روز سه شنبه مورخ 30/3/91 ساعت 16:30 در اتاق 106 واقع در طبقه اول دانشکده مهندسی کامپیوتر از رساله دکترای خود تحت عنوان ارائه چهارچوبی برای تبدیلات متمایز ساز ویژگی ها به منظور افزایش نرخ بازشناسی گفتار دفاع خواهند نمود.

 

  چکیده پایان نامه:

  سیستم ­ های بازشناسی خودکار گفتار را می­توان متشکل از دو قسمت کلی دانست: بخش استخراج ویژگی و بخش مربوط به مدل کردن آماری ویژگی­ها و دسته بندی. ویژگی­های گفتاری باید خصوصیات برجسته­تری از گفتار را تعیین کند که واحدهای مختلف گفتاری را از یکدیگر متمایز نماید. گاه این ویژگی­ها به واسطه لهجه و نحوه گویش گفتار، تغییر گویندگان یا حضور نویز خصوصیت متمایزسازی خود را تا اندازه زیادی از دست می­دهند. تبدیل ویژگی می­تواند پس از استخراج ویژگی بکار رود تا به این متمایزسازی کمک نماید. از یک نگاه روش­های تبدیل ویژگی را می­توان به دو گروه مبتنی بر داده و مبتنی بر کلاس­بند تقسیم کرد. درواقع معیار تخمین تبدیل، تعیین کننده نوع تبدیل است. اگر معیار فقط برمبنای رفتار آماری ویژگی­ها باشد، روش مبتنی بر داده و اگر معیار بر اساس خطای کلاس­بندی باشد، روش را مبتنی بر کلاس­بند می­نامند. طبعاً بهره­گیری از هر یک از این دو معیار به تنهایی، اطلاعات مربوط به معیار دیگر را در نظر نمی­گیرد که چندان عادلانه نیست. چون هم باید به ماهیت ویژگی­ها توجه داشت و هم به نحوه عملکرد کلاس­بند. از دیدگاهی دیگر، روش­های تبدیل ویژگی را می­توان به روش­های خطی و غیرخطی تقسیم نمود. روش­های تبدیل ویژگی خطی ویژگی­های جدید را براساس میانگین وزندار ویژگی­های اصلی بدست می­آورد. اما تبدیلات غیرخطی با یک نگاشت غیرخطی عمل تبدیل را انجام می­دهد.

  در این رساله هدف اعمال تبدیل بر ویژگی ­ های گفتار با هدف متمایزسازی بیشتر ویژگی ­ ها به منظور افزایش نرخ بازشناسی گفتار است. برای این منظور چارچوبی برای ترکیب و بهبود روش­های تبدیل ویژگی مبتنی بر داده و مبتنی بر کلاس­بند در هر دو حوزه خطی و غیرخطی مطرح شده است. در این راستا ابتدا ترکیب در حوزه تبدیلات خطی صورت می­گیرد و در ادامه پیشنهادی برای بهبود تبدیل­ها از دیدگاه غیرخطی بودن مطرح می­شود.

  در رویکرد خطی، روش­های تبدیل ویژگی مبتنی بر داده خطی نظیر تحلیل مولفه­های اصلی (PCA) و تحلیل متمایزساز خطی (LDA) با توجه به خطای کلاس­بندی کمینه (MCE) و بهره­گیری از درست­نمایی­های مدل مخفی مارکوف و نیز الگوریتم ژنتیک به شکل خطی بهبود یافته­اند.

  در رویکرد غیرخطی، تبدیل مبتنی بر خطای کلاس­بند کمینه (MCE) با استفاده از مفاهیم هسته به شکل غیرخطی ارائه و فرموله شده است و منجر به معرفی روش خطای کلاس­بندی کمینه مبتنی بر هسته (Kernel MCE) گردیده است. به این ترتیب کارآیی روش خطی مذکور با جداسازی ویژگی­هایی که بعضاً به صورت خطی قابل جداسازی نیستند، افزایش می­یابد. به علاوه در روش­های تبدیل ویژگی غیرخطی مبتنی بر داده و هسته همچون تحلیل مولفه­های اصلی مبتنی بر هسته (Kernel PCA) و تحلیل متمایزساز مبتنی بر هسته (kernel LDA) نیز به خطای کلاس­بندی توجهی نمی­شود. از این رو روشی پیشنهاد شده است تا تابع هسته برای این روش­ها به نحوی تعیین شود که در انجام نگاشت، خطای کلاس­بندی نیز مد نظر قرار گیرد. این تابع هسته با استفاده از الگوریتم ژنتیک و برنامه­ریزی ژنتیک و ترکیب خطی و غیرخطی توابع هسته شناخته شده نظیر توابع هسته گاوسی و چندجمله­ای و با توجه به معیار خطای کلاس­بندی کمینه و اطلاعات متقابل ویژگی­ها و کلاس­ها تعیین می­گردد. نتایج آزمایشها بر روی دادگان گفتاری نشانگر آن است که روش­های پیشنهادی تبدیل ویژگی سبب افزایش کارایی روشهای کلاسیک تبدیل ویژگی شده اند.

  واژه‌های کلیدی: بازشناسی گفتار، تبدیل وی‍ژگی، خطای کلاسبندی کمینه،تحلیل مولفه­های اصلی، تحلیل متمایزساز خطی، تابع هسته.

 

 

:  Abstract
Automatic speech recognition systems contain two main parts, namely feature extraction and statistical modeling and classification parts. The extended feature should have good speech properties which discriminate different speech units. The discrimination power of these features decreases frequently due to different factors such as accent, presence of new speakers or noise. Feature transformation can be used after feature extraction to improve the discrimination power. Feature transformation methods can be divided to two categories: data-based and classier-based methods. In data-based methods the measure of transformation approximation is based in the statistical behavior of the features; but in classifier-based method, it is based on classifier’s error. In another sense, the feature transformation methods can be divided to linear and nonlinear methods. While linear methods calculate the new features as a weighted average of the original feature, nonlinear methods use a nonlinear mapping for this reason.

  In this dissertation, a new feature framework is proposed for combination and improvement of data-based and classifier-based methods in both linear and nonlinear domains. To do this, at first, the combination of transformation methods is performed in linear domain and then, its generalization to nonlinear domain is explored.

 

  Keywords: speech recognition, feature transformation, minimum classification error, principle component analysis, linear discriminant analysis, kernel function.

 

 

  ارائه­دهنده:

 بهزاد زمانی دهکردی

 bzamani@iust.ac.ir

  استاد راهنما:

  دکتر احمد اکبری

  هیات داوران:

  1- دکتر حمید شیخ زاده نجار 2 -دکتر محمد مهدی همایونپور 3- دکتر مجمدرضا جاهد مطلق

  4- دکتر عادل ترکمان رحمانی 5-دکتر ناصر مزینی

  زمان : سه شنبه 30 خردادماه 1391

  ساعت 16:30

  مکان: دانشکده مهندسی کامپیوتر- طبقه اول- اتاق 106

  از اساتید بزرگوار، دانشجویان گرامی و دیگر متخصصان و علاقه مندان به موضوع دفاعیه دعوت
می شود با حضور خود موجبات غنای علمی و ارتقای کیفی را فراهم سازند.

  دانشکده مهندسی کامپیوتر مدیریت تحصیلات تکمیلی

 

دفعات مشاهده: 4418 بار   |   دفعات چاپ: 1191 بار   |   دفعات ارسال به دیگران: 62 بار   |   0 نظر
سایر مطالب این بخش سایر مطالب این بخش نسخه قابل چاپ نسخه قابل چاپ ارسال به دوستان ارسال به دوستان
School of Computer Engineering
Persian site map - English site map - Created in 0.178 seconds with 967 queries by yektaweb 3433