[صفحه اصلی ]   [ English ]  
بخش‌های اصلی
درباره دانشکده::
مدیریت دانشکده::
اعضای هیات علمی ::
معرفی افراد::
امور آموزش::
امور پژوهشی::
آموزش الکترونیکی::
پردیس شماره 2::
اخبار و رویدادها::
فضاهای آموزشی و تحقیقاتی ::
تسهیلات پایگاه::
::
ورود به سایت دروس

AWT IMAGE

نام کاربری
کلمه عبور

AWT IMAGE
رمز ورود را فراموش کرده‌اید؟

..
دفاعیه کارشناسی ارشد

دفاعیه کارشناسی ارشد

..
جستجو در پایگاه

جستجوی پیشرفته
..
دریافت اطلاعات پایگاه
نشانی پست الکترونیک خود را برای دریافت اطلاعات و اخبار پایگاه، در کادر زیر وارد کنید.
..
:: سینا پیری - 1397/08/30 ::
 | تاریخ ارسال: ۱۳۹۷/۸/۳۰ | 

ارائه­ دهنده:

سینا پیری

  استاد راهنما:

آقای دکتر احمد اکبری ازیرانی

استاد مشاور: بابک ناصرشریف
  استاد ممتحن خارجی : آقای دکتر یاسر شکفته
استاد ممتحن داخلی: آقای دکتر رضا برنگی

  زمان :  چهارشنبه 30 آبان ماه

  مکان: دانشکده مهندسی کامپیوتر- طبقه سوم- اتاق 304


سینا پیری دانشجوی کارشناسی ارشد آقای دکتر احمد اکبری ازیرانی روز چهارشنبه  1397/08/30 ساعت 16:30  در اتاق 304 واقع در طبقه سوم دانشکده کامپیوتر از پروژه کارشناسی ارشد خود تحت عنوان بهبود رمزگشای بازشناسی گفتار با استفاده از مدل زبانی دفاع خواهند نمود.

چکیده پایان نامه:

بازشناسی خودکار گفتار یکی از زمینه های تحقیقاتی در پردازش گفتار می‌باشد و هدف اصلی آن تبدیل سیگنال گفتار به دنباله‌ای از کلمات می‌باشد. سیستم‌های مورد استفاده در بازشناسی گفتار دارای چندین مولفه از جمله پیش‌پردازش صوت، مدل صوتی، لغت‌نامه، مدل زبانی و رمزگشا می‌باشند. در سال‌های اخیر گرایش زیادی به سیستم‌های جدیدی تحت عنوان سیستم‌های انتها به انتها E2E در حوزه تحقیقات ASR به‌وجود آمده‌است. یک سیستم E2E بازشناسی گفتار دنباله ورودی ویژگی‌های صوتی x را به دنباله خروجی احتمالات نشانه‌های y تبدیل می‌کند. یکی از روش‌ها بر  ‍پایه سیستم‌های E2E یک شبکه عصبی را با استفاده از تابع خطای رده‌بندی زمانی اتصال‌گرا (CTC) آموزش می‌دهد. زمانی که شبکه آموزش دید، بایستی رمزگشا با انتخاب محتمل‌ترین برچسب‌زنی یک دنباله ورودی ناشناخته را برچسب بزند. برای رمزگشایی CTC الگوریتم‌های متفاوت رمزگشایی نظیر الگوریتم رمزگشایی بهترین مسیر و جتسجوی پرتوی پیشوند به‌عنوان روش‌های پایه معرفی شده‌اند. در روش PBS سعی بر کاهش خطای حاصل شده از CTC با استفاده از مدل زبانی می‌باشد.
 
در این پایان‌نامه به اصلاح الگوریتم رمزگشایی PBS و بهبود آن با اعمال جریمه به احتمال کلمات خارج از واژگان (OOV) مدل زبانی پرداختیم. کلماتی که توسط بازشناسی گفتار به‌صورت اشتباه تشخیص داده می‌شوند در بسیاری از مواقع به کلماتی تبدیل می‌شوند که در مدل زبانی وجود ندارند یا به عبارتی دیگر کلمات OOV می‌باشند. ازین رو اعمال جریمه بر احتمال این کلماتُ احتمال جمله‌های که بازشناس اشتباه کرده را کم می‌کند. برای پیاده‌سازی روش پیشنهادی ابتدا ساختار الگوریتم PBS را اصلاح می‌کنیم. سپس با در نظر گرفتن احتمال کلمات OOV و اعمال جریمه بر احتمال آن‌ها در رمزگشایی سعی در بهبود نتیجه مورد نظر داریم. در ادامه سعی بر تنظیم مقدار جریمه با استفاده از آنتروپی خروجی CTC داریم. روش پیشنهادی موجب بهبود  خروجی رمزگشا و گاهش خطا نسبت به الگوریتم PBS شده‌است. در مجموعه دادگان Librispeech نرخ خطای کلمه ۱۰/۰۷۹ دز روش PBS به ۹/۴۴۰ و در مجموعه دادگان TED-LIUM نرخ خطای کلمه از ۲۸/۸۹۴ به ۲۸/۱۷۲ رسیده‌است. در دیگر معیار ارزیابی نرخ خطای حرف نیز در مجموعه دادگان Librispeech از ۲/۷۳۵ بع ۲/۶۶۹ و در مجموعه دادگان TED-LIUM از ۸/۹۸۰ به ۸/۸۰۱ رسیده‌است.
 


  از اساتید بزرگوار، دانشجویان گرامی و دیگر متخصصان و علاقه مندان به موضوع دفاعیه دعوت
می شود با حضور خود موجبات غنای علمی و ارتقای کیفی را فراهم سازند.

  دانشکده مهندسی کامپیوتر مدیریت تحصیلات تکمیلی

دفعات مشاهده: 171 بار   |   دفعات چاپ: 4 بار   |   دفعات ارسال به دیگران: 0 بار   |   0 نظر
سایر مطالب این بخش سایر مطالب این بخش نسخه قابل چاپ نسخه قابل چاپ ارسال به دوستان ارسال به دوستان
School of Computer Engineering
Persian site map - English site map - Created in 0.2 seconds with 51 queries by YEKTAWEB 3789