ارائه دهنده:
کیامهر رضایی
اساتید راهنما:
دکتر
محمد طاهر پیله ور
دکتر صالح اعتمادی
هیات داوران:
دکتر بهروز مینایی
دکتر هشام فیلی
زمان:
چهارشنبه ۱۴۰۰/۰۴/۰۲
آقای کیامهر رضایی دانشجوی کارشناسی ارشد آقایان دکتر محمد طاهر پیله ور و دکتر صالح اعتمادی روز چهارشنبه ۰۲ تیر ماه ساعت ۱۳:۰۰ از پروژه کارشناسی ارشد خود تحت عنوان "
واکاوی توانایی بازشناسی معنایی مدلهای حساس به محتوا برای بازنمایش کلمات
" دفاع خواهند نمود.
چکیده پایان نامه:
امروزه کاربرد شبکه های عصبی عمیق در حوزه پردازش زبانهای طبیعی، به طور چشمگیری افزایش یافته است و در بیشتر زمینه ها، همچون ترجمهی ماشینی، پاسخ به سوال، دسته بندی متون و غیره، روشهای مبتنی بر شبکهه ای عصبی عملکرد با اختلاف بهتری نسبت به روشهای دیگر دارند. همانطور که میدانیم، ورودی شبکه های عصبی از جنس اعداد و ارقام میباشد؛ بنابراین یکی از چالشها هنگام بکارگیری شبکه های عصبی در حوزه زبانهای طبیعی، تبدیل کردن اسنادی از جنس کلمات به ورودیهایی عددی است. یکی از مشکلات اصلی در روشهای اولیه مربوط به کلماتی با چندین معنی مختلف میباشد که با وجود داشتن شکل نوشتاری یکسان، میبایست به بردارهای متفاوتی نگاشته شوند.
امروزه مدلهای زبانی از پیش آموزش داده شده، به طور گسترده برای حل مشکل ذکر شده مورد استفاده قرار میگیرند؛ چرا که این مدلها با استفاده از محتوایی که کلمهی مورد نظر در آن ظاهر شده است، بازنماییهای متفاوتی برای معانی مختلف یک واژه ایجاد میکنند. مدل BERT و مشتقات آن به لطف توانایی بینظیرشان در به کار گیری محتوا برای بازنمایی کلمات، امروزه در تمامی آزمونها از جمله آزمونهای مربوط به رفع ابهام از کلمات، درخشش چشمگیری داشتهاند. هرچند، در رابطه با میزان توانایی آنها در کیفیت رمزنگاری و رمزگشایی معانی مختلف کلمات، همچنان ابهام وجود دارد.
در این کار، ما بهطور جامع، به بررسی کمی و کیفی مدل BERT در رابطه با ابهام واژگانی میپردازیم. یکی از نتایج اصلی کار، این است که BERT میتواند با دیدن تعداد اندکی نمونه از هریک از معانی درشتدانهی واژگان، به خوبی آنها را از یکدیگر تمایز دهد. همچنین، نشان میدهیم که این مدلهای زبانی در شرایط بهینه، بسیار به عملکرد انسان در زمینهی رفع ابهام از واژگان نزدیک شدهاند. همچنین ما در این کار به بررسی تفاوت عملکرد دو رویکرد مختلف ابهام زدایی از واژگان میپردازیم. در رویکرد اول، مدل از پیش آموزش داده شده، بر روی دادگان جدید تنظیم میگردد و در رویکرد دوم، از دانش خام مدلهای زبانی بدون تنظیم بیشتر بر روی دادهی جدید بهره برداری میشود. نشان میدهیم که رویکرد دوم که رویکرد عملی و همچنین طبیعیتر حل این مساله میباشد، نسبت به خطا مقاومت بیشتری داشته و به نمونه های بسیار کمی برای بهره برداری نیاز دارد. در نهایت با معرفی مشکلاتی که تعریف فعلی صورت مسالهی رفع ابهام در راستای ارزیابی سیستمها ایجاد میکند و با معرفی صورت مساله ی جایگزین، این تحقیق به پایان میرسد.
واژههای کلیدی: پردازش زبانهای طبیعی، جاسازی کلمات، چندمعنایی، ابهام واژگان، مدل BERT
"دفاع بهصورت آنلاین برگزار میشود"
دانشکده مهندسی کامپیوتر مدیریت تحصیلات تکمیلی
|