دانشکده مهندسی کامپیوتر- دفاعیه ارشد
پرهام رحیمی

حذف تصاویر و رنگ‌ها  | تاریخ ارسال: 1402/8/15 | 

آقای پرهام رحیمی دانشجوی کارشناسی ارشد آقای دکتر بهروز مینایی بیدگلی مورخ  ۱۴۰۲/۰۸/۱۷ ساعت ۱۷:۳۰ از پروژه کارشناسی ارشد خود با عنوان "استخراج رابطه از متن خام با استفاده از مدل‌های زبانی بزرگ و رویکرد نظارت از راه دور" دفاع خواهند نمود.

 


ارائه ­دهنده:
پرهام رحیمی

  استاد راهنما:
دکتر 
بهروز مینایی بیدگلی


  هیات داوران:

دکتر سید صالح اعتمادی
 دکتر احسان ناظرفرد

زمان : ۱۷ آبان ماه ۱۴۰۲

  ساعت ۱۷:۳۰

       


چکیده پایان نامه :

با رشد سریع متون بدون ساختار در وب، استخراج رابطه نقشی حیاتی در تحقیقات پردازش زبان طبیعی ایفا کرده و به طور خودکار متون بدون ساختار را به قالب‌های ساخت‌یافته تبدیل و ذخیره می‌کند. این وظیفه می‌تواند به تکمیل و بروزرسانی گراف‌های دانش موجود از داده روز نیز کمک شایانی کند. روش‌های استخراج رابطه باناظر به حجم زیادی داده‌ی آموزشی برچسب‌گذاری شده نیاز دارند که زمان‌ و هزینه بر است. نظارت از راه دور برای رسیدگی به این چالش پیشنهاد شده است. با وجود اینکه مدل‌های استخراج رابطه سنتی به موفقیتهای قابل توجهی دست یافته‌اند، پیشرفت‌های اخیر در مدل‌های زبانی بزرگ دستاوردهای قابل‌توجهی در پیشبرد لبه دانش در وظایف مختلف پردازش زبان طبیعی نشان داده‌اند که آن‌ها را شایسته بررسی در این وظیفه می‌کند.
این نوشتار استفاده از مهندسی پرامپت و مدل‌های زبانی بزرگ را برای غلبه بر چالش‌های موجود در بهبود نتایج لبه دانش در استخراج رابطه ترسیم می‌کند. در این راستا، ابتدا روشی برای تولید پرامپت مهندسی‌شده بر اساس مجموعه‌داده‌های استخراج رابطه سنتی ارائه می‌شود. سپس با استفاده از روش مذکور مجموعه‌داده‌های ۲۴ و ۵۶ رابطه‌ای که به ترتیب دارای بیش ۶۰ هزار و بیش از ۶۰۰ هزار پرامپت هستند، برای استخراج رابطه با رویکرد نظارت از راه دور بر مبنای مجموعه‌داده‌ی نیویورک تایمز برای مدل‌های زبانی بزرگ ارائه می‌شود. در نهایت مدل زبانی تی۵ به گونه‌ای تنظیم دقیق می‌شود که می‌تواند نتایج بهتری نسبت به مدل‌های لبه دانش فعلی در معیارهای امتیاز اف (۱.۱۲ واحد ارتقا) و دقت (۲.۴۴ واحد ارتقا) ارائه دهد. همچنین استفاده از رویکرد آموزش کم‌نمونه و بی‌نمونه مدل زبانی بزرگ لاما۲ برای به دست آوردن نتایج بهتر در استخراج رابطه برای رابطه‌های کم تکرار در مجموعه‌داده‌ی آموزش پیشنهاد می‌شود.

واژه‌های کلیدی:
استخراج رابطه، نظارت از راه دور، مدل‌های زبانی، مدل‌های زبانی بزرگ، پردازش زبان طبیعی

 

مکان: دانشکده مهندسی کامپیوتر، طبقه ۲  ،اتاق دفاعیه دکتری

نشانی مطلب در وبگاه دانشکده مهندسی کامپیوتر:
http://idea.iust.ac.ir/find-14.11064.76095.fa.html
برگشت به اصل مطلب