آقای پرهام رحیمی دانشجوی کارشناسی ارشد آقای دکتر بهروز مینایی بیدگلی مورخ ۱۴۰۲/۰۸/۱۷ ساعت ۱۷:۳۰ از پروژه کارشناسی ارشد خود با عنوان "استخراج رابطه از متن خام با استفاده از مدلهای زبانی بزرگ و رویکرد نظارت از راه دور" دفاع خواهند نمود. |
ارائه دهنده:
پرهام رحیمی
استاد راهنما:
دکتر
بهروز مینایی بیدگلی
هیات داوران:
دکتر سید صالح اعتمادی
دکتر احسان ناظرفرد
زمان : ۱۷ آبان ماه ۱۴۰۲
ساعت ۱۷:۳۰
چکیده پایان نامه :
با رشد سریع متون بدون ساختار در وب، استخراج رابطه نقشی حیاتی در تحقیقات پردازش زبان طبیعی ایفا کرده و به طور خودکار متون بدون ساختار را به قالبهای ساختیافته تبدیل و ذخیره میکند. این وظیفه میتواند به تکمیل و بروزرسانی گرافهای دانش موجود از داده روز نیز کمک شایانی کند. روشهای استخراج رابطه باناظر به حجم زیادی دادهی آموزشی برچسبگذاری شده نیاز دارند که زمان و هزینه بر است. نظارت از راه دور برای رسیدگی به این چالش پیشنهاد شده است. با وجود اینکه مدلهای استخراج رابطه سنتی به موفقیتهای قابل توجهی دست یافتهاند، پیشرفتهای اخیر در مدلهای زبانی بزرگ دستاوردهای قابلتوجهی در پیشبرد لبه دانش در وظایف مختلف پردازش زبان طبیعی نشان دادهاند که آنها را شایسته بررسی در این وظیفه میکند.
این نوشتار استفاده از مهندسی پرامپت و مدلهای زبانی بزرگ را برای غلبه بر چالشهای موجود در بهبود نتایج لبه دانش در استخراج رابطه ترسیم میکند. در این راستا، ابتدا روشی برای تولید پرامپت مهندسیشده بر اساس مجموعهدادههای استخراج رابطه سنتی ارائه میشود. سپس با استفاده از روش مذکور مجموعهدادههای ۲۴ و ۵۶ رابطهای که به ترتیب دارای بیش ۶۰ هزار و بیش از ۶۰۰ هزار پرامپت هستند، برای استخراج رابطه با رویکرد نظارت از راه دور بر مبنای مجموعهدادهی نیویورک تایمز برای مدلهای زبانی بزرگ ارائه میشود. در نهایت مدل زبانی تی۵ به گونهای تنظیم دقیق میشود که میتواند نتایج بهتری نسبت به مدلهای لبه دانش فعلی در معیارهای امتیاز اف (۱.۱۲ واحد ارتقا) و دقت (۲.۴۴ واحد ارتقا) ارائه دهد. همچنین استفاده از رویکرد آموزش کمنمونه و بینمونه مدل زبانی بزرگ لاما۲ برای به دست آوردن نتایج بهتر در استخراج رابطه برای رابطههای کم تکرار در مجموعهدادهی آموزش پیشنهاد میشود.
واژههای کلیدی:
استخراج رابطه، نظارت از راه دور، مدلهای زبانی، مدلهای زبانی بزرگ، پردازش زبان طبیعی
مکان: دانشکده مهندسی کامپیوتر، طبقه ۲ ،اتاق دفاعیه دکتری |