ارائه دهنده:
بهروز جانفدا
استاد راهنما:
دکتر بهروز مینایی
هیات داوران:
دکتر محمد رضا کنگاوری؛ دکتر سعیده ممتازی
زمان:
سه شنبه ۱۴۰۰/۰۱/۳۱
آقای بهروز جانفدا دانشجوی کارشناسی ارشد آقای دکتر بهروز مینایی سه شنبه ۳۱ فروردین ماه ساعت ۱۱:۳۰ از پروژه کارشناسی ارشد خود تحت عنوان "الگوریتمی برای سادهسازی متن در زبان فارسی و کاربرد آن در بهبود الگوریتم های استخراج رابطه
" دفاع خواهند نمود.
چکیده پایان نامه:
سادهسازی متن از زمینههای در حال توسعه در پردازش زبان طبیعی است و با بهبود امکانات سختافزاری، پیشرفت روشها و تنوع کاربردها، مورد توجه روزافزون قرار گرفته است. سادهسازی متن فرایندی است که طی آن جملات زبان طبیعی به شیوهای تغییر داده میشوند که پیچیدگیشان کاهش و خوانایی و فهمپذیریشان افزایش یابد. خودکارسازی این فرایند دشوار است و الگوریتمهای پیشنهادی در این حوزه تلاش دارند تا با کمترین خطا، بیشترین کاهش پیچیدگی و بیشترین افزایش خوانایی و فهمپذیری را فراهم کنند. از طرف دیگر متون ورودی در فرآیندهای متنکاوی عموماً مجموعهای از جملات پیچیدهی زبان طبیعی هستند که تشخیص ویژگیهای دستوری و واژگانی این جملات را برای الگوریتمهای متنکاو دشوار میکنند و میزان خطا در نتایج را بالا میبرند. از راههای کاهش میزان این خطا استفاده از الگوریتمهای سادهسازی متن بهعنوان یکی از وظایف پیشپردازش متن در الگوریتمهای متنکاو است که باعث کاهش پیچیدگی ورودی شده و در نتیجه خطای الگوریتم متنکاو کاهش و بازخوانی آن افزایش داده میشود.
پیش از این در زبان فارسی الگوریتمی برای سادهسازی متن ارائه نشده است. از سوی دیگر در حال حاضر الگوریتمهای استخراج رابطه و استخراج دانش موجود در زبان فارسی نیاز به بهبود دارند. در این پژوهش نخستین الگوریتم سادهسازی متن در زبان فارسی را ارائه میدهیم. از آنجا که الگوریتمهای موجود در مرزهای دانش در زبانهای دیگر، بر اساس پیکرههای آموزشی موجود در آن زبانها آموزش داده میشوند و چنین پیکرهای در زبان فارسی موجود نیست و در عین حال تولید چنین پیکرهای نیز بسیار پرهزینه و زمانبر است، الگوریتم پیشنهاد شده در این پژوهش یک الگوریتم بیناظر و بدون نیاز به مجموعه دادگان آموزشی است. این الگوریتم یک سامانه قاعدهمحور است که قواعد سادهسازی در آن به کمک گونه خاصی از عبارات منظم بر روی ویژگیهای متن (مثلاً ویژگیهای دستوری) و به کمک کاربران خبره طراحی شده است. برای ارزیابی، این الگوریتم را به عنوان یک سامانه پیشپردازشی برای الگوریتمهای موجود استخراج رابطه به کار بستیم و نتایج حاصله را در مقایسه با نتایج الگوریتم استخراج رابطه بدون استفاده از این پیشپردازش مورد ارزیابی و مقایسه قرار دادیم و نشان دادیم که استفاده از الگوریتم سادهساز متن به عنوان یک وظیفه پیشپردازشی، نتایج الگوریتم استخراج رابطه مورد نظر را بهبود میدهد.
واژگان کلیدی:
سادهسازی متن، استخراج رابطه، استخراج دانش، پردازش زبان طبیعی، زبان فارسی
"دفاع بهصورت آنلاین برگزار میشود"
دانشکده مهندسی کامپیوتر مدیریت تحصیلات تکمیلی
|