ارائه دهنده:
سجاد علیزاده فرد
استاد راهنما:
دکتر
حسین رحمانی
هیات داوری:
دکتر حسن نادری
دکتر صادق علیاکبری
زمان:
۱۴۰۲/۰۴/۲۸
ساعت ۱۶:۳۰
آقای سجاد علیزاده فرد دانشجوی کارشناسی ارشد دکتر حسین رحمانی ۲۸ تیرماه ۱۴۰۲ ساعت ۱۶:۳۰ از پروژه کارشناسی ارشد خود تحت عنوان "شناسایی تقلبات مالی با استفاده از روشهای یادگیری گروهی" دفاع خواهند نمود.
چکیده پایان نامه:
تقلب در دادههای مالی همواره یک نگرانی جدی برای سازمانهای تجاری و افراد است. اِعمال بررسیهای دستی برای شناسایی تقلب زمانبر و پرهزینه است.کشف مناسب تقلب به بازرسان اجازه میدهد اقدامات به موقع انجام دهند و از تقلبات بیشتر و خسارات مالی جلوگیری کنند. از مراحل اصلی در فرایند کشف تقلب، مرحله انتخاب ویژگیها است که تاثیر مهمی بر دقت و زمان اجرای مدلها دارد. تراکنشهای کارتهای اعتباری به طور معمول تعداد زیادی ویژگی دارند. برخی از ویژگیها ممکن است برای ردهبندها معنیدار نباشند یا منجر به بیشبرازش شود. علاوه بر این، داشتن ویژگیهای تکراری کمتر، منجر به درک بهتر تصمیم ردهبند میشود. همچنین، انتخاب ویژگی میتواند «سرعت ردهبندها» را به دلیل کاهش اندازه مجموعه ویژگیها و «عملکرد آنها» را به دلیل جلوگیری از بیشبرازش افزایش دهد.
از چالشهای اصلی هنگام استفاده از مدلهای پیچیده در شناسایی تقلب، عدم تفسیرپذیری در مورد نحوه کار و چرایی تصمیمگیری مدلها است. به طور خاص، هنگام کار با دادههای حساس در دامنههای امنیتی، ارائه توضیحات مؤثر به کاربران سیستم از اهمیت بالایی برخوردار است و به یک الزام اخلاقی و قانونی در بسیاری از حوزههای کاربردی تبدیل شدهاست.
ما در این پژوهش، به ارائه «یک چارچوب انتخاب ویژگی تفسیرپذیر» با رویکرد گروهی میپردازیم. در این پژوهش سعی شد، چارچوب پیشنهادی بر روی ترکیبات مختلف از بهترین مدلها در کارهای پیشین اِعمال و نتایج آن با سایر الگوریتمهای انتخاب ویژگی به صورت کمی و کیفی مقایسه گردد.
ارزیابی کمی چارچوب «X-SHAoLIM» بر روی ترکیبات مختلف از مدلهای منتخب در کارهای پیشین، نشان داد بهکارگیری چارچوب پیشنهادی در مرحله انتخاب ویژگیها، به صورت میانگین باعث افزایش دقت مدلها، براساس معیارهای درستی (+۵/۶)، فراخوانی (+۵/۱)، معیار F (+۵/۳) و AUC (+۷۵/۶) شده و در مقایسه با سایر الگوریتمهای انتخاب ویژگی بهترین عملکرد را به ارمغان میآورد. در کنار افزایش دقت مدلها، چارچوب پیشنهادی، به دلیل بهکارگیری الگوریتمهای SHAPو LIME، قابلیت بیشتری در تفسیرپذیری و تحلیل «نوع اثر ویژگیها» داشته و امکان ارائه توضیحات مؤثر به کاربران سیستم را فراهم میآورد.
واژههای کلیدی: کشف تقلب، یادگیری ماشین، انتخاب ویژگیها، یادگیری گروهی، تفسیرپذیری، دادهکاوی
مکان: دانشکده مهندسی کامپیوتر، طبقه سوم ،اتاق دفاع
|