| خانم محبوبه ریاحی مدوار دانشجوی دکترای آقای دکتر احمد اکبری روز یکشنبه مورخ ۱۴۰۰/۱۲/۰۸ ساعت ۱۴:۰۰ از رساله دکتری خود با عنوان "تشخیص نمونههای پرت در دادههای با ابعاد بالا با استفاده از زیرفضاهای داده و ویژگی "دفاع خواهند نمود |
ارائه دهنده:
محبوبه ریاحی مدوار
استاد راهنما:
دکتر احمد اکبری
استاد مشاور:
دکتر بیژن راحمی- دکتر بابک ناصرشریف
هیات داوران:
دکتر محمدرضا جاهدمطلق؛ دکتر محمدرضا محمدی؛
دکتر بابک نجاراعرابی؛ دکتر مریم امیرحائری
زمان : ۰۸ اسغند ماه ۱۴۰۰
ساعت ۱۴:۰۰
محل برگزاری: : http://meeting.iust.ac.ir/
چکیده پایان نامه :
تشخیص نمونههای پرت مسئلهای مهم در دادهکاوی است که هدفش شناسایی نمونههایی است که غیرعادی و با اکثریت دادگان ناسازگارند و دارای طیف وسیعی از کاربردهای دنیای واقعی است. چگونگی مقابله موثر با دادههای با ابعاد بالا بهدلیل طلسم بعد، هنوز یک چالش در تشخیص نمونههای پرت است. در این رساله، با استفاده از جستجوی نمونههای پرت در زیرفضاهای با ابعاد پایینتر مبتنی بر رویکردهای محلی و سراسری و همچنین، ترکیب چندین زیرفضای سراسری، راهکارهایی جدید برای مقابله با تشخیص نمونههای پرت در دادههای با ابعاد بالا پیشنهاد شده است.
ابتدا، برای مقابله با مشکلات تعداد زیادی بعد بیربط و فضای نمایی جستجو، دو روش سراسری بدوننظارت انتخاب زیرفضا مبتنی بر چگالی جهت تشخیص نمونههای پرت با استفاده از وابستگی بین ویژگیهای مختلف به چگالی دادهها و افزونگی بین ویژگیها پیشنهاد داده میشود. نتایج تجربی روی هر دو دادگانهای ساختگی و واقعی نشان میدهد که این الگوریتمهای پیشنهادی، دقت تشخیص نمونه پرت را افزایش میدهد درحالیکه پیچیدگی محاسباتی و زمان اجرا را کاهش میدهند.در ادامه، یک روش ترکیبی پیشنهاد شده که با استفاده از ترکیب امتیازهای پرت در چندین زیرفضای مبتنی بر تحلیل مولفه اساسی، قادر به تشخیص چندین نوع نمونه پرت است.
در روشی دیگر، یک الگوریتم محلی انتخاب زیرفضای مرتبط پیشنهاد میشود که در آن با بکارگیری مفهوم آنتروپی محلی و اطلاعات محلی، ویژگیهای مرتبط با هر نمونه تعیین و همچنین، یک روش امتیازدهی مبتنی بر چگالی تطبیقی بهمنظور کاهش نرخ تشخیص کاذب بهدست میآید. در ادامه، با توجه به وابستگی انتخاب محلی زیرفضا به تعریف همسایگی، یک روش تشخیص نمونههای پرت بر اساس الگوریتم هیوریستیک مبتنی بر برنامهریزی خطی پیشنهاد شده تا بهطور همزمان با مسئله طلسم بعد در انتخاب زیرفضای مرتبط و جستجوی همسایهها مقابله کند. نتایج تجربی روی دادههای ساختگی و واقعی، عملی بودن فرمولبندی مسئله انتخاب زیرفضا و همچنین کارآمد بودن این روش را نشان میدهد.
محل برگزاری: به صورت مجازی
دانشکده مهندسی کامپیوتر مدیریت تحصیلات تکمیلی