دانشگاه علم و صنعت ایران - دانشکده مهندسی کامپیوتر

دانشکده مهندسی کامپیوتر- دفاعیه ارشد

مهدی فروردین

حذف تصاویر و رنگ‌ها | تاریخ ارسال: 1401/11/16 |

ارائه دهنده:
مهدی فروردین

استاد راهنما:
دکتر مرتضی آنالویی

هیات داوری:
دکتر محمدرضا محمدی
دکتر بهروز نصیحت‌کن

زمان:
۱۴۰۱/۱۱/۱۶

ساعت ۱۷:۰۰

آقای مهدی فروردین دانشجوی کارشناسی ارشد آقای دکتر مرتضی آنالویی مورخ ۱۶ بهمنماه ساعت ۱۷:۰۰ از پروژه کارشناسی ارشد خود تحت عنوان "یافتن نقش مکانیزم توجه در مبدل‌های دیداری" دفاع خواهند نمود

چکیده پایان نامه:
با گسترش استفاده از الگوریتم‌های یادگیری ماشین در چند دهه گذشته و همچنین افزایش قدرت محاسباتی و داشتن داده‌های زیاد، موفقیت و پیشرفت‌های زیادی در حوزه شبکه‌های عصبی عمیق و یادگیری ماشین شکل گرفته است و باعث بوجود آمدن نتایج خیره‌کننده‌ای در حل مشکلات مختلف شده است. همین امر از مهمترین دلایل استفاده از این روش‌ها برای حل مسائل و چالش‌های موجود در بسیاری از حوزه‌ها است.

از سوی دیگر رشد روز‌افزون و پیشرفت‌های موجود باعث بوجود آمدن نگرانی‌های بین محققان و پژوهشگران شده است. جعبه سیاه بودن شبکه‌های عصبی یکی از اصلی‌ترین دلایل این نگرانی‌هاست. در حوزه‌هایی مانند پزشکی، ماشین‌های خودران و یا هر حوزه‌ای که تصمیمات اتخاذ شده توسط سیستم دارای عواقب زیادی است و تصمیم اشتباه در آن حوزه‌ها می‌تواند به صدمات جبران‌ناپذیری منجر می‌شود، نمی‌توان به راحتی به سیستمی که از چرایی و چگونگی تصمیم‌گیری آن اطلاعی نداریم، اطمینان کنیم. همین امر باعث بوجود آمدن زمینه‌ای در پژوهش شده است که محققان در آن به بررسی مدل‌های مختلف و تفسیر کردن آن‌ها می‌پردازند.

امروزه کارهای زیادی برای تفسیرپذیری مدل‌های گوناگون در زمینه‌های مختلف انجام شده است. در این کار برای پاسخ دادن به چند سوال راجع به مدل ViT یک سری آزمایش طراحی شده است. برای انجام این آزمایش‌ها ابتدا یک محموعه داده مناسب ایجاد شده است. در قسمت اول تلاش می‌کنیم با استفاده از تست فرضیه و تست آماری روی امتیاز‌های توجه بدست آمده از مجموعه دادگان ایچاد شده، پاسخی برای این پرسش بیابیم که آیا مدل قادر به تشخیص جا‌بجایی بخش‌هایی از تصویر می‌شود یا خیر. بدین صورت که ابتدا بخش‌هایی از هر تصویر در ۴ حالت مختلف ۱) انتخاب هر دو بخش به صورت تصادفی ۲) انتخاب هر دو بخش با بالاترین امتیاز ۳) انتخاب هر دو بخش با پایین‌ترین امتیاز ۴) انتخاب دو بخش با بالاترین و پایین‌ترین امتیاز، جا‌بجا می‌شوند سپس با استفاده از تست فرضیه روی داده‌های جمع‌آوری شده از امتیاز توجه به دست آمده از تصاویر دستکاری شده و تصاویر اصلی، و مقایسه مقادیر به دست آمده با آلفا که در این کار برابر با پنچ صدم در نظر گرفته شده است، نشان می‌دهیم که مدل می‌تواند جا‌بجا‌یی بخش‌های مختلف تصویر را در اکثر موارد ردیابی کند. در قسمت بعد یه بررسی تاثیر جا‌بجایی بخش‌هایی از تصویر در رده‌بنده نهایی مدل اشاره‌ می‌کنیم، این قسمت با انتخاب سایز‌های مختلف برای انتخاب بخش‌هایی از تصویر و جا‌بجایی آن‌ها انحام می‌شود، سایز‌های مختلف انتخاب شده در این قسمت شامل ۱۱ سایز مختلف است که اعداد بخش‌پذیر به ۲۲۴ را در نظر گرفته‌ایم، در این قسمت نشان می‌بینیم که با بالاتر رفتن سایز بخش‌های جا‌به‌حا شده، مقدار اشتباه نیز بالاتر می‌رود. در قسمت آخر با افزودن نویزهای نمک، فلفل، نمک و فلفل، گوسی، پواسون و نویز لکه‌ای به تصویر در ۶ سایز مختلف با ۳ نحوه انتخاب متفاوت بخش‌هایی از تصویر، به رده‌بندی‌های انجام شده توسط مدل اشاره‌می‌شود و مقاوم بودن مدل در برابر این نویز‌ها بررسی می‌شود. و نشان می‌دهیم که مدل در برابر نویز لکه‌ای مقاوم نیست و می‌توان با افزودن این نویز دل را به اشتباه انداخت  .

مکان: دانشکده مهندسی کامپیوتر، طبقه سوم ،اتاق دفاع

نشانی مطلب در وبگاه دانشکده مهندسی کامپیوتر:
http://idea.iust.ac.ir/find-14.11064.70491.fa.html
برگشت به اصل مطلب