ارائه دهنده:
مهدی فروردین
استاد راهنما:
دکتر مرتضی آنالویی
هیات داوری:
دکتر محمدرضا محمدی
دکتر بهروز نصیحتکن
زمان:
۱۴۰۱/۱۱/۱۶
ساعت ۱۷:۰۰
آقای مهدی فروردین دانشجوی کارشناسی ارشد آقای دکتر مرتضی آنالویی مورخ ۱۶ بهمنماه ساعت ۱۷:۰۰ از پروژه کارشناسی ارشد خود تحت عنوان "یافتن نقش مکانیزم توجه در مبدلهای دیداری" دفاع خواهند نمود
چکیده پایان نامه:
با گسترش استفاده از الگوریتمهای یادگیری ماشین در چند دهه گذشته و همچنین افزایش قدرت محاسباتی و داشتن دادههای زیاد، موفقیت و پیشرفتهای زیادی در حوزه شبکههای عصبی عمیق و یادگیری ماشین شکل گرفته است و باعث بوجود آمدن نتایج خیرهکنندهای در حل مشکلات مختلف شده است. همین امر از مهمترین دلایل استفاده از این روشها برای حل مسائل و چالشهای موجود در بسیاری از حوزهها است.
از سوی دیگر رشد روزافزون و پیشرفتهای موجود باعث بوجود آمدن نگرانیهای بین محققان و پژوهشگران شده است. جعبه سیاه بودن شبکههای عصبی یکی از اصلیترین دلایل این نگرانیهاست. در حوزههایی مانند پزشکی، ماشینهای خودران و یا هر حوزهای که تصمیمات اتخاذ شده توسط سیستم دارای عواقب زیادی است و تصمیم اشتباه در آن حوزهها میتواند به صدمات جبرانناپذیری منجر میشود، نمیتوان به راحتی به سیستمی که از چرایی و چگونگی تصمیمگیری آن اطلاعی نداریم، اطمینان کنیم. همین امر باعث بوجود آمدن زمینهای در پژوهش شده است که محققان در آن به بررسی مدلهای مختلف و تفسیر کردن آنها میپردازند.
امروزه کارهای زیادی برای تفسیرپذیری مدلهای گوناگون در زمینههای مختلف انجام شده است. در این کار برای پاسخ دادن به چند سوال راجع به مدل ViT یک سری آزمایش طراحی شده است. برای انجام این آزمایشها ابتدا یک محموعه داده مناسب ایجاد شده است. در قسمت اول تلاش میکنیم با استفاده از تست فرضیه و تست آماری روی امتیازهای توجه بدست آمده از مجموعه دادگان ایچاد شده، پاسخی برای این پرسش بیابیم که آیا مدل قادر به تشخیص جابجایی بخشهایی از تصویر میشود یا خیر. بدین صورت که ابتدا بخشهایی از هر تصویر در ۴ حالت مختلف ۱) انتخاب هر دو بخش به صورت تصادفی ۲) انتخاب هر دو بخش با بالاترین امتیاز ۳) انتخاب هر دو بخش با پایینترین امتیاز ۴) انتخاب دو بخش با بالاترین و پایینترین امتیاز، جابجا میشوند سپس با استفاده از تست فرضیه روی دادههای جمعآوری شده از امتیاز توجه به دست آمده از تصاویر دستکاری شده و تصاویر اصلی، و مقایسه مقادیر به دست آمده با آلفا که در این کار برابر با پنچ صدم در نظر گرفته شده است، نشان میدهیم که مدل میتواند جابجایی بخشهای مختلف تصویر را در اکثر موارد ردیابی کند. در قسمت بعد یه بررسی تاثیر جابجایی بخشهایی از تصویر در ردهبنده نهایی مدل اشاره میکنیم، این قسمت با انتخاب سایزهای مختلف برای انتخاب بخشهایی از تصویر و جابجایی آنها انحام میشود، سایزهای مختلف انتخاب شده در این قسمت شامل ۱۱ سایز مختلف است که اعداد بخشپذیر به ۲۲۴ را در نظر گرفتهایم، در این قسمت نشان میبینیم که با بالاتر رفتن سایز بخشهای جابهحا شده، مقدار اشتباه نیز بالاتر میرود. در قسمت آخر با افزودن نویزهای نمک، فلفل، نمک و فلفل، گوسی، پواسون و نویز لکهای به تصویر در ۶ سایز مختلف با ۳ نحوه انتخاب متفاوت بخشهایی از تصویر، به ردهبندیهای انجام شده توسط مدل اشارهمیشود و مقاوم بودن مدل در برابر این نویزها بررسی میشود. و نشان میدهیم که مدل در برابر نویز لکهای مقاوم نیست و میتوان با افزودن این نویز دل را به اشتباه انداخت .
مکان: دانشکده مهندسی کامپیوتر، طبقه سوم ،اتاق دفاع
|