[صفحه اصلی ]   [ English ]  
بخش‌های اصلی
درباره دانشکده::
مدیریت دانشکده::
اعضای هیات علمی ::
معرفی افراد::
امور آموزش::
امور پژوهشی::
آموزش الکترونیکی::
پردیس شماره 2::
اخبار و رویدادها::
فضاهای آموزشی و تحقیقاتی ::
تسهیلات پایگاه::
::
ورود به سایت دروس

AWT IMAGE

نام کاربری
کلمه عبور

AWT IMAGE
رمز ورود را فراموش کرده‌اید؟

..
دفاعیه کارشناسی ارشد

دفاعیه کارشناسی ارشد

..
جستجو در پایگاه

جستجوی پیشرفته
..
دریافت اطلاعات پایگاه
نشانی پست الکترونیک خود را برای دریافت اطلاعات و اخبار پایگاه، در کادر زیر وارد کنید.
..
:: علی ابوالفضل یزدانی پرانی ::
 | تاریخ ارسال: ۱۳۹۴/۳/۱۹ | 

 

 

AWT IMAGE

 

 آقای ابوالفضل یزدانی پرانی  دانشجوی کارشناسی ارشد جناب آقای دکتر ناصر مزینی و جناب آقای دکتر احمد اکبری روز سه شنبه 94/3/19ساعت 14:00در اتاق سمینار واقع در طبقه سوم دانشکده کامپیوتر از پروژه کارشناسی ارشد خود تحت عنوان بهبود عملکرد یادگیری تقویتی در شبیه ساز دو بعدی ربات های فوتبالیست خواهند نمود.

 

 

 

 

 

 

 

 

 

  

چکیده

 

 الگوریتم‌های یادگیری تقویتی به‌طور موفقیت‌آمیز در چندین بخش حوزه فوتبال شبیه‌ساز روبوکاپ اعمال شده است. یکی از آن حوزه‌ها بازی Keepaway در ربات‌های فوتبالیست شبیه‌ساز دو‌بعدی هست. فوتبال ربات‌ها یکی از سیستم‌های چندعاملی بسیار پیچیده است که در آن عامل‌ها نقش بازیکنان فوتبال را ایفا می‌کنند و با استفاده از الگوریتم‌های مختلف، عمل یادگیری توسط بازیکنان انجام می‌پذیرد. این سیستم دارای محیطی با ویژگی‌های نویزی، غیرقطعی، نیمه مشاهده‌پذیر، بلادرنگ و با ابعاد بالا هست. یادگیری تقویتی دارای مشکل مقیاس‌پذیری در محیط‌های با ابعاد بالا هست. به‌عبارت‌دیگر برای عامل یادگیری تقویتی مسئله نحسی ابعاد (معضل ابعاد بالا) وجود دارد. هدف از این بازی نگه‌داشتن هرچه بیشتر توپ توسط بازیکنان Keeper در محدوده زمین‌بازی هست. در این پایان‌نامه برای کاهش ابعاد روش Tile coding بکار برده شده و برای یادگیری عامل‌ها از الگوریتم Q-SARSA در بازی Keepaway ربات‌های فوتبالیست استفاده شده است. سپس به مقایسه این الگوریتم با سه روش پایه و الگوریتم یادگیری SARSA پرداخته و نتایج کسب‌شده را گزارش کردیم. با استفاده از الگوریتم  یادگیریQ-SARSA مدت‌زمان نگه‌داشتن توپ توسط عامل‌های Keeper در مقایسه با روش‌ نگه‌داشتن 2.5 برابر ، روش تصادفی 2.1 برابر ، روش کدگذاری دستی 1.6برابر و روش SARSA حدوداً 1.4 برابر بهبود داشتیم.

 

واژه‌های کلیدی: یادگیری تقویتی، ربات‌های شبیه‌ساز دوبعدی، keepaway، Q-SARSA، Tile Coding

 

 

 

 

 

Abstract:

 

 Reinforcement learning algorithms have been applied successfully in several areas of RoboCup soccer simulator. One of those areas is two-dimensional game Keepaway in robot soccer simulator. Robot soccer is a very complex multiagent systems in which agents play the role of football players. This system has the features of environmental noise, non-deterministic, semi-observable, real-time and with high dimensions. Reinforcement learning is problem scalability in high-dimensional environments. The aim of the game is to keep more of the ball by the players Keeper in scope of environment. In this project to reduce the size of environment, Tile coding method used and learn Q-SARSA learning algorithms used in the game of soccer robots Keepaway. Then compare this method with three basic approaches and SARSA algorithm and the results obtained were reported.

 

 Using a learning algorithm Q-SARSA the period to keep the ball by operating Keeper in comparison to hold 2.5 times, randomly 2.1 times, hand-coding 1.6 times and SARSA about 1.4 times had improved.

 

Keywords: Reinforcement Learning, Keepaway, 2D Robot Simulation, Q-SARSA, Tile Coding

 

 

 

 

 

ابوالفضل یزدانی پرانی

    رشته مهندسی کامپیوتر -هوش مصنوعی

  استاد راهنما:

  دکتر ناصر مزینی،دکتر احمد اکبری

  استاد داور داخلی:دکتر محمد رضا کنگاوری

  استاد داور خارجی : دکتر میر محسن پدرام

  تاریخ دفاع :سه شنبه 19خرداد  ماه 94

  زمان:ساعت 14:00

 

  مکان: دانشکده مهندسی کامپیوتر- طبقه سوم- اتاق سمینار

 از اساتید بزرگوار، دانشجویان گرامی و دیگر متخصصان و علاقه مندان به موضوع دفاعیه دعوت
می شود با حضور خود موجبات غنای علمی و ارتقای کیفی را فراهم سازند.

 

  دانشکده مهندسی کامپیوتر مدیریت تحصیلات تکمیلی

 

 

 

 

 

دفعات مشاهده: 2012 بار   |   دفعات چاپ: 353 بار   |   دفعات ارسال به دیگران: 0 بار   |   0 نظر
سایر مطالب این بخش سایر مطالب این بخش نسخه قابل چاپ نسخه قابل چاپ ارسال به دوستان ارسال به دوستان
School of Computer Engineering
Persian site map - English site map - Created in 0.133 seconds with 969 queries by yektaweb 3470