[صفحه اصلی ]   [ English ]  
بخش‌های اصلی
درباره دانشکده::
مدیریت دانشکده::
اعضای هیات علمی ::
معرفی افراد::
امور آموزش::
امور پژوهشی::
آموزش الکترونیکی::
پردیس شماره 2::
اخبار و رویدادها::
فضاهای آموزشی و تحقیقاتی ::
تسهیلات پایگاه::
::
ورود به سایت دروس

AWT IMAGE

نام کاربری
کلمه عبور

AWT IMAGE
رمز ورود را فراموش کرده‌اید؟

..
دفاعیه کارشناسی ارشد

دفاعیه کارشناسی ارشد

..
جستجو در پایگاه

جستجوی پیشرفته
..
دریافت اطلاعات پایگاه
نشانی پست الکترونیک خود را برای دریافت اطلاعات و اخبار پایگاه، در کادر زیر وارد کنید.
..
:: جلسه دفاعیه دکترا- آقای امیرفرید امینیان مدرس ::
 | تاریخ ارسال: ۱۳۹۳/۳/۲۰ | 

 

 

AWT IMAGE

  آقای امیرفرید امینیان مدرس دانشجوی دکترای جناب آقای دکتر محسن سریانی روز سه‏شنبه مورخ 20/03/93 ساعت 11 صبح در دانشکده مهندسی کامپیوتر از رساله دکترای خود تحت عنوان بازشناسی و تحلیل فعالیت انسان در تصاویر ویدیویی چند دیدی دفاع خواهند نمود .

 

  چکیده پایان نامه:

  حجم عظیم داده‌های تصویری باعث شده است نیاز مبرمی به وجود سامانه‌های هوشمند خودکار جهت پردازش آنها احساس شود. بنابراین تولید چنین سامانه‌هایی که قابلیت دریافت، پردازش، تحلیل و درک تصاویر ویدیویی را داشته باشند، یکی از اصلی‌ترین چالش‌های متخصصین هوش مصنوعی و به طور خاص بینایی ماشینی است.

  تحلیل فعالیت انسان یکی از مسایل مطرح در این زمینه است که هدف آن، بازشناسی و ایجاد درک و فهم نسبت به کنشی است که انسان‌ها انجام می‌دهند. مفهوم گسترده و متنوع فعالیت و شرایط متفاوت دنباله‌های ویدیویی، باعث دشواری ذاتی مساله می‌شود. در ویدیوهای چنددیدی، به خاطر وجود داده‌های مرتبط و تکراری، این مساله پیچیده‌تر می‌شود. هر چند تحقیقات بسیاری در هر یک از بخش‌های بازشناسی و تحلیل فعالیت انساندر ویدیوهای چنددیدی، از جمله استخراج ویژگی، روش دسته‌بندی، روش ادغام اطلاعات دیدها و شیوه تحلیل انجام شده است، اما جای تحقیقی جامع و همه منظوره درباره تمامی موضوعات، خالی است.

  این رویکرد ما در این رساله بوده است. ابتدا ویژگی معنایی جدید، توصیف کننده گراف وضعیت بدن، که متمایز کننده خوبی برای فعالیت‌های انسانی است، پیشنهاد و تشریح شده است. سپس، طرح جدیدی از مدل مخفی مارکوف، به نام مدل مخفی مارکوف لایه‌ای هرمی، ابداع و معرفی گشته است که به طور ویژه برای ویدیوهای چند دیدی، به عنوان یک مساله چند حسگری، توسعه یافته است. شیوه‌های گوناگونی از بازشناسی و تحلیل فعالیت به کمک این طرح پیاده‌سازی، اجرا و آزمایش شده است و در نهایت کارآمدی این توسعه جدید در بازشناسی و تحلیل فعالیت انسان در ویدیوهای چنددیدی به اثبات رسیده است. از مجموعه‌داده‌های Sinica ، KTH و UCF Sport در بخش یک‌دیدی و MuHAVi ، IXMAS و HumanEva-I در حوزه چنددیدی استفاده شده و دقت بازشناسی چنددیدی به صورت جامع در این مجموعه داده‌ها حدود 8/93 بوده است.

  واژه‌های کلیدی: پردازش ویدیو، بینایی ماشینی، بازشناسی فعالیت انسان، تحلیل فعالیت انسان، ویدیوهای چنددیدی، استخراج ویژگی، توصیف‌کننده حرکت، مدل مخفی مارکوف.

 

  : Abstract

 

  Processing a huge amount of visual data which is the consequence of new scientific and industrial improvements in electronics and communications caused demands for automatic intelligent video processing systems. Therefore, production of such systems which receive, process, analyze and recognize the contents of video sequences is one of the main challenges of artificial intelligence and machine vision experts .

  Human behavior recognition and analysis is one of the principal issues in this context which aims to gain an understanding about what a human does and what is the meaning of his actions. Broad definition of activity or behavior and also various environmental conditions of video sequences makes this issue a multi-sided problem, especially when multiview video streams are considered. Therefore, in addition to feature extraction/selection and classification steps, as in a usual classification problem, selection of a proper recognition scenario is very essential. There are many researches about each part of human activity recognition and analysis in multiview video sequences, but a general framework does not exist .

  This is our goal in this thesis. First, a new semantic feature, BPG descriptor, which is a good discriminator for human behaviors, is introduced. Next, a new extension of hidden Markov model, PLHMM, is designed which is especially developed for using in classification of multiview video streams, a special case of a multi-sensor system. Afterwards, some analysis strategies are developed in multiview behavior video streams using this new classifier. Good performance and accurate resultshave been achieved which prove the proposed systems' applicability in multiview human behavior recognition and analysis.

 

  Keywords: video processing, machine vision, human action recognition, human behavior analysis, multiview video sequences, feature extraction, action descriptor, hidden Markov models.

 

 

 

 

  ارائه­دهنده:

  امیرفرید امینیان مدرس 

  استاد راهنما:

  دکتر محسن سریانی

  هیات داوران:

 دکتر شهره کسایی (دانشگاه صنعتی شریف)

دکتر نصرالله مقدم چرکری (دانشگاه تربیت مدرس)

دکتر حمیدرضا صادق محمدی

دکتر محمدرضا جاهد مطلق

دکتر محمود فتحی

  زمان : سه‏شنبه 20 خرداد‏ماه 1393

  ساعت 11 صبح

  مکان: دانشکده مهندسی کامپیوتر- طبقه دوم- اتاق دفاعیه

 

  دانشکده مهندسی کامپیوتر مدیریت تحصیلات تکمیلی

 

 

 

 

 

 

 

 

 

 

 

 

دفعات مشاهده: 1674 بار   |   دفعات چاپ: 363 بار   |   دفعات ارسال به دیگران: 7 بار   |   0 نظر
سایر مطالب این بخش سایر مطالب این بخش نسخه قابل چاپ نسخه قابل چاپ ارسال به دوستان ارسال به دوستان
School of Computer Engineering
Persian site map - English site map - Created in 0.179 seconds with 969 queries by yektaweb 3470