دانشکده مهندسی کامپیوتر- دفاعیه دکترا
محمدامین مهرعلیان

حذف تصاویر و رنگ‌ها  | تاریخ ارسال: 1400/1/30 | 

آقای محمدامین مهرعلیان دانشجوی دکترای آقای دکتر محسن سریانی روز دوشنبه مورخ  ۱۴۰۰/۰۱/۳۰ از رساله دکتری خود با عنوان "بهبود تخمین مکان و زاویه دید دوربین متحرک در فضای بسته" دفاع خواهند نمود

 

ارائه ­دهنده:
محمدامین مهرعلیان
  استاد راهنما:
دکترمحسن سریانی

  هیات داوران:

دکتر شهره کسایی، دکتر رضا صفابخش، دکتر بهروز نصیحت‌کن، دکتر محمدرضا جاهد مطلق، دکتر ناصر مزینی

زمان :  ۳۰ فروردین ماه ۱۴۰۰

  ساعت ۱۰:۳۰

 محل برگزاری: به صورت مجازی



چکیده پایان نامه :

تخمین مکان و زاویه دید دوربین در دنباله تصاویر یکی از مسائل پر چالش در حوزه بینایی ماشین به خصوص بینایی ماشین سه‌بعدی است که برای کاربردهای متعددی از جمله ناوبری ربات و واقعیت افزوده استفاده می‌شود. برای این منظور ابتدا به کمک تناظر نقاط کلیدی در چند تصویر، تخمینی از مدل سه‌بعدی صحنه محاسبه می‌شود، سپس به کمک تناظر میان نقاط دوبعدی در تصویر و نقاط سه‌بعدی صحنه، مکان و زاویه دید دوربین محاسبه می‌گردد. در این رساله تلاش شده است رویکردی جدید در زمینه تخمین مکان و زاویه دید دوربین در دنباله تصاویر دوربین‌های تک دید ارائه شود. اساس رویکرد پیشنهادی بر مبنای استفاده از سابقه حرکت دوربین برای تخمین وضعیت آن است. در این روش حرکت دوربین بوسیله یک فیلتر کالمن توسعه یافته مدل شده و در هر مرحله تخمینی از وضعیت جدید  آن محاسبه می‌شود (مرحله پیش‌بینی). سپس بر اساس مشاهدات، مقدار دقیق‌تری از این تخمین محاسبه می‌گردد (مرحله تصحیح). استفاده از فیلتر کالمن این امکان را فراهم می‌کند که به کمک یک چارچوب احتمالاتی، عدم قطعیت در ورودی الگوریتم (نقاط سه‌بعدی) و مشاهدات (نقاط دوبعدی)، در محاسبات لحاظ شود. این موضوع باعث افزایش مقاومت روش پیشنهادی خواهد شد تا جایی که در یک دنباله طولانی بدون اتکا به روش‌های تنظیم دسته‌ای، با دقت قابل قبولی قادر به تخمین ضرایب خارجی دوربین خواهد بود. آزمایشات انجام گرفته با استفاده از دادگان مصنوعی و دادگان حقیقی نشان می‌دهد روش پیشنهادی از جنبه دقت و مقاومت در برابر خطا، نسبت به آخرین روش‌های موجود در این زمینه برتری دارد و این در حالی است که سرعت اجرای آن نیز از مرتبه زمانی O(n) بوده و همتراز و گاها پایین‌تر از سایر روش‌ها است.
 
واژه‌های کلیدی: تخمین وضعیت دوربین، بینایی ماشین سه‌بعدی، استخراج ساختار از حرکت، فیلتر کالمن، هندسه اپیپلار

Abstract

Camera trajectory estimation using image sequence is a very challenging task in computer vision, especially ۳D computer vision, which is used for many applications such as robot navigation and augmented reality.  In this thesis, we proposed a new method to estimate camera pose through a sequence of images using ۲D image key-points and its correspondence in ۳D space. In the proposed approach, camera motion is modeled with an extended Kalman filter (EKF) which estimates the camera pose in each time step (Prediction step). Then, based on ۳D-۲D correspondence points as observations, it is corrected to more accurate estimation by minimizing the reprojection error of the reference points (Correction step). The use of the Kalman filter makes it possible to take into account the uncertainty of inputs (۳D points) and observations (۲D points) in the pose estimation process. This will increase the robustness of the proposed method when employed in a long sequence without relying on bundle adjustment. It also provides the covariance of the pose parameters which helps to measure the reliability of the estimated parameters. Experimental results, using both synthetic and real data, demonstrate that the proposed method improves the accuracy and the robustness of the camera pose estimation, in the presence of tracking errors and feature matching outliers, compared to the state-of-the-art, while keeping execution time in O(n) which is the same or even better than those of other methods.
 
Keywords: camera pose estimation, ۳D Computer Vision, Structure from motion, Kalman Filter, Epipolar geometry
 

محل برگزاری: به صورت مجازی 
دانشکده مهندسی کامپیوتر مدیریت تحصیلات تکمیلی

 

نشانی مطلب در وبگاه دانشکده مهندسی کامپیوتر:
http://idea.iust.ac.ir/find-14.11063.63185.fa.html
برگشت به اصل مطلب