آقای محمدامین مهرعلیان دانشجوی دکترای آقای دکتر محسن سریانی روز دوشنبه مورخ ۱۴۰۰/۰۱/۳۰ از رساله دکتری خود با عنوان "بهبود تخمین مکان و زاویه دید دوربین متحرک در فضای بسته" دفاع خواهند نمود |
ارائه دهنده:
محمدامین مهرعلیان
استاد راهنما:
دکترمحسن سریانی
هیات داوران:
دکتر شهره کسایی، دکتر رضا صفابخش، دکتر بهروز نصیحتکن، دکتر محمدرضا جاهد مطلق، دکتر ناصر مزینی
زمان : ۳۰ فروردین ماه ۱۴۰۰
ساعت ۱۰:۳۰
محل برگزاری: به صورت مجازی
چکیده پایان نامه :
تخمین مکان و زاویه دید دوربین در دنباله تصاویر یکی از مسائل پر چالش در حوزه بینایی ماشین به خصوص بینایی ماشین سهبعدی است که برای کاربردهای متعددی از جمله ناوبری ربات و واقعیت افزوده استفاده میشود. برای این منظور ابتدا به کمک تناظر نقاط کلیدی در چند تصویر، تخمینی از مدل سهبعدی صحنه محاسبه میشود، سپس به کمک تناظر میان نقاط دوبعدی در تصویر و نقاط سهبعدی صحنه، مکان و زاویه دید دوربین محاسبه میگردد. در این رساله تلاش شده است رویکردی جدید در زمینه تخمین مکان و زاویه دید دوربین در دنباله تصاویر دوربینهای تک دید ارائه شود. اساس رویکرد پیشنهادی بر مبنای استفاده از سابقه حرکت دوربین برای تخمین وضعیت آن است. در این روش حرکت دوربین بوسیله یک فیلتر کالمن توسعه یافته مدل شده و در هر مرحله تخمینی از وضعیت جدید آن محاسبه میشود (مرحله پیشبینی). سپس بر اساس مشاهدات، مقدار دقیقتری از این تخمین محاسبه میگردد (مرحله تصحیح). استفاده از فیلتر کالمن این امکان را فراهم میکند که به کمک یک چارچوب احتمالاتی، عدم قطعیت در ورودی الگوریتم (نقاط سهبعدی) و مشاهدات (نقاط دوبعدی)، در محاسبات لحاظ شود. این موضوع باعث افزایش مقاومت روش پیشنهادی خواهد شد تا جایی که در یک دنباله طولانی بدون اتکا به روشهای تنظیم دستهای، با دقت قابل قبولی قادر به تخمین ضرایب خارجی دوربین خواهد بود. آزمایشات انجام گرفته با استفاده از دادگان مصنوعی و دادگان حقیقی نشان میدهد روش پیشنهادی از جنبه دقت و مقاومت در برابر خطا، نسبت به آخرین روشهای موجود در این زمینه برتری دارد و این در حالی است که سرعت اجرای آن نیز از مرتبه زمانی O(n) بوده و همتراز و گاها پایینتر از سایر روشها است.
واژههای کلیدی: تخمین وضعیت دوربین، بینایی ماشین سهبعدی، استخراج ساختار از حرکت، فیلتر کالمن، هندسه اپیپلار
Abstract
Camera trajectory estimation using image sequence is a very challenging task in computer vision, especially ۳D computer vision, which is used for many applications such as robot navigation and augmented reality. In this thesis, we proposed a new method to estimate camera pose through a sequence of images using ۲D image key-points and its correspondence in ۳D space. In the proposed approach, camera motion is modeled with an extended Kalman filter (EKF) which estimates the camera pose in each time step (Prediction step). Then, based on ۳D-۲D correspondence points as observations, it is corrected to more accurate estimation by minimizing the reprojection error of the reference points (Correction step). The use of the Kalman filter makes it possible to take into account the uncertainty of inputs (۳D points) and observations (۲D points) in the pose estimation process. This will increase the robustness of the proposed method when employed in a long sequence without relying on bundle adjustment. It also provides the covariance of the pose parameters which helps to measure the reliability of the estimated parameters. Experimental results, using both synthetic and real data, demonstrate that the proposed method improves the accuracy and the robustness of the camera pose estimation, in the presence of tracking errors and feature matching outliers, compared to the state-of-the-art, while keeping execution time in O(n) which is the same or even better than those of other methods.
Keywords: camera pose estimation, ۳D Computer Vision, Structure from motion, Kalman Filter, Epipolar geometry
محل برگزاری: به صورت مجازی
دانشکده مهندسی کامپیوتر مدیریت تحصیلات تکمیلی
|