آقای سیدعلی حسینی دانشجوی دکترای جناب آقای دکتر پیمان کبیری روز یکشنبه مورخ 1398/06/24 ساعت 11:30 از رساله دکتری خود تحت عنوان "تخمین موقعیت دوربین در دنبالهای از تصاویر تکدیدی" دفاع خواهند نمود.
ارائه دهنده:
سیدعلی حسینی
استاد راهنما:
پیمان کبیری
هیات داوران:
دکتر محمدرضا جاهدمطلق- دکتر محسن سریانی – دکتر محمود فتحی
دکتر شهره کسایی – دکتر نصرالله مقدم
زمان : یکشنبه 24 اردیبهشت ماه 1398
ساعت 11:30
مکان: دانشکده مهندسی کامپیوتر- طبقه دوم- اتاق دفاعیه دکترا
چکیده پایان نامه :
چکیده
دنبال نمودن مسیر حرکت دوربین و یا تخمین متغیرهای بیرونی دوربین بهکمک دنبالهای از تصاویر، دارای کاربردهای گوناگونی است. از میان این کاربردها میتوان به ناوبری ربات و تعیین محل آن در حوزه رباتیک، محاسبه ساختار سهبعدی صحنه به کمک متغیرهای حرکت دوربین و واقعیت افزوده در حوزه بینایی ماشین و همچنین تهیه مدلهای ارتفاعی رقومی بهکمک تصاویر هوایی در حوزه فتوگرامتری اشاره نمود. در این پایاننامه یک راهکار برپایه ویژگی برای دنبال نمودن مسیر حرکت دوربین برای دنبالهای از تصاویر تکدیدی ارائه میشود. تصاویر بکار گرفته شده، در فضای داخل ساختمان و با بیشینه عمق پنج تا شش متر تهیه شدهاند. بخشهای صحنه نیز ثابت و بدون حرکت فرض شدهاند. در راهکار پیشنهادی نخست بهکمک چند تصویر واسنجیده شده فرآیند موقعیتیابی و ساختن نقشه اولیه شروع میشود. این موضوع باعث میشود که نقشه ساخته شده و پارامترهای موقعیت دوربین با چالش ابهامِ مقیاس روبرو نباشند. به عبارت دیگر مقادیر تخمینی برای موقعیت دوربین و ساختار صحنه دارای اندازه متریک هستند. تخمین پارامترهای بیرونی دوربین برپایه دانشی است که ردیابی نقاط ویژگی در تصاویر پشتسرهم فراهم میکند. همچنین سرعت حرکت دوربین نیز به گونهای است که ماتی تصاویر در بیشتر فریمها برای ردیابی نقاط ویژگی چالش بزرگی نیست. روال ردیابی نقاط ویژگی در تصاویر پیدرپی با بکارگیری یک روش هرمی برپایه شیوه جریان نوری لوکاس-کاناده انجام میشود. با بهرهگیری از تناظرهای بدست آمده و همچنین ساختار کنونی نقشه، پارامترهای حرکت دوربین در چارچوب یک فیلتر ذرهای تخمین زده میشود. برای ارزیابی روش پیشنهاد شده دو دسته داده بکار گرفته شدهاند. دسته اول ویدیوهایی است که با بهرهگیری از یک دوربین معمولی از پیرامون یک میز کامپیوتر در فضای داخل آزمایشگاه تهیه شدهاند و دسته دوم ویدیوهای RGBD تولید شده از سوی دانشگاه صنعتی مونیخ هستند. دوربینِ بکار گرفته شده در هر دو دسته داده بالا، واسنجیده فرض شده است. نتایج آزمایشها نشان میدهند که درالگوریتم پیشنهادی مسیر حرکت دوربین با دقت خوبی دنبال شده است و میتواند بدون گم کردن مسیر، نقشهِ نخستین را به نواحی بیرون از محدوده دید اولیه دوربین گسترش دهد. هر چند که مسیر طولانی است، بطور میانگین خطای جابجایی دوربین حدود 5 سانتیمتر و خطای دوران دوربین نیز حدود 6 درجه است.
واژههای کلیدی
ردیابی دوربین، تناظریابی ویژگیها، استخراج ویژگیها، موقعیتیابی و نقشهسازی همزمان برپایه بینایی، فیلتر ذرهای.
Abstract:
Abstract
Camera tracking or estimation of camera extrinsic parameters finds extensive applications. Robot navigation and localization in robotics, 3D reconstruction using camera motion parameters and augmented reality in computer vision and construction of digital elevation models using aerial image in photogrammetry are instances of camera tracking applications. In this thesis, a filtering-based camera tracking approach for sequences of monocular images is presented. Video sequences are captured in indoor environment with maximum depth of 5 to 6 meters. Furthermore, objects observed in the scene have no motion. In the proposed approach, camera localization and mapping is initialized using a few calibrated images. This, enables the system to construct a map without scale ambiguity, contrary to most visual simultaneous localization and mapping (visual SLAM) algorithms. In other words, estimated camera pose and scene structure have metric values. Proposed algorithm is classified as a feature-based approach. Estimation of camera extrinsic parameters is carried out based on the knowledge provided by feature tracking along successive images. Additionally, speed of the camera is in a way that the amount of created blurriness in video frames does not get the feature-tracking routine into trouble. For consecutive video frames, extracted features are tracked using a pyramidal method on the basis of Lucas-Kanade optical flow approach and the camera pose parameters is estimated using a particle filter framework. To evaluate Performance of the proposed algorithm, two sets of video sequences were used. The first groups of sequences are prepared around a computer desk in the laboratory using a simple camera with VGA resolution. To provide camera ground-truth pose, a chessboard with known cell size is employed. The second set includes four indoor sequences selected from RGB-D benchmark of computer vision goup of Technical University of Munich (TUM). For both of the test set sequences camera internal parameters are calculated in advance. The experimental results show that the proposed approach istracking the camera trajectory with high accuracy. Besides, with relatively smooth motion of camera, the algorithm is capable of extending the currently constructed map to regions that were initially out of the camera’s field of view without losing the correct path.
Keywords:
Camera tracking, feature matching, feature extraction, visual SLAM, particle filter.
دانشکده مهندسی کامپیوتر مدیریت تحصیلات تکمیلی
از اساتید بزرگوار، دانشجویان گرامی و دیگر متخصصان و علاقه مندان به موضوع دفاعیه دعوت
می شود با حضور خود موجبات غنای علمی و ارتقای کیفی را فراهم سازند.
|