
آقای محمد قلمبر دزفولی دانشجوی دکترای جناب آقای دکتر مصطفی حق جو روز سه شنبه مورخ 03/10/92 ساعت 13 در اتاق دفاعیه واقع در طبقه دوم دانشکده مهندسی کامپیوتر از رساله دکترای خود تحت عنوان مدیریت جریان داده های احتمالی با قابلیت کاهش بار دفاع خواهند نمود . چکیده پایان نامه: نیاز به اجرای پرس وجوی پیوسته روی جریان دادههای احتمالاتی، سیستم پردازش داده جدیدی را طلب میکند که برای پردازش توأم دادههای جریانی و احتمالاتی طراحی شده باشد. مهمترین خاستگاه چنین سیستمی،نظارت پیوسته و بلادرنگ بر دنیای غیرقطعیواقعیاست. هدف اول در این رساله، طراحی و تولید یکسیستم مدیریت جریاندادهی احتمالاتی [1] ( PDSMS ) جدید است. برای این منظور، پس از بررسی دقیق نیازمندیها و سیستمهای مشابه، مدل داده، مدل پرسوجو و مدل معنایی جدیدی ارائه شده و نمونه آزمایشگاهی چنین سیستمی پیادهسازی و مورد ارزیابی قرار گرفته است. هدف دوم در این رساله، ایجاد رویکردی مناسب برای کاهش بار در PDSMS است. در تولید یک PDSMS ، چالشهای فراوانی وجود دارد که از مهمترین و ضروریترین این چالشها بهرهمندی از یک ابزار کاهش بار است. کاهندهی بار امکان آزادکردن اضطراری منابع سیستم را در مواردی که بار پردازشیبیش از ظرفیت سیستم باشد، فراهم میآورد. این کار باید طوری انجام شود که حداقل افت کیفیت در خروجی ایجاد گردد و صحت جوابها نیز تأمین شود. به دلیل ساختار پیچیدهدادهها و عملیات در PDSMS و ماهیت بلادرنگ آن، طراحی یک سیستم کاهش بار مؤثر و قابل قبول دشوار میباشد. در این رساله روشی جدید با نام کاهش بار فدرالی ارائه کردهایم که تمام توقعات موجود را به خوبی برآورده میسازد. روش کاهش بار فدرالی پیشنهادی، کاهش بار را به صورت توزیع شده، تخصصی و در سطح عملگرهای پرسوجو انجام میدهد. مهمترین امتیاز روش جدید، کاهش بار کاراو تولید جوابهای با کیفیت ضمانت شده است. واژههای کلیدی: کاهش بار، سیستم مدیریت جریان داده احتمالاتی، مدل معنایی احتمالاتی
[1] Probabilistic Data Stream Management System Abstract: Many emerging applications need continuous querying over uncertain event streams, mostly for online monitoring. These streaming uncertain events may come from radars, sensors, or even software hooks. The uncertainty is usually due to measurement errors, inherent ambiguities and privacy preserving reasons. To cover new requirements, we have designed and implemented a new system called Probabilistic Data Stream Management System (PDSMS). Our first contribution is developing a new system to continuously run monitoring queries on probabilistic data streams with a satisfactory fast speed, while being faithful to correlations and uncertainty aspects of data. We designed a new data model, semantics, cost model, and service level aggrement for probabilistic data streams. Our new semantics is the first semantics for PDSMS which supports continuous probability distributions. We also presented new query model to implement threshold SPJ queries. In addition and most importantly, we have built a java-based prototype, called Xtream. Xtream supports uncertainty from input data streams to final query results. Unlike probabilistic databases, the data-driven design of Xtream makes it possible to continuously query high-volumes of bursty probabilistic data streams. Our experiments demonstrate how Xtream outperforms a probabilistic database management system w.r.t. efficiency metrics such as response time as well as accuracy. These are critical metricsfor a PDSMS. One of the most important challenges toward designing a robust PDSMS is dealing with overloads. PDSMS is inherently a realtime system which should deal with overloads. Overloads occur due to bursty, unpredictable input streams. Probabilistic data and queries, in addition to required gurantees on final results, make this problem a real challenge for PDSMSs. Our second contribution is developing the first load shedding mechanism for PDSMS. We call it Federational Load Shedding (FLS). Unlike other load shedding mechanisms, FLS is able to precisely show the effect of load shedding on final results. In fact, it uses a tolerating but valid guarantee. As a result, even after a load shedding, user knows exactly which part of the result is lost. Nevertheless, he receives the most valuable part of the result. FLS achieves this goal by distributing load shedding among query operators. Operator-based load shedding makes it possible to have a wiseful process and prepare new guarantees. FLS is also more efficient than other possible alternatives. It can increase the utility of query results by a factor of two at least. In addition, it brings real robustness to our PDSMS. Thus, even high bursty input streams cannot cause a system crash. Keywords: PDSMS, Probabilistic Data Stream, WD-PWS, Load Shedding ارائهدهنده: محمد قلمبر دزفولی MGhalambor@iust.ac.ir استاد راهنما: دکتر مصطفی حق جو هیات داوران: دکتر رسول جلیلی- دکتر احمد عبداله زاده-دکتر محسن شریفی دکتر بهروز مینایی- دکتر محمد عبدالهی زمان : سه شنبه 3 دیماه 1392 ساعت 13 مکان: دانشکده مهندسی کامپیوتر- طبقه دوم- اتاق دفاعیه از اساتید بزرگوار، دانشجویان گرامی و دیگر متخصصان و علاقه مندان به موضوع دفاعیه دعوت می شود با حضور خود موجبات غنای علمی و ارتقای کیفی را فراهم سازند. دانشکده مهندسی کامپیوتر مدیریت تحصیلات تکمیلی |