مجتبی نجفی-10/12/90

 | تاریخ ارسال: 1390/12/6 | 

AWT IMAGE

آقای مجتبی نجفی دانشجوی کارشناسی ارشد جناب آقای دکتر محمدرضا کنگاوری روزچهارشنبه 10/12/90 ساعت 10 صبح در اتاق دفاعیه واقع در طبقه سوم دانشکده کامپیوتر از پروژه کارشناسی ارشد خود تحت عنوان یادگیری درخت تصمیم از داده های جریانی زمانی دفاع خواهند نمود.

 

  چکیده پایان نامه:

  یادگیری داده­های جریانی یکی از چالش­های یادگیری ماشین در سال­های اخیر بوده­است. داده­های جریانی به انواع داده­هایی اطلاق می­شود که به طور نامحدود تولید می­شوند، قابل ذخیره سازی نیستند و همچنین با تغییر مفهوم مواجه هستند. با توسعه روش­های یادگیری از داده­های جریانی با نیاز­های جدیدی از این نوع داده­ها مواجه می­شویم که با واقعیت این نوع داده­ها بیشتر منطبق است. یکی از این نیاز­ها بحث زمان در داده­های جریانی است. در این پایان نامه به زمان به صورت ویژگی­های زمانی نگریسته شده­است همچنین، ویژگی­های داده­های جریانی به دو صورت ویژگی­های زمانی و غیرزمانی تقسیم­بندی شده­اند. این رویکرد نسبت به ویژگی­های داده­های جریانی باعث می­شود تا بتوانیم با استفاده از تخمین تابع چگالی احتمال بر روی پنجره­ای از داده­ها و ذخیره سازی این تخمین به عنوان یک رویداد در مجموعه­ی ویژگی­های داده، مجموعه­ی داده­ای غنی­تری را تولید کنیم. با استفاده از مفهوم رویداد­های زمانی و همچنین با قرار گرفتن این ویژگی­ جدید در سطوح اولیه درخت تصمیم به نحوی داده­ها دسته­بندی می­شوند که افزایش دقت رده بندی را به همراه دارند.

  به منظور ارزیابی مدل پیشنهادی یادگیری درخت تصمیم از داده­های جریانی زمانی، از یک پایگاه داده حاوی اطلاعات هوا شناسی استفاده گردیده است. در ارزیابی­های صورت گرفته مدل پیشنهادی با مدل رایج رده بندی درخت تصمیم در داده­های جریانی مقایسه شده است. علاوه بر دقت رده بندی اثر اغتشاش نیز در مدل پیشنهادی بررسی شده­است.

  بررسی نتایج حاصل از ارزیابی نشان دهنده افزایش دقت رده بندی با استفاه از مدل پیشنهادی است. اما مدل پیشنهادی در مواجه با اغتشاش با افت دقت مواجه می­شود.

 

  واژه‌های کلیدی: داده­های جریانی زمانی، درخت تصمیم، تخمین تابع چگالی احتمال، ویژگی­های زمانی، رویداد­های زمانی

 

 

  Abstract:

 

  Learning of data stream is a challenge of recent years. Data stream is a type of data which generated continuously, without saving possibility and with concept drift. Developing process of learning data stream emerges new requirements. One of these requirements is the time in data stream. In this thesis time is investigated as a temporal feature. Features of data stream are divided into two groups of temporal and non-temporal features. This approach is caused enriched dataset using temporal event concept as a new feature. To obtain temporal feature the probability density estimation is used. Higher classification accuracy is achieved by using temporal features in high levels of decision tree.

  Proposed model of learning decision tree from temporal data stream is evaluated by meteorological dataset. The empirical evidence reveals higher classification accuracy. In addition to classification accuracy the influence of noise is investigated.

 

 

  Keywords: Temporal data stream, decision tree, probability density estimation, temporal features, temporal events.

 

  ارائه­دهنده:

  مجتبی نجفی

  اساتید راهنما:

  دکتر محمدرضا کنگاوری

  استاد ممتحن داخلی : دکتر مرتضی آنالویی

  استاد ممتحن خارجی :دکتر باقری شورکی

  زمان : چهارشنبه 10/12/90

  ساعت 10 صبح

  مکان: دانشکده مهندسی کامپیوتر- طبقه سوم- اتاق دفاعیه

  از اساتید بزرگوار، دانشجویان گرامی و دیگر متخصصان و علاقه مندان به موضوع دفاعیه دعوت
می شود با حضور خود موجبات غنای علمی و ارتقای کیفی را فراهم سازند.

  دانشکده مهندسی کامپیوتر مدیریت تحصیلات تکمیلی


دفعات مشاهده: 4047 بار   |   دفعات چاپ: 959 بار   |   دفعات ارسال به دیگران: 51 بار   |   0 نظر