
آقای مجتبی نجفی دانشجوی کارشناسی ارشد جناب آقای دکتر محمدرضا کنگاوری روزچهارشنبه 10/12/90 ساعت 10 صبح در اتاق دفاعیه واقع در طبقه سوم دانشکده کامپیوتر از پروژه کارشناسی ارشد خود تحت عنوان یادگیری درخت تصمیم از داده های جریانی زمانی دفاع خواهند نمود.
چکیده پایان نامه:
یادگیری دادههای جریانی یکی از چالشهای یادگیری ماشین در سالهای اخیر بودهاست. دادههای جریانی به انواع دادههایی اطلاق میشود که به طور نامحدود تولید میشوند، قابل ذخیره سازی نیستند و همچنین با تغییر مفهوم مواجه هستند. با توسعه روشهای یادگیری از دادههای جریانی با نیازهای جدیدی از این نوع دادهها مواجه میشویم که با واقعیت این نوع دادهها بیشتر منطبق است. یکی از این نیازها بحث زمان در دادههای جریانی است. در این پایان نامه به زمان به صورت ویژگیهای زمانی نگریسته شدهاست همچنین، ویژگیهای دادههای جریانی به دو صورت ویژگیهای زمانی و غیرزمانی تقسیمبندی شدهاند. این رویکرد نسبت به ویژگیهای دادههای جریانی باعث میشود تا بتوانیم با استفاده از تخمین تابع چگالی احتمال بر روی پنجرهای از دادهها و ذخیره سازی این تخمین به عنوان یک رویداد در مجموعهی ویژگیهای داده، مجموعهی دادهای غنیتری را تولید کنیم. با استفاده از مفهوم رویدادهای زمانی و همچنین با قرار گرفتن این ویژگی جدید در سطوح اولیه درخت تصمیم به نحوی دادهها دستهبندی میشوند که افزایش دقت رده بندی را به همراه دارند.
به منظور ارزیابی مدل پیشنهادی یادگیری درخت تصمیم از دادههای جریانی زمانی، از یک پایگاه داده حاوی اطلاعات هوا شناسی استفاده گردیده است. در ارزیابیهای صورت گرفته مدل پیشنهادی با مدل رایج رده بندی درخت تصمیم در دادههای جریانی مقایسه شده است. علاوه بر دقت رده بندی اثر اغتشاش نیز در مدل پیشنهادی بررسی شدهاست.
بررسی نتایج حاصل از ارزیابی نشان دهنده افزایش دقت رده بندی با استفاه از مدل پیشنهادی است. اما مدل پیشنهادی در مواجه با اغتشاش با افت دقت مواجه میشود.
واژههای کلیدی: دادههای جریانی زمانی، درخت تصمیم، تخمین تابع چگالی احتمال، ویژگیهای زمانی، رویدادهای زمانی
Abstract:
Learning of data stream is a challenge of recent years. Data stream is a type of data which generated continuously, without saving possibility and with concept drift. Developing process of learning data stream emerges new requirements. One of these requirements is the time in data stream. In this thesis time is investigated as a temporal feature. Features of data stream are divided into two groups of temporal and non-temporal features. This approach is caused enriched dataset using temporal event concept as a new feature. To obtain temporal feature the probability density estimation is used. Higher classification accuracy is achieved by using temporal features in high levels of decision tree.
Proposed model of learning decision tree from temporal data stream is evaluated by meteorological dataset. The empirical evidence reveals higher classification accuracy. In addition to classification accuracy the influence of noise is investigated.
Keywords: Temporal data stream, decision tree, probability density estimation, temporal features, temporal events.
ارائهدهنده:
مجتبی نجفی
اساتید راهنما:
دکتر محمدرضا کنگاوری
استاد ممتحن داخلی : دکتر مرتضی آنالویی
استاد ممتحن خارجی :دکتر باقری شورکی
زمان : چهارشنبه 10/12/90
ساعت 10 صبح
مکان: دانشکده مهندسی کامپیوتر- طبقه سوم- اتاق دفاعیه
از اساتید بزرگوار، دانشجویان گرامی و دیگر متخصصان و علاقه مندان به موضوع دفاعیه دعوت
می شود با حضور خود موجبات غنای علمی و ارتقای کیفی را فراهم سازند.
دانشکده مهندسی کامپیوتر مدیریت تحصیلات تکمیلی