خانم زهرا میرزامومن دانشجوی دکترای جناب آقای دکتر محمدرضا کنگاوری روز چهارشنبه مورخ 95/06/17 از رساله دکترای خود تحت عنوان "یادگیری رده بندهای پایدار برمبنای درخت تصمیم برای داده های جریانی"دفاع نمود و موفق به کسب نمره عالی گردید.
چکیده
در این رساله، مسأله ناپایداری در الگوریتمهای یادگیری درختتصمیم و علتهای آن مورد موشکافی قرارگرفتهاست و ضمن پیشنهاد یک الگوریتم انتزاعی سطح بالا برای یادگیری درختتصمیمهای پایدارتر، الگوریتمهایی با جزئیات مشخص نیز برای دو حوزه ایستا و جریانی ارائه شدهاست. از آنجا که تعریف مشخصی از پایداری در حوزهٔ جریانی وجودندارد، در این رساله به شفافسازی فضای کاری و رفعِ ابهامات در تعریف پایداری در این حوزه پرداخته شدهاست. بااینکه در منابع متعدد به ناپایداری شدیدِ الگوریتمهای یادگیری درختتصمیم در حوزهٔ ایستا اذعان شدهاست، ولی این موضوع در مورد الگوریتمهای افزایشی یادگیری درختتصمیم در حوزهٔ جریانی بررسی نشدهاست. در این رساله، بهصورت تئوری و تجربی، وجود مسألهٔ ناپایداری در الگوریتمهای افزایشی درختتصمیم تبیین شدهاست. بهبود پایداری ساختاری، بهمعنی بهحداقل رساندن میزانِ حساسیت ساختارِ درخت به نمونههای آموزشی در هر دو حوزه، مدنظرِ این رساله بودهاست.
پیشنهاد کلیدی این رساله برای بهبود پایداری ساختاری درختتصمیم، استفاده از آزمونتقسیم تجزیهپذیر بر مبنای چند ویژگی است که با هدفِ حذف رقابت بین ویژگیهای با شایستگی نزدیک بههم، محلیسازیِ تاثیر نمونهها بر آزمونتقسیم و آموزشپذیر شدنِ آن طراحی شدهباشد. در این رساله، یک الگوریتم سطحِ بالا برای ساختن درختتصمیم با چنین آزمونتقسیمهایی ارائه شدهاست و برمبنای آن، الگوریتمهایی با جزئیات مشخص در دو حوزهٔ ایستا و جریانی ارائه شدهاند که در آنها بهنحوی از شبکههای عصبی مین-مکس فازی به عنوان آزمون تقسیم استفاده شدهاست که ویژگیهای موردنظر محقق شوند. مدلهای پیشنهادی نهتنها ساختار پایدارتری را در مقایسه با درختتصمیمهای موجود فراهم میکنند، بلکه به دلیل تقسیم غیرخطی فضای ویژگی مبتنی بر چند ویژگی، اندازه و عمق کمتری نیز دارند. در حوزه جریانی، الگوریتم پیشنهادی (که دستآوردهایی در سازگارکردن شبکههای عصبی مین-مکس با تغییرمفهوم نیز داشتهاست) ضمن اینکه از تعادل مناسبی بین پایداری و انعطافپذیری برخورداراست، امتیازاتی شامل تطبیقپذیری کارآمد با تغییر مفهوم و تطبیقپذیری در صورت ظاهرشدن کلاس جدید را نیز دارد. تحلیلهای منطقی و شواهد تجربی نشان میدهند که الگوریتمهای پیشنهادی، پایداری ساختاری بالایی دارند و در عینحال از دقت و کارایی قابلتوجهی نیز برخوردارند.
:Abstract
In this thesis, we have investigated the instability issue in decision tree learning algorithms and the causes of it. Along with proposing a general abstract algorithm to induce more stable decision trees, we have also proposed detailed algorithms for both the static and the stream contexts. As there is no definition for the stability in the stream context, in this thesis, we have illustrated the working space by resolving the confusions in defining the stability in this context. Although several references have declared that there is strong instability in the decision tree learning algorithms in the static context, but this issue is not investigated for the incremental learning algorithms in the stream context. In this thesis, we have illustrated the presence of the instability issue in the incremental decision tree learning algorithms, theoretically and experimentally. To improve structural stability, i. e. to minimize the sensitivity of the decision tree structure to the training instances in both the static and the stream contexts, had been our focus in this thesis.
The key solution of this thesis for improving the structural stability of decision trees, is to use non-monolithic split tests based on multiple attributes, designed with the aim of eliminating the competition between the attributes with close merits, localizing the effect of the training instances on the split test and, making the split test trainable. In this thesis, we have proposed a high-level algorithm to induce decision trees by applying such split tests and based on it, we have proposed detailed algorithms for both the static and the stream contexts, in which fuzzy min-max neural networks are employed as the split tests, in a way that provides the desired attributes.
The proposed models, not only provide more structural stability in comparison with available decision trees, but also create smaller and shallower models, because of non-linearly splitting the feature space at the internal nodes. Theoretical analysis and experimental evidence show that the structural stability is improved in the proposed algorithms and in the meanwhile, they present comparable precision and efficiency.
ارائه دهنده:
زهرا میرزامومن
در رشته مهندسی کامپیوتر گرایش هوش مصنوعی
اساتید راهنما:
دکتر محمدرضا کنگاوری
هیات داوران:
دکتر ناصر مزینی و دکتر بهروز مینایی
اساتید مدعو:
دکتر حمید بیگی و دکتر میرمحسن پدرام
زمان :
چهارشنبه 17شهریور 1395 ساعت 10 صبح
مکان: دانشکده مهندسی کامپیوتر- طبقه دوم- اتاق دفاعیه دکتری
دانشکده مهندسی کامپیوتر مدیریت تحصیلات تکمیلی
|