آقای میثم آهنگران دانشجوی دکترای آقای دکتر محمدرضا جاهد مطلق روز چهارشنبه مورخ ۱۳۹۹/۰۹/۰۵ ساعت ۰۸:۰۰ از رساله دکتری خود تحت عنوان "اکشف زنجیرههای سببی احتمالاتی در یک فرایند تدریجی به وسیله تولید خودکار مدل گرافیکی احتمالاتی زماندار" دفاع خواهند نمود. |
ارائه دهنده:
میثم آهنگران
استاد راهنما:
دکتر محمدرضا جاهد مطلق
استاد مشاور:
دکتر بهروز مینایی بیدگلی
هیات داوران:
دکتر بابک نجار اعرابی ؛ دکتر حمید بیگی ؛ دکتر عادل رحمانی ترکمان؛ دکتر ناصر مزینی
زمان : چهارشنبه ۰۵ آذرماه ۱۳۹۹
ساعت ۰۸:۰۰
نحوه ی برگزاری: به صورت الکترونیک
چکیده پایان نامه :
کشف سببیت و بررسی روابط سببی احتمالاتی یکی از موضوعات اساسی در تحلیل پدیدههای طبیعی در دنیای واقع است. در بسیاری از پدیدههای طبیعی از جمله کاربردهای بالینی ما با مجموعه دادههای دنبالهای و زماندار سر و کار داریم که شبکه بیزی استاندارد قادر به تحلیل این گونه دادهها نیست، اما شبکه بیزی پویا که نسخه تعمیم یافته زماندار شبکه بیزی است، قادر به تحلیل روابط سببی احتمالاتی میان متغیرها در برشهای زمانی پشت سر هم است. الگوریتمهای کشف سببیت که در دادههای دنبالهای مورد استفاده قرار میگیرند صرفاً با استفاده از روشهای آماری و احتمالاتی به تحلیل سببیت میپردازند و تنها از معیارهای احتمالاتی برای ارزیابی میزان قطعیت روابط سببی استفاده مینمایند. در این رساله ما یک مدلی جدید برای تحلیل سببیت احتمالاتی در دادههای دنبالهای یک پدیدههای طبیعی ارائه نمودیم که از مفاهیم نظریه اطّلاعات برای بررسی قطعیت روابط سببی استفاده مینماید. در مدل پیشنهادی، برای کشف روابط سببی میان متغیرها، تابع توزیع احتمال شرطی تمام زوج متغیرها براساس میزان تغییرات متغیرها در برشهای زمانی متوالی تخمین زده میشود و سپس میزان قطعیت هر یک از توابع توزیع با استفاده از معیار آنتروپی تعیین گردیده و در نهایت مجموعه روابط سببی استخراج شده با استفاده از ساختار گراف سببی نمایش داده میشود. در مرحله بعد مجموعهای از روابط سببی دنبالهای به صورت زنجیرههای سببی احتمالاتی، از روی گراف سببی تولید شده در مرحله قبل، به وسیله یک الگوریتم حریصانه جدید تولید میشود، که الگوریتم حریصانه پیشنهادی دارای زمان اجرای چند جملهای بر حسب تعداد گرههای گراف سببی است. نتایج پیادهسازی مدل پیشنهادی روی مجموعه دادههای دنبالهای بیماری عصبی مزمن ALS نشان میدهد که الگوریتم پیشنهادی با دقت خوبی قادر به پیشبینی روند تشدید این بیماری روی بیماران مورد نظر است. نتایج مقایسه مدل پیشنهادی با الگوریتمهای درخت بیزی، جنگل تصادفی، رگرسیون بردار پشتیبان، رگرسیون خطی و رگرسیون چند متغیره نشان میدهد که الگوریتم پیشنهادی قابل رقابت با الگوریتمهای مشابه است و در برخی موارد دقت آن از الگوریتمهای دیگر بالاتر است.
Abstract
Causal discovery and analyzing causal relationships is one of the major issues in study of a natural phenomenon in real world. In many of natural phenomena such as biomedical applications we deal with temporal and sequential dataset, which Bayesian Networks (BNs) are not able to analyze such data, but the temporal extension of BNs called Dynamic Bayesian network (DBN) can analyze causal relationships between variables in consecutive time points. Causal discovery algorithms which are used in sequential data, only use probabilistic and statistical measures to assess the certainty of causal relationships. In this thesis, we introduce a novel model for causal analysis in the sequential data of a natural phenomenon, which use information theory concepts for analyzing certainty of causal relationships. In this method, Conditional Probability Distribution (CPD) of all pairs of variables is estimated based on variables changes in consecutive time points, in order to discover causal relationships between variables, then the certainty of all CPDs is determined on the basis of entropy criteria. Finally, the set of all extracted causal relationships is demonstrated by a causal graph. At the next step, a set of probabilistic causal chains of the corresponding causal graph are constructed by a novel greedy heuristic, which the proposed greedy algorithm has polynomial running time on the number of graph nodes. The proposed model was applied on the temporal data set of Pooled Resource Open-Access Clinical Trials (PRO-ACT) related to Amyotrophic Lateral Sclerosis (ALS) disease, in order to predict the ALS progression rate of such patients. The results indicated that the proposed method could predict the future trend of ALS disease with high precision in ALS patients. The results of comparison with Bayesian tree, random forest, support vector regression, linear regression, and multivariate regression show that the proposed algorithm can compete with similar methods and in some cases outperforms other algorithms.
Keywords: Entropy, Sequential Data, Prediction, Probabilistic Causal Graph, ALS Disease
دانشکده مهندسی کامپیوتر مدیریت تحصیلات تکمیلی
|