|
دانشجو حدیث بشیری دانشجوی دکتری، دکتر حسن نادری مورخ : تاریخ ۱۴۰۴/۰۲/۲۴ ساعت: ۱۲:۳۰ از رساله دکتری خود با عنوان " تشخیص محبوبیت رویداد بر اساس تحلیل دادههای شبکههای اجتماعی برخط" دفاع خواهند نمود. |
|
|
ارائه دهنده:
حدیث بشیری
استاد راهنما:
دکتر حسن نادری
هیات داوران:
دکتر بهروز مینایی
دکتر عیناله خنجری
دکتر آزاده شاکری
دکتر صادق علیاکبری
زمان۲۴ اردبیهشت ماه ۱۴۰۴
ساعت: :۱۲:۳۰
مکان: اتاق سمینار کارشناسی ارشد طبقه سوم
چکیده پایان نامه :
امروزه بسیاری از افراد از رسانههای اجتماعی برای بیان نظرات و دیدگاههای خود بهره میبرند و با توجه به اهمیت روزافزون این شبکهها، میتوان از آنها بهعنوان منبعی ارزشمند برای دریافت بازخوردهای عمومی استفاده کرد. تحلیل احساسات که به بررسی دیدگاههای افراد نسبت به موجودیتها و موضوعات مختلف میپردازد، میتواند به هر نظر امتیازی اختصاص دهد (مثبت، منفی یا خنثی) و درک عمیقی از نظرات عمومی ارائه دهد. در این پژوهش، هدف بررسی میزان محبوبیت رویدادها از طریق تجزیهوتحلیل بازخوردهای کاربران است. بررسی قطبیت احساسات افراد نسبت به یک رویداد خاص میتواند نقش مهمی در تصمیمگیریهای اجتماعی، سیاسی و اقتصادی ایفا کند. علاوه بر درک کلی که از محاسبه محبوبیت رویداد به دست میآید، این اطلاعات میتوانند بهعنوان معیاری برای ارزیابی واکنشهای مردم و همچنین شناسایی جوامعی که دیدگاههای مشابهی دارند، استفاده شود. همچنین این نتایج میتوانند مبنای سیستمهای پیشنهاد دوست قرار گیرند. چارچوب پیشنهادی این پژوهش شامل دو مؤلفه اصلی است: تشخیص رویداد و تحلیل احساسات. در مرحله اول، رویدادها با استفاده از یک روش تشخیص شناسایی میشوند و در مرحله دوم، تحلیل احساسات برای دادههای مرتبط با هر رویداد انجام میگیرد. در نهایت، به هر رویداد مقداری بهعنوان میزان محبوبیت آن تخصیص داده میشود. نوآوریهای این پژوهش در دو مؤلفه اصلی آن نهفته است. برای تحلیل احساسات، روش SyntaPulse معرفی شده است که با ترکیب یک روش مبتنی بر فرهنگ لغت و مدل یادگیری ماشین بدون نظارت، محدودیتهای موجود در تحلیل احساسات، ازجمله ابهامات متنی، وابستگی به دامنه، مشکلات پوشش طعنه و کمبود دادههای برچسبگذاری شده در حوزههای مختلف را برطرف میکند. این چارچوب با عملکرد بهینه و دقت بالایی در دادههای متنوع توانسته نتایج قابلتوجهی به دست آورد. همچنین در بخش تشخیص رویداد، چارچوب پیشنهادی نوآوریهایی مانند تنظیم پویا پهنای باند بر اساس تراکم محلی داده، استفاده از فاصله چند متغیره، تخمین چگالی هستهای تطبیقی و بهبود روش Louvain-MOMR برای تشخیص جوامع است که کارایی تشخیص رویدادها را افزایش میدهد. برای ارزیابی نهایی چارچوب، با توجه به نبودن دادههای برچسبگذاری شده مناسب برای این امر، از برچسبزنی احساسی سه مجموعهداده FACup، SuperTuesday و USElection با استفاده از دو مدل از پیش آموزشدیده، استفاده شده است. نتایج نشان میدهند که چارچوب پیشنهادی در هر دو مؤلفه عملکرد مطلوبی دارد و میتواند با دقت مناسبی میزان محبوبیت رویدادها را تشخیص دهد. همچنین، ارزیابی جداگانه مؤلفههای تحلیل احساسات و تشخیص رویداد نشان میدهد که این مؤلفهها در بیشتر موارد نتایجی بهتر از روشهای پیشرفته موجود به دست میآورند.
Abstract
Nowadays, many individuals use social media to express their opinions and views. Given the growing importance of these platforms, they can serve as a valuable source for collecting public feedback. Sentiment analysis, which focuses on understanding people’s attitudes toward various entities and topics, assigns a score to each opinion (positive, negative, or neutral) and provides a deeper insight into public sentiment. This study aims to evaluate the popularity of events by analyzing user feedback. Assessing the sentiment polarity toward specific events can play a significant role in social, political, and economic decision-making. In addition to offering an overall understanding of event popularity, this information can also be used to assess public reactions and identify communities with shared viewpoints. These findings may also serve as a basis for friend recommendation systems. The proposed framework in this study consists of two main components: event detection and sentiment analysis. In the first stage, events are identified using an event detection method, and in the second stage, sentiment analysis is performed on the data associated with each event. Finally, a popularity score is assigned to each detected event. The novelty of this research lies in both components. For sentiment analysis, a method called SyntaPulse is introduced. By combining a lexicon-based approach with an unsupervised machine learning model, it addresses key challenges in sentiment analysis, including textual ambiguity, domain dependence, sarcasm detection, and the lack of labeled data across various domains. This framework achieves high accuracy and strong performance across diverse datasets. In the event detection component, the framework introduces innovations such as dynamic bandwidth adjustment based on local data density, the use of multivariate distance, adaptive kernel density estimation, and an improved Louvain-MOMR method for community detection, which enhance the effectiveness of event identification. For final evaluation, due to the lack of suitable labeled data, three datasets—FACup, SuperTuesday, and USElection—were sentiment-labeled using two pre-trained models. The results show that the proposed framework performs well in both components and can accurately estimate the popularity of events. Furthermore, separate evaluations of the sentiment analysis and event detection components indicate that, in most cases, they outperform existing state-of-the-art methods.
|