دسته بندی موضوعی مطالب |
جستجوی پیشرفته |
تعداد کل مطالب: 131 |
تعداد کل بازدید های مطالب: 669,633 |
|
|

شنبه ۲۹ شهریور ۱۴۰۴ -
زمن فاضل جبر
دانشجو زمن جبر دانشجوی دکتری، دکتر ناصر مزینی مورخ: ۱۴۰۴/۰۶/۳۰ساعت: ۱۴ الی ۱۷ از رساله دکتری خود با عنوان " Arabic Speech Recognition from Visual Cue Using Deep Learning " دفاع خواهند نمود.
ارائه دهنده:
زمن فاضل جبر
استاد راهنما:
دکتر ناصر مزینی
استاد مشاور: دکتر اعتمادی
هیات داوران:
دکترمینائی
دکترمحمدی
دکترصامتی
دکتر زنیالی
زمان ۳۰ شهریورماه ماه ۱۴۰۴
ساعت:۱۴ الی ۱۷
مکان: اتاق دفاع طبقه دوم
Abstract
Visual speech recognition (VSR), or lip-reading, is crucial in human communication and speech understanding. Lip-reading is a challenging task that requires deep learning models to achieve high accuracy. The researchers introduced many deep learning models using Deep Neural Networks (DNNs) with letters, digits, words, and sentences for other languages, but not Arabic. The main reason for the low number of lip-reading studies in Arabic is the unavailability of a large-scale dataset that can be used to train a DNN.
The work in this thesis contributes to automatic Arabic lip-reading at the word and sentence levels using DNN with visual cues only. We attempted to find a solution to the problem of lacking a large-scale Arabic dataset for training a DNN model. To this end, we propose an end-to-end Arabic lip-reading model that can be trained on a limited dataset, which combines a Visual module consisting of a multi-layer Convolutional Neural Network (CNN) and a Temporal module comprised of Gated Recurrent Unit (GRU) and soft-max layers, taking into account the balance between the size of the dataset and the number of model parameters. To train this model, we created a limited Arabic dataset comprising ۲۰ words spoken by ۴۰ native Arabic speakers. At the word level, our proposed method is evaluated on ۱) our dataset, where we obtained an accuracy equal to ۸۳.۰۲%; ۲) the Dweik et al. dataset, where we obtained an improvement rate of ≈ ۳% on the result recorded by their work. In addition, we employed the Visual module for person identification using the viseme image and obtained a high-performance result.
At the sentence level, we modified the same end-to-end model to address the problem from two perspectives: first, as a classification problem, and second, as a sequence prediction problem. The modification is only applied to the Temporal module, while the Visual model remains unchanged. In the classification problem, the Temporal module consists of a stack of GRUs and a fully connected layer. In the sequence prediction problem, the Temporal module is the encoder-decoder network; the encoder consists of three GRU layers, while the decoder consists of two GRU layers with an attention mechanism. To train the end-to-end model, we collected a sentence-level dataset for the Arabic language, comprising ۵۵ sentences with ۱۳۹ unique words uttered by ۴۰ individuals, including ۲۸ declarative sentences, ۲۰ interrogative sentences, and ۷ request sentences. This dataset is the largest sentence-level Arabic language dataset addressing lip-reading problems. We made this dataset involve all ۲۸ phonemes in Arabic; this attribute is only in our dataset and is missing in all previous works for the Arabic language.
For the sentence classification problem, the end-to-end model was first applied to our dataset, yielding recognition accuracies of ۹۰.۴۵% for person-dependent and ۷۱.۵۳% for person-independent experiments. Then, it was used in the BlidAVS۱۰ dataset, and an accuracy of ۸۳.۰۹ was obtained for the person-independent experiment. For the sequence prediction problem, the end-to-end model was applied to our dataset, yielding an ۸۰.۵۱% Word Error Rate (WER).
|

شنبه ۲۹ شهریور ۱۴۰۴ -
زمن فاضل جبر
دانشجو زمن جبر دانشجوی دکتری، دکتر ناصر مزینی مورخ: ۱۴۰۴/۰۶/۲۹ساعت: ۱۴ الی ۱۷ از رساله دکتری خود با عنوان " Arabic Speech Recognition from Visual Cue Using Deep Learning " دفاع خواهند نمود.
ارائه دهنده:
زمن فاضل جبر
استاد راهنما:
دکتر ناصر مزینی
استاد مشاور: دکتر اعتمادی
هیات داوران:
دکترمینائی
دکترمحمدی
دکترصامتی
دکتر زنیالی
زمان ۲۹ شهریورماه ماه ۱۴۰۴
ساعت:۱۴ الی ۱۷
مکان: اتاق دفاع طبقه دوم
Abstract
Visual speech recognition (VSR), or lip-reading, is crucial in human communication and speech understanding. Lip-reading is a challenging task that requires deep learning models to achieve high accuracy. The researchers introduced many deep learning models using Deep Neural Networks (DNNs) with letters, digits, words, and sentences for other languages, but not Arabic. The main reason for the low number of lip-reading studies in Arabic is the unavailability of a large-scale dataset that can be used to train a DNN.
The work in this thesis contributes to automatic Arabic lip-reading at the word and sentence levels using DNN with visual cues only. We attempted to find a solution to the problem of lacking a large-scale Arabic dataset for training a DNN model. To this end, we propose an end-to-end Arabic lip-reading model that can be trained on a limited dataset, which combines a Visual module consisting of a multi-layer Convolutional Neural Network (CNN) and a Temporal module comprised of Gated Recurrent Unit (GRU) and soft-max layers, taking into account the balance between the size of the dataset and the number of model parameters. To train this model, we created a limited Arabic dataset comprising ۲۰ words spoken by ۴۰ native Arabic speakers. At the word level, our proposed method is evaluated on ۱) our dataset, where we obtained an accuracy equal to ۸۳.۰۲%; ۲) the Dweik et al. dataset, where we obtained an improvement rate of ≈ ۳% on the result recorded by their work. In addition, we employed the Visual module for person identification using the viseme image and obtained a high-performance result.
At the sentence level, we modified the same end-to-end model to address the problem from two perspectives: first, as a classification problem, and second, as a sequence prediction problem. The modification is only applied to the Temporal module, while the Visual model remains unchanged. In the classification problem, the Temporal module consists of a stack of GRUs and a fully connected layer. In the sequence prediction problem, the Temporal module is the encoder-decoder network; the encoder consists of three GRU layers, while the decoder consists of two GRU layers with an attention mechanism. To train the end-to-end model, we collected a sentence-level dataset for the Arabic language, comprising ۵۵ sentences with ۱۳۹ unique words uttered by ۴۰ individuals, including ۲۸ declarative sentences, ۲۰ interrogative sentences, and ۷ request sentences. This dataset is the largest sentence-level Arabic language dataset addressing lip-reading problems. We made this dataset involve all ۲۸ phonemes in Arabic; this attribute is only in our dataset and is missing in all previous works for the Arabic language.
For the sentence classification problem, the end-to-end model was first applied to our dataset, yielding recognition accuracies of ۹۰.۴۵% for person-dependent and ۷۱.۵۳% for person-independent experiments. Then, it was used in the BlidAVS۱۰ dataset, and an accuracy of ۸۳.۰۹ was obtained for the person-independent experiment. For the sequence prediction problem, the end-to-end model was applied to our dataset, yielding an ۸۰.۵۱% Word Error Rate (WER).
|
یکشنبه ۲۵ خرداد ۱۴۰۴ -
مرجان کرامتی
دانشجو مرجان کرامتی دانشجوی دکتری، دکتر ناصر مزینی مورخ: ۱۴۰۴/۰۴/۰۲ساعت: ۱۶:۰۰ از رساله دکتری خود با عنوان " جانمایی کنترلگرها در شبکه هوشمند برق نرم افزار محور با استفاده از سیستم های چندعاملی" دفاع خواهند نمود.
|
سه شنبه ۱۶ اردیبهشت ۱۴۰۴ -
حدیث بشیری
دانشجو حدیث بشیری دانشجوی دکتری، دکتر حسن نادری مورخ : تاریخ ۱۴۰۴/۰۲/۲۴ ساعت: ۱۲:۳۰ از رساله دکتری خود با عنوان " تشخیص محبوبیت رویداد بر اساس تحلیل دادههای شبکههای اجتماعی برخط" دفاع خواهند نمود.
|
سه شنبه ۱۴ اسفند ۱۴۰۳ -
اکرم کلائی
دانشجو اکرم کلائی دانشجوی دکتری، دکتر سعید پارسا مورخ : تاریخ ۱۸/۱۲/ ۱۴۰۳ ساعت: ۱۱:۰۰ صبح از رساله دکتری خود با عنوان "تحلیل دامنه و تأثیر آن بر بهبود آزمونپذیری و شرحپذیری سیستمهای سایبر- فیزیکی مبتنی بر یادگیری ماشین " دفاع خواهند نمود.
|
سه شنبه ۱ آبان ۱۴۰۳ -
آرمان سان احمدی
دانشجو آرمان سان احمدی دانشجوی دکتر محمد عبداللهی ازگمی مورخ : ۱۴۰۳/۱۱/۰۱ ساعت : ۱۶:۳۰ از رساله دکتری خود با عنوان "مدلسازی صوری و ارزیابی کمّی ویژگیهای کیفی اینترنت اشیاء مبتنی بر شبکههای پتری تصادفی " دفاع خواهند نمود.
|
سه شنبه ۱ آبان ۱۴۰۳ -
محمد حاجی زاده صفار
دانشجو محمد حاجی زاده صفار دانشجوی دکتر عادل ترکمان رحمانی مورخ : ۱۴۰۳/۱۱/۰۸ ساعت: ۸:۰۰ صبح از رساله دکتری خود با عنوان "تشخیص بیدرنگ اشیا در ویدئو بر روی دستگاههای توکار با استفاده از شبکههای عصبی عمیق " دفاع خواهند نمود.
|
شنبه ۲۴ شهریور ۱۴۰۳ -
سیدمهدی شریعت زاده
دانشجو سیدمهدی شریعت زاده دانشجوی دکتر محمود فتحی مورخ ۱۴۰۳/۰۶/۲۸ ساعت :۱۳ از رساله دکتری خود با عنوان "جستجوی معماری عصبی کارآمد در شبکههای عصبی پیچشی عمیق برای کاربردهای بینایی ماشینی" دفاع خواهند نمود.
|
یکشنبه ۱۸ شهریور ۱۴۰۳ -
راضیه زال
دانشجو: راضیه زال
دانشجوی دکتری دکتر محمد رضا کنگاوری مورخ ۱۴۰۳/۰۶/۱۹ ساعت ۱۶:۰۰ از پروژه دکتری خود با عنوان
ارائه چارچوب رایانشی تطبیقی از هیجان در عاملهای شناختی در راستای تعاملات اجتماعی قابل پذیرش
" دفاع خواهند نمود.(ادامه مطلب)
|
یکشنبه ۱۸ شهریور ۱۴۰۳ -
عبدالله علی السلامی
دانشجو: عبدالله علی السلامی
دانشجوی دکتری، دکتر ناصر مزینی و دکتر سید وحید ازهری مورخ ۱۴۰۳/۰۶/۱۹ ساعت ۱۰:۰۰ صبح از
Traffic Engineering In Software Defined Networks Using Swarm Intelligence " دفاع خواهند نمود.
|
دوشنبه ۲۴ اردیبهشت ۱۴۰۳ -
رحمن عمیری
دانشجو رحمن عمیری دانشجوی دکتر حسن نادری مورخ ۱۴۰۳/۰۲/۲۶ ساعت ۱۶:۰۰ از رساله دکتری خود با عنوان "ردیابی تکامل جامعه در شبکه های اجتماعی تعاملی با در نظر گرفتن موضوعات" دفاع خواهند نمود. (ادامه مطلب)
|
یکشنبه ۲ اردیبهشت ۱۴۰۳ -
مرضیه پندی
دانشجو
مرضیه پندی دانشجوی کارشناسی ارشد دکتر حاکم بیتالهی مورخ ۱۴۰۳/۰۲/۰۲ ساعت ۱۳:۰۰ از پروژه کارشناسی ارشد خود با عنوان "ارائهی یک روش قفل منطقی برای مقابله با حملات مرسوم و محافظت از مالکیت معنوی
" دفاع خواهند نمود.(ادامه مطلب)
|
دوشنبه ۲۱ اسفند ۱۴۰۲ -
مریم سرخی
خانم مریم سرخی دانشجوی دکترای آقایان دکتر محمدرضا جاهدمطلق و دکتر بهروز مینایی بیدگلی مورخ ۱۴۰۲/۱۲/۲۳ ساعت ۱۴:۳۰ از رساله دکتری خود با عنوان "یادگیری پارامترهای شناختی در بازی ویدئویی مبتنی بر فعالیت عصبی کاربر" دفاع خواهند نمود. (ادامه مطلب)
|
یکشنبه ۲۹ بهمن ۱۴۰۲ -
یعرب عبدالله
آقای یعرب عبدالله دانشجوی دکترای خانم دکتر زینب موحدی مورخ ۱۴۰۲/۱۱/۳۰ ساعت ۱۷:۳۰ از رساله دکتری خود با عنوان "مدیریت داده آگاه ار انرژی و کیفیت سرویس در اینترنت اشیاء صنعتی" دفاع خواهند نمود. (ادامه مطلب)
|
چهارشنبه ۱۷ آبان ۱۴۰۲ -
زهرا رشیدی
خانم زهرا رشیدی دانشجوی دکترای آقای دکتر وصال حکمی مورخ ۱۴۰۲/۰۸/۲۰ ساعت ۱۷:۰۰ از رساله دکتری خود با عنوان "بهینهسازی جانمایی محتوا در شبکههای سلولی کوچکِ مجهّز به کش با اطلاعات ناکامل" دفاع خواهند نمود. (ادامه مطلب)
|
دوشنبه ۲۷ شهریور ۱۴۰۲ -
حجتاله اسماعیلی
آقای حجتاله اسماعیلی دانشجوی دکترای آقایان دکتر بهروز مینایی و دکتر وصال حکمی مورخ ۱۴۰۲/۰۶/۲۹ ساعت ۱۶:۰۰ از رساله دکتری خود با عنوان "یک روش ترکیبی نوین مبتنی بر الگوریتمهای فراابتکاری و یادگیری ماشین برای ایجاد تعمیمپذیری در کاربردهای مسیریابی در شبکههای حسگر بیسیم" دفاع خواهند نمود. (ادامه مطلب)
|
چهارشنبه ۲۲ شهریور ۱۴۰۲ -
مرتضی ذاکری نصرآبادی
آقای مرتضی ذاکری نصرآبادی دانشجوی دکترای آقای دکتر سعید پارسا مورخ ۱۴۰۲/۰۶/۲۶ ساعت ۰۸:۰۰ از رساله دکتری خود با عنوان "سنجش و بهبود آزمونپذیری مصنوعات سیستمهای نرمافزاری"دفاع خواهند نمود. (ادامه مطلب)
|
شنبه ۱۸ شهریور ۱۴۰۲ -
پریا دربانی
خانم پریا دربانی دانشجوی دکترای آقای دکتر حاکم بیتالهی مورخ ۱۴۰۲/۰۶/۲۰ ساعت ۱۶:۰۰ از رساله دکتری خود با عنوان "شتابدهنده دارای قابلیت بازپیکربندی برای اجرای کارآمد شبکههای عصبی پیچشی"دفاع خواهند نمود. (ادامه مطلب)
|
سه شنبه ۲۰ تیر ۱۴۰۲ -
سمیه کاشی
خانم سمیه کاشی دانشجوی دکترای آقای دکتر مهدی فاضلی روز سه شنبه مورخ ۱۴۰۲/۰۴/۲۰ ساعت ۱۵:۰۰ از رساله دکتری خود با عنوان "سنتز شبکه برتراشه سفارشی چندکاربردی با ملاحظات سیلیکون خاموش"دفاع خواهند نمود. (ادامه مطلب)
|
یکشنبه ۲۲ آبان ۱۴۰۱ -
زهرا جلالیان
خانم زهرا جلالیان دانشجوی دکترای آقای دکتر محسن شریفی روز یکشنبه مورخ ۱۴۰۱/۰۸/۲۲ ساعت ۱۸:۳۰ از رساله دکتری خود با عنوان "زمانبندی خودمختار وظایف در سامانههای توزیعی پردازش سریع دادهها"دفاع خواهند نمود. (ادامه مطلب)
|
شنبه ۲۱ آبان ۱۴۰۱ -
بشری پیشگو
خانم بشری پیشگو دانشجوی دکترای آقایان دکتر احمد اکبری ازیرانی روز شنبه مورخ ۱۴۰۱/۰۸/۲۱ ساعت ۱۴:۳۰ از رساله دکتری خود با عنوان "بهبود تشخیص ناهنجاری مبتنی بر همبستگی رخدادهای جریانی "دفاع خواهند نمود. (ادامه مطلب)
|
یکشنبه ۱۷ مهر ۱۴۰۱ -
علی اصغر داودآبادی
آقای علی اصغر داودآبادی دانشجوی دکترای آقایان دکتر حاکم بیت الهی و دکتر محمود فتحی روز یکشنبه مورخ ۱۴۰۱/۰۷/۱۷ ساعت ۱۷:۰۰ از رساله دکتری خود با عنوان "شتابدهندههای عمومی قابل بازپیکربندی در پردازندههای نهفته "دفاع خواهند نمود. (ادامه مطلب)
|
چهارشنبه ۴ اسفند ۱۴۰۰ -
محبوبه ریاحی مدوار
خانم محبوبه ریاحی مدوار دانشجوی دکترای آقای دکتر احمد اکبری روز یکشنبه مورخ ۱۴۰۰/۱۲/۰۸ ساعت ۱۴:۰۰ از رساله دکتری خود با عنوان "تشخیص نمونههای پرت در دادههای با ابعاد بالا با استفاده از زیرفضاهای داده و ویژگی"دفاع خواهند نمود. (ادامه مطلب)
|
یکشنبه ۳ بهمن ۱۴۰۰ -
راضیه روستائی
خانم راضیه روستائی دانشجوی دکترای سرکار خانم دکتر زینب موحدی روز دوشنبه مورخ ۱۴۰۰/۱۱/۰۴ ساعت ۱۰:۰۰ از رساله دکتری خود با عنوان "تخلیهبار مبتنی بر قیمت در رایانش ابر حاشیه موبایل"دفاع خواهند نمود. (ادامه مطلب)
|
یکشنبه ۲۶ دی ۱۴۰۰ -
مهران شتابی
آقای مهران شتابی دانشجوی دکترای آقای دکتر احمد اکبری روز دوشنبه مورخ ۱۴۰۰/۰۹/۲۷ ساعت ۰۹:۰۰ از رساله دکتری خود با عنوان "توزیع بار در کنترلکنندههای SDN با دسترسپذیری و مقیاسپذیری بالا"دفاع خواهند نمود. (ادامه مطلب)
|