|
|
 |
علی مختاری |
 |
|
| تاریخ ارسال: 1404/7/23 | |
|
|
دانشجو علی مختاری دانشجوی دکتری، دکتر پیمان کبیریمورخ: ۱۴۰۴/۰۷/۲۳ساعت: ۱۵:۰۰ از رساله دکتری خود با عنوان " طراحی و پیادهسازی واحد محاسبه با استفاده از منطق چند ارزشی " دفاع خواهند نمود.
ارائه دهنده:
علی مختاری
استاد راهمنا
دکتر پیمان کبیری
هیات داوران:
دکتر محمد پویان
دکتر شاهین حسابی
دکتر ناصر مزینی
دکتر امیر مهدی حسینی منزه
زمان ۲۳ مهرماه ماه ۱۴۰۴
ساعت: ۱۵:۰۰
مکان: سالن دفاعیه طبقه سوم دانشکده مهندسی کامپیوتر
چکیده
درسالهای اخیر، مدارهای طراحی شده برپایه فناوری سیلیکون به مرزهای نهایی سرعت خود نزدیک شدهاند همزمان، نیاز به افزایش توان پردازشی و سرعت سامانههای رایانهای بیش از پیش احساس میشود. از این رو، پژوهشگران رویکردهای متعددی را برای ارتقای سرعت سیستمهای محاسباتی بررسی کردهاند؛ از جمله تغییر در فناوری ساخت، بهرهگیری از معماریهای چندهستهای و نیز استفاده از روشهای نوآورانه همچون منطق چندارزشی. منطق چند ارزشی یکی از چالش برانگیزترین روشهای پیادهسازی مدارهای الکترونیکی است که ظرفیت دگرگونسازی طراحی مدارهای سیلیکونی را دارد. در این پژوهش تلاش شده است تا عناصر مورد نیاز واحد محاسبه و منطق با استفاده از قطعات تجاری و در قالب مدارهای با تراکم بالا، بر پایه رویکرد منطق چندارزشی و محاسبه با مدارهای آنالوگ طراحی شود. در این طراحی، رویکرد اصلی مبتنی بر مدارهای مد ولتاژ است. مدارهای ارائه شده برپایه فناوری سیلیکون و ترانزیستورهای اثر میدان طراحی شدهاند که دهههاست در ساخت مدارهای پرتراکم بکارگرفته میشوند. هرچند ابعاد این فناوری بزرگتر از مرزهای نوین فناوریهای نانویی است، اما به دلیل قابلیت ساخت و پیادهسازی عملی، میتواند از بسیاری از فناوریهای نوظهور در حوزه مدارهای چندارزشی (مانند ترانزیستورهای نانولوله کربنی، اتوماتاهای سلولی مبتنی بر نقاط کوانتومی و ترانزیستورهای تکالکترونی) برتر باشد. طراحی مدارهای چندارزشی با استفاده از عناصر تجاری با چالشهای متعددی همراه است؛ از جمله مدیریت نویز، ایجاد سطوح ولتاژی متفاوت و نحوهی پیادهسازی عملی مدارها. نخست یک منطق کامل ریاضی ۱۰ ارزشی ارائه شده است. سپس تلاش شده تا مدارهای منطقی متناسب با این منطق ریاضی ارائه شوند و در پایان مدارهای بخش حافظه و محاسبات ارائه شدهاند. برای کاهش تعداد ترانزیستورها، رویکرد استفاده از روشهای آنالوگ در طراحی مدارهای چندارزشی مورد توجه قرار گرفته است. با این حال، بهرهگیری از مدارهای آنالوگ حساسیت سیستم را در برابر نویز و لغزش عملکرد افزایش میدهد. به منظور کاهش این اثرات، مداری با عنوان «بافر تصحیحکننده» به مجموعه مدارهای طراحیشده افزوده شده است. در طراحی این خانواده از مدارها، تلاش شده است تا همه اجزا از نظر الکترونیکی با یکدیگر سازگار باشند. به بیان دیگر، امکان اتصال و سیمکشی مستقیم میان مدارها بدون ایجاد اختلال در عملکرد فراهم شده است. همچنین، تلاش شده است تا حد امکان تغذیهی یکسان برای کل مدارها در نظر گرفته شود. نتایج حاصل نشان میدهد که بخش عمدهای از اهداف پژوهش به شکلی مطلوب تحقق یافته است. از جمله این دستاوردها میتوان به طراحی خانوادهای از منطق دهارزشی بر پایهی مدارهای آنالوگ و با استفاده از عناصر تجاری اشاره کرد.
Abstract
In recent years, silicon-based circuit technologies have approached their fundamental speed limitations, while the demand for higher-performance computer systems continues to increase. To overcome these constraints, researchers have explored various approaches to enhance computational speed, including advancements in fabrication technologies, the adoption of multi-core architectures, and the introduction of innovative paradigms such as multi-valued logic (MVL). Among these, MVL represents one of the most challenging yet promising methods for extending the capabilities of conventional silicon circuits. This research aims to design the essential components of an arithmetic and logic unit (ALU) using commercially available, high-density silicon elements based on the MVL approach. The proposed circuits employ field-effect transistors (FETs), which have been utilized for decades in high-density silicon technologies. Although the implemented technology node is not at the cutting edge, it demonstrates significant advantages over alternative MVL implementation platforms—such as carbon nanotube transistors, quantum-dot cellular automata, and single-electron transistors—which face severe manufacturability limitations. The proposed designs operate in voltage mode and address several key challenges inherent to MVL circuit design using commercial devices, including noise susceptibility, voltage-level generation, and practical implementation. A complete decenary (۱۰-valued) logic system is first formulated, followed by the design of logic circuits implementing this system. Subsequently, the memory and arithmetic units are developed. To minimize transistor count, the circuits are realized using analog design techniques. However, this analog implementation introduces sensitivity to noise and signal degradation; therefore, a corrective buffer circuit is incorporated to mitigate these effects. Furthermore, all circuit components have been designed to ensure full electrical compatibility within the proposed logic family—allowing direct interconnection without operational conflicts—and to share a unified power supply across most modules. Experimental and simulation results confirm that the principal objectives of this work have been successfully achieved, demonstrating the feasibility of implementing a decenary logic family using analog design techniques and standard commercial elements.
Keywords: Multilevel Logic, Logic Unit, Computing Unit, Memory, Voltage Mode, Noise, Implementation
|
|
|
|
دفعات مشاهده: 53 بار | دفعات چاپ: 8 بار | دفعات ارسال به دیگران: 0 بار | 0 نظر |
|
|
|
|
|
 |
زمن فاضل جبر |
 |
|
| تاریخ ارسال: 1404/6/29 | |
|
|
دانشجو زمن جبر دانشجوی دکتری، دکتر ناصر مزینی مورخ: ۱۴۰۴/۰۶/۳۰ساعت: ۱۴ الی ۱۷ از رساله دکتری خود با عنوان " Arabic Speech Recognition from Visual Cue Using Deep Learning " دفاع خواهند نمود.
ارائه دهنده:
زمن فاضل جبر
استاد راهنما:
دکتر ناصر مزینی
استاد مشاور: دکتر اعتمادی
هیات داوران:
دکترمینائی
دکترمحمدی
دکترصامتی
دکتر زنیالی
زمان ۳۰ شهریورماه ماه ۱۴۰۴
ساعت:۱۴ الی ۱۷
مکان: اتاق دفاع طبقه دوم
Abstract
Visual speech recognition (VSR), or lip-reading, is crucial in human communication and speech understanding. Lip-reading is a challenging task that requires deep learning models to achieve high accuracy. The researchers introduced many deep learning models using Deep Neural Networks (DNNs) with letters, digits, words, and sentences for other languages, but not Arabic. The main reason for the low number of lip-reading studies in Arabic is the unavailability of a large-scale dataset that can be used to train a DNN.
The work in this thesis contributes to automatic Arabic lip-reading at the word and sentence levels using DNN with visual cues only. We attempted to find a solution to the problem of lacking a large-scale Arabic dataset for training a DNN model. To this end, we propose an end-to-end Arabic lip-reading model that can be trained on a limited dataset, which combines a Visual module consisting of a multi-layer Convolutional Neural Network (CNN) and a Temporal module comprised of Gated Recurrent Unit (GRU) and soft-max layers, taking into account the balance between the size of the dataset and the number of model parameters. To train this model, we created a limited Arabic dataset comprising ۲۰ words spoken by ۴۰ native Arabic speakers. At the word level, our proposed method is evaluated on ۱) our dataset, where we obtained an accuracy equal to ۸۳.۰۲%; ۲) the Dweik et al. dataset, where we obtained an improvement rate of ≈ ۳% on the result recorded by their work. In addition, we employed the Visual module for person identification using the viseme image and obtained a high-performance result.
At the sentence level, we modified the same end-to-end model to address the problem from two perspectives: first, as a classification problem, and second, as a sequence prediction problem. The modification is only applied to the Temporal module, while the Visual model remains unchanged. In the classification problem, the Temporal module consists of a stack of GRUs and a fully connected layer. In the sequence prediction problem, the Temporal module is the encoder-decoder network; the encoder consists of three GRU layers, while the decoder consists of two GRU layers with an attention mechanism. To train the end-to-end model, we collected a sentence-level dataset for the Arabic language, comprising ۵۵ sentences with ۱۳۹ unique words uttered by ۴۰ individuals, including ۲۸ declarative sentences, ۲۰ interrogative sentences, and ۷ request sentences. This dataset is the largest sentence-level Arabic language dataset addressing lip-reading problems. We made this dataset involve all ۲۸ phonemes in Arabic; this attribute is only in our dataset and is missing in all previous works for the Arabic language.
For the sentence classification problem, the end-to-end model was first applied to our dataset, yielding recognition accuracies of ۹۰.۴۵% for person-dependent and ۷۱.۵۳% for person-independent experiments. Then, it was used in the BlidAVS۱۰ dataset, and an accuracy of ۸۳.۰۹ was obtained for the person-independent experiment. For the sequence prediction problem, the end-to-end model was applied to our dataset, yielding an ۸۰.۵۱% Word Error Rate (WER).
|
|
|
|
دفعات مشاهده: 965 بار | دفعات چاپ: 149 بار | دفعات ارسال به دیگران: 0 بار | 0 نظر |
|
|
|
|
|
 |
زمن فاضل جبر |
 |
|
| تاریخ ارسال: 1404/6/29 | |
|
|
دانشجو زمن جبر دانشجوی دکتری، دکتر ناصر مزینی مورخ: ۱۴۰۴/۰۶/۲۹ساعت: ۱۴ الی ۱۷ از رساله دکتری خود با عنوان " Arabic Speech Recognition from Visual Cue Using Deep Learning " دفاع خواهند نمود.
ارائه دهنده:
زمن فاضل جبر
استاد راهنما:
دکتر ناصر مزینی
استاد مشاور: دکتر اعتمادی
هیات داوران:
دکترمینائی
دکترمحمدی
دکترصامتی
دکتر زنیالی
زمان ۲۹ شهریورماه ماه ۱۴۰۴
ساعت:۱۴ الی ۱۷
مکان: اتاق دفاع طبقه دوم
Abstract
Visual speech recognition (VSR), or lip-reading, is crucial in human communication and speech understanding. Lip-reading is a challenging task that requires deep learning models to achieve high accuracy. The researchers introduced many deep learning models using Deep Neural Networks (DNNs) with letters, digits, words, and sentences for other languages, but not Arabic. The main reason for the low number of lip-reading studies in Arabic is the unavailability of a large-scale dataset that can be used to train a DNN.
The work in this thesis contributes to automatic Arabic lip-reading at the word and sentence levels using DNN with visual cues only. We attempted to find a solution to the problem of lacking a large-scale Arabic dataset for training a DNN model. To this end, we propose an end-to-end Arabic lip-reading model that can be trained on a limited dataset, which combines a Visual module consisting of a multi-layer Convolutional Neural Network (CNN) and a Temporal module comprised of Gated Recurrent Unit (GRU) and soft-max layers, taking into account the balance between the size of the dataset and the number of model parameters. To train this model, we created a limited Arabic dataset comprising ۲۰ words spoken by ۴۰ native Arabic speakers. At the word level, our proposed method is evaluated on ۱) our dataset, where we obtained an accuracy equal to ۸۳.۰۲%; ۲) the Dweik et al. dataset, where we obtained an improvement rate of ≈ ۳% on the result recorded by their work. In addition, we employed the Visual module for person identification using the viseme image and obtained a high-performance result.
At the sentence level, we modified the same end-to-end model to address the problem from two perspectives: first, as a classification problem, and second, as a sequence prediction problem. The modification is only applied to the Temporal module, while the Visual model remains unchanged. In the classification problem, the Temporal module consists of a stack of GRUs and a fully connected layer. In the sequence prediction problem, the Temporal module is the encoder-decoder network; the encoder consists of three GRU layers, while the decoder consists of two GRU layers with an attention mechanism. To train the end-to-end model, we collected a sentence-level dataset for the Arabic language, comprising ۵۵ sentences with ۱۳۹ unique words uttered by ۴۰ individuals, including ۲۸ declarative sentences, ۲۰ interrogative sentences, and ۷ request sentences. This dataset is the largest sentence-level Arabic language dataset addressing lip-reading problems. We made this dataset involve all ۲۸ phonemes in Arabic; this attribute is only in our dataset and is missing in all previous works for the Arabic language.
For the sentence classification problem, the end-to-end model was first applied to our dataset, yielding recognition accuracies of ۹۰.۴۵% for person-dependent and ۷۱.۵۳% for person-independent experiments. Then, it was used in the BlidAVS۱۰ dataset, and an accuracy of ۸۳.۰۹ was obtained for the person-independent experiment. For the sequence prediction problem, the end-to-end model was applied to our dataset, yielding an ۸۰.۵۱% Word Error Rate (WER).
|
|
|
|
دفعات مشاهده: 891 بار | دفعات چاپ: 144 بار | دفعات ارسال به دیگران: 0 بار | 0 نظر |
|
|
|
|
|
 |
مرجان کرامتی |
 |
|
| تاریخ ارسال: 1404/3/25 | |
|
|
دانشجو مرجان کرامتی دانشجوی دکتری، دکتر ناصر مزینی مورخ: ۱۴۰۴/۰۴/۰۲ساعت: ۱۶:۰۰ از رساله دکتری خود با عنوان " جانمایی کنترلگرها در شبکه هوشمند برق نرم افزار محور با استفاده از سیستم های چندعاملی" دفاع خواهند نمود. |
|
|
|
دفعات مشاهده: 2318 بار | دفعات چاپ: 333 بار | دفعات ارسال به دیگران: 0 بار | 0 نظر |
|
|
|
|
|
 |
حدیث بشیری |
 |
|
| تاریخ ارسال: 1404/2/16 | |
|
|
دانشجو حدیث بشیری دانشجوی دکتری، دکتر حسن نادری مورخ : تاریخ ۱۴۰۴/۰۲/۲۴ ساعت: ۱۲:۳۰ از رساله دکتری خود با عنوان " تشخیص محبوبیت رویداد بر اساس تحلیل دادههای شبکههای اجتماعی برخط" دفاع خواهند نمود. |
|
|
|
دفعات مشاهده: 5213 بار | دفعات چاپ: 830 بار | دفعات ارسال به دیگران: 0 بار | 0 نظر |
|
|
|
|
|
 |
اکرم کلائی |
 |
|
| تاریخ ارسال: 1403/12/14 | |
|
|
دانشجو اکرم کلائی دانشجوی دکتری، دکتر سعید پارسا مورخ : تاریخ ۱۸/۱۲/ ۱۴۰۳ ساعت: ۱۱:۰۰ صبح از رساله دکتری خود با عنوان "تحلیل دامنه و تأثیر آن بر بهبود آزمونپذیری و شرحپذیری سیستمهای سایبر- فیزیکی مبتنی بر یادگیری ماشین " دفاع خواهند نمود. |
|
|
|
دفعات مشاهده: 2631 بار | دفعات چاپ: 360 بار | دفعات ارسال به دیگران: 0 بار | 0 نظر |
|
|
|
|
|
 |
آرمان سان احمدی |
 |
|
| تاریخ ارسال: 1403/8/1 | |
|
|
دانشجو آرمان سان احمدی دانشجوی دکتر محمد عبداللهی ازگمی مورخ : ۱۴۰۳/۱۱/۰۱ ساعت : ۱۶:۳۰ از رساله دکتری خود با عنوان "مدلسازی صوری و ارزیابی کمّی ویژگیهای کیفی اینترنت اشیاء مبتنی بر شبکههای پتری تصادفی " دفاع خواهند نمود. |
|
|
|
دفعات مشاهده: 3190 بار | دفعات چاپ: 483 بار | دفعات ارسال به دیگران: 0 بار | 0 نظر |
|
|
|
|
|
 |
محمد حاجی زاده صفار |
 |
|
| تاریخ ارسال: 1403/8/1 | |
|
|
دانشجو محمد حاجی زاده صفار دانشجوی دکتر عادل ترکمان رحمانی مورخ : ۱۴۰۳/۱۱/۰۸ ساعت: ۸:۰۰ صبح از رساله دکتری خود با عنوان "تشخیص بیدرنگ اشیا در ویدئو بر روی دستگاههای توکار با استفاده از شبکههای عصبی عمیق " دفاع خواهند نمود. |
|
|
|
دفعات مشاهده: 2254 بار | دفعات چاپ: 408 بار | دفعات ارسال به دیگران: 0 بار | 0 نظر |
|
|
|
|
|
 |
سایر مطالب این بخش: |
 |
|
|
|