[صفحه اصلی ]   [ English ]  
بخش‌های اصلی
درباره دانشکده::
مدیریت دانشکده::
اعضای هیات علمی ::
معرفی افراد::
امور آموزش::
امور پژوهشی::
آموزش الکترونیکی::
پردیس شماره 2::
اخبار و رویدادها::
فضاهای آموزشی و تحقیقاتی ::
تسهیلات پایگاه::
::
ورود به سایت دروس

AWT IMAGE

نام کاربری
کلمه عبور

AWT IMAGE
رمز ورود را فراموش کرده‌اید؟

..
دفاعیه کارشناسی ارشد

دفاعیه کارشناسی ارشد

..
جستجو در پایگاه

جستجوی پیشرفته
..
دریافت اطلاعات پایگاه
نشانی پست الکترونیک خود را برای دریافت اطلاعات و اخبار پایگاه، در کادر زیر وارد کنید.
..
:: آرین تقوی منش ::
 | تاریخ ارسال: ۱۳۹۴/۸/۲۶ | 

AWT IMAGE

  آقای آرین تقوی منش دانشجوی کارشناسی ارشد آقای دکتر احمد اکبری روز سه شنبه 94/08/26 ساعت 17:30 در اتاق سمینار واقع در طبقه سوم دانشکده کامپیوتر از پروژه کارشناسی ارشد خود تحت عنوان بهبود روش های بازنمایی موسیقی برای شناسایی مبتنی بر محتوای صوت دفاع نمود.

چکیده

امروزه شناسایی و تحلیل و بازیابی اطلاعات موسیقی یکی از مسائل مهم به­شمار می­آید. با توجه به گسترش اینترنت و پیدایش انواع شبکه­های اجتماعی و تجاری در آن، کاربران و گرداننده این شبکه­ها از وجود یک سیستم اتوماتیک که وظیفه آن شناسایی و برچسب زنی موسیقی است، سود می­برند.لذا سیستم­های مبتنی بر محتوای صوت برای انجام شناسایی موسیقی طراحی شده­اند. سیستم شناسایی با اثرانگشت صوتی و شناسایی نسخه باز اجرا در حوزه شناسایی موسیقی مبتنی بر تحلیل محتوای صوت وجود دارند. لذا در راستای بهبود روش­های بازنمایی موسیقی در الگوریتم­های مبتنی بر محتوای صوت، در این پایان­نامه به بررسی بخش­های مختلف سیستم شناسایی باز اجرا پرداخته شده تا بتوان با بهبود بازنمایی موسیقی و سایر بخش­های آن، میزان دقت شناسایی را افزایش داد.

برای بهبود بازنمایی در سیستم شناسایی نسخه باز اجرا موسیقی، ایده استفاده از مد موسیقی در کنار ویژگی کروما ضرب-هم­زمان پیشنهاد شده است. برای استخراج مد یک روش مبتنی بر نمایه کلید ارائه شده است که از فاصله کسینوسی بین بردار نرمال شده حاصل از جمع ویژگی در طول زمان و ردیف­های ماتریس نمایه استفاده می­کند. برای ارزیابی این بازنمایی، از اطلاعات مد استخراج شده در دو سیستم که رویکرد متفاوتی در بخش محاسبه شباهت دارند استفاده شده است.

در رویکرد اول برای مقابله با تغییرات کلید بین نسخه­های آهنگ، از روش اندیس بهینه ترانهش (OTI) برای پیدا کردن میزان اختلاف کلید میان آهنگ مرجع و آهنگ پرس­ و جو و برای محاسبه شباهت از تابع همبستگی متقابل استفاده شده است.

در رویکرد دوم برای اندازه گیری میزان شباهت، همبستگی متقابل دوبعدی پیشنهاد شده است. تابع همبستگی متقابل دو بعدی خاصیت نامتغیر بودن به کلید دارد. لذا نیازی به انجام محاسبات تخمین کلید نیست. رویکرد اول و دوم میزان دقت %50 و% 5/52 در مجموعه داده 80CoverSet و دقت %33/63 و %33/63 در مجموعه داده  Ahonen داشته است. که نسبت به الگوریتم پایه به مقدار %5/7 و %10 در مجموعه داده 80CoverSet و مقدار %66/6 و %66/6 در مجموعه داده Ahonen بهبود داشته است. آزمایش­ها و نتایج ارزیابی نشان می­دهد که رویکرد دوم عملکرد بهتری از نظر دقت شناسایی نسبت به رویکرد اول دارد.

واژه‌های کلیدی: شناسایی مبتنی بر محتوای صوت، نسخه باز اجرا موسیقی، ویژگی کروما، مد موسیقی، ویژگی ضرب­ هم­زمان

Abstract

Nowadays, identification, analysis and retrieval of music is one of the most important aspects which we are facing it. By development of Internet network and appearance of many social and business networks, everyone can benefit of a system designed to identify and tag music. From this point of view, content based audio recognition has been introduced to achieve this goal. Audio fingerprint and cover version identification systems are known examples in the area of audio content-based identification. Therefore, in this thesis, we study different parts of cover identification system to provide some improvements on music representation and its other parts in order to increase accuracy.

To improve representation in music cover identification system, we have introduced the idea of using music mode beside beat-synchronous Chroma. In order to extract the mode of music, we have used a method based on key profile in which the cosine distance between the normalized vector of the feature summation along time and the rows of profile matrix is calculated. To evaluate this representation, the information of extracted mode is used in two systems which have different approaches for calculating similarity.

In the first approach, to deal with the changes of key among the different versions of a music, we have used OTI (optimized transposition index) to measure difference between reference music and the query music. Also, for calculating similarity, we have used cross-correlation function.

In the second approach, in order to calculate the similarity, the two dimensional cross-correlation function is proposed. The two dimensional cross- correlation is invariant to the key, so we do not need any calculation to approximate the key.

The first and the second approaches have accuracy of 50% and 52.5% on 80CoverSet dataset, respectively and also 63.33% and 63.33% on Ahonen dataset, respectively. In comparison to the base-line algorithm, we have obtained improvement as of 7.5% and 10% on 80CoverSet dataset and 6.66% and 6.66% on Ahonen dataset, respectively using the first and second proposed methods. Experiments and evaluation results show that second approach has better performance than the first approach in terms of accuracy.

Keywords: Audio content-based identification, Music cover version, Chroma feature, Beat-Synchronous feature, Music mode

 

آرین تقوی منش

    رشته مهندسی کامپیوتر- هوش مصنوعی

  استاد راهنما:

  دکتر احمد اکبری

  استاد داور داخلی: دکتر ناصر مزینی

  استاد داور خارجی : دکتر محمدمهدی همایون پور

  تاریخ دفاع: سه شنبه 26 آبانماه 94

  زمان:ساعت 17:30

 

  مکان: دانشکده مهندسی کامپیوتر- طبقه سوم- اتاق سمینار

 از اساتید بزرگوار، دانشجویان گرامی و دیگر متخصصان و علاقه مندان به موضوع دفاعیه دعوت
می شود با حضور خود موجبات غنای علمی و ارتقای کیفی را فراهم سازند.

 

  دانشکده مهندسی کامپیوتر مدیریت تحصیلات تکمیلی

 

 

 

 

 

 

دفعات مشاهده: 1104 بار   |   دفعات چاپ: 350 بار   |   دفعات ارسال به دیگران: 0 بار   |   0 نظر
سایر مطالب این بخش سایر مطالب این بخش نسخه قابل چاپ نسخه قابل چاپ ارسال به دوستان ارسال به دوستان
School of Computer Engineering
Persian site map - English site map - Created in 0.178 seconds with 969 queries by yektaweb 3470