برق ،الکترونیک و مخابرات

پایان نامه ارتقای فشرده سازی سیگنال با استفاده از چندی کننده های برداری عصبیی

پایان نامه ارتقای فشرده سازی سیگنال با استفاده از چندی کننده های برداری عصبیی چکیده پارامترهای کدکردن براساس پیشبینی خطی یا ضرایب LPC بطور گسترده در فشرده سازی سیگنال گفتار مورد استفاده قرار میگیرد. از سوی دیگر، شبکه های عصبی مصنوعی به عنوان سیستم هوشمندی هستند که میتوانند در سیستمهای خطی و غیر

102 تعداد صفحات

pdf فرمت

1772 KB حجم فایل

9,000 تومان قیمت فایل

فایل با عنوان پایان نامه ارتقای فشرده سازی سیگنال با استفاده از چندی کننده های برداری عصبیی با تعداد 102 صفحه در دسته بندی برق ،الکترونیک و مخابرات با حجم 1772 KB و قیمت 9000 تومان و فرمت فایل pdf با توضیحات مختصر پایان نامه ارتقای فشرده سازی سیگنال با استفاده از چندی کننده های برداری عصبیی چکیده پارامترهای کدکردن براساس پیشبینی خطی یا ضرایب LPC بطور گسترده در فشرده سازی سیگنال گفتار مورد استفاده قرار میگیرد. از سوی دیگر، شبکه های عصبی مصنوعی به عنوان سیستم هوشمندی هستند که میتوانند در سیستمهای خطی و غیر ...و عنوان انگلیسی Dissertation on improving signal compression using neural vector multipliers را می توانید هم اکنون دانلود و استفاده نمایید
پایان نامه ارتقای فشرده سازی سیگنال با استفاده از چندی کننده های برداری عصبیی

توضیحات فایل:

پایان نامه ارتقای فشرده سازی سیگنال با استفاده از چندی کننده های برداری عصبیی

چکیده

پارامترهای کدکردن براساس پیشبینی خطی یا ضرایب LPC بطور گسترده در فشرده سازی سیگنال گفتار مورد استفاده قرار میگیرد. از سوی دیگر، شبکه های عصبی مصنوعی به عنوان سیستم هوشمندی هستند که میتوانند در سیستمهای خطی و غیرخطی مانند کدینگ گفتار و تصویر بکار روند. در این تحقیق دو نمونه از شبکه های عصبی مبتنی بر تکنیک چندی سازی برداری به نامهای شبکه کوهنن و ARTMAP معرفی میشوند، که از آنها برای دسته بندی بردارهای حاصل از پردازش سیگنال گفتار ورودی استفاده میشود، در این تکنیک با استفاده از زوجهای خط طیفی (LSP) بعنوان یک پارامتر قابل جایگزینی بجای ضرایب LPC میتوان نرخ بیت را کاهش داد در حالیکه کیفیت گفتار سنتز شده تقریباً حفظ میشود و این بدلیل این است که وقتی از پارامترهای LSP استفاده میشود، فرکانس های فرمنت (Formant) خوبی بدست می آید که مشابه فرکانسهای اصلی سیگنال گفتار میباشد. با این روش، نرخ بیت با توجه به واکدار یا بی واک بودن قاب گفتار مربوطه بین 2 تا 33 درصد کاهش می یابد. همچنین در این تحقیق شبکه های عصبی کوهنن و نظریه تشدید تطبیقی به عنوان دو شبکه عصبی بدون سرپرست و روش چندی سازی بردارهای یادگیری به عنوان یک شبکه عصبی با سرپرست معرفی و نتایج حاصل از هریک با هم مقایسه میشوند. نمونه های صوتی بکار رفته نیز به زبان فارسی میباشند.

مقدمه

اخیراً اکثر تکنیک هایی که برای فشرده سازی سیگنال گفتار بکار میروند، براساس پیش بینی خطی ساختار یافته اند. سیگنال گفتار بعنوان یک ابزار مهم در ارتباطات انسان در فناوری های دیجیتالی مورد توجه خاص قرار گرفته است. نرخ بیت سیگنال گفتار ارسال شده باید کاهش یابد. سیگنال گفتار یک سیگنال پیوسته و غیرخطی بوده که بصورت فیزیکی توسط لوله صوتی انسان تولید و شکل داده میشود، بنابراین ویژگی های سیگنال گفتار به حرکات لوله صوتی در طول زمان و همچنین مشخصات گوینده بستگی دارد. تبدیل پارامترهای LPC به LSP کارایی کدکننده های با نرخ بیت کم را بهبود میبخشد.

پارامترهای LSP فرکانس های فرمنت لوله صوتی را بصورت ریاضی مدلسازی میکنند. ازسوی دیگر شبکه های عصبی به عنوان ابزاری موفق تاکنون در کاربردهای گوناگونی از پردازش گفتار و زبان مورد استفاده قرار گرفته اند. در این راستا کاربردهای بازشناسی خودکار گفتار (ASR)، سنتز گفتار طبیعی و پردازش زبان طبیعی (NLP) به عنوان نمونه هایی که توسط مؤلف برای زبان فارسی تجربه شده اند، قابل ذکر است. برای کدکننده های گفتار نیز شبکه های عصبی در حوزه کاری مورد استفاده قرار گرفته اند: پیش بینی کننده های نورونی برای بهبود کیفیت و کاهش پیچیدگی محاسباتی در کدکننده ها. در این تحقیق یک روش جدید برای کد کردن گفتار با نرخ بیت کم معرفی میشود که از پارامترهای LSP برای استخراج و نگاشت ویژگیهای سیگنال گفتار با استفاده از نوعی شبکه عصبی مصنوعی بنام شبکه خود سازمانده (SOM) استفاده میکند. استفاده از این روش نرخ بیت گفتار بازسازی شده را کاهش می دهد، در حالی که کیفیت سیگنال تفاوت آشکاری با گفتار اصلی ندارد. برای اندازه گیری کیفیت گفتار سنتز شده از معیار میانگین امتیاز آرا داده شده (MOS) استفاده می شود.

فصل اول: کلیات

1-1) هدف

یکی از ابزارهای ارتباطی انسان، گفتار است. سیستمهای ارتباطی نوین و پیشرفته بطور گستردهای براساس پردازش و ارسال گفتار بنا نهاده شده اند. خطوط تلفن دیجیتال، شبکه های اینترنت، ویدیو کنفرانسها و پیام های صوتی تنها تعدادی از کاربردهای روزمره چنین سیستمهایی است. با وجود چنین کاربردهای وسیعی، ناگزیر نیاز به گفتاری باکیفیت بالا در پهنای باند ارسال کمتر وجود دارد. کار اصلی کدکننده های گفتار پیشرفته، رقمی کردن سیگنال گفتار آنالوگ با استفاده از فرآیند نمونه برداری است. بنابراین یک کدکننده برای تولید شکل کدشده از یک سیگنال گفتار، یک دنباله ی عددی را پردازش میکند. گفتار کد شده بسته به کاربردی که دارد، ارسال یا ذخیره میشود. کار هر واکدکننده نیز بازسازی گفتار اصلی از دنباله های کدشده است. کد کردن گفتار یک فشرده سازی همراه با اتلاف است، یعنی مقداری از کیفیت سیگنال گفتار اصلی در طی عملیات فشرده سازی به ازای کاهش حجم اطلاعات و افزایش سرعت ارسال، کاسته میشود. برای بهبود کیفیت گفتار فشرده شده روشهای مختلفی وجود دارد، در این تحقیق، از یک شبکه عصبی با قابلیت خودسازماندهی برای این کار استفاده شده است. از این شبکه عصبی مصنوعی همان گونه که توضیح داده خواهد شد، برای دسته بندی بردارهای حاصل از پردازش گفتار استفاده میشود. دسته بندی بردارهای بدست آمده از پردازش و چندیسازی گفتار باعث کاهش بیت های بکار رفته در گفتار کد شده و در نتیجه فشرده سازی بیشتر آن میشود، در حالی که کیفیت گفتار حاصل بر اساس معیارهای MOS حفظ می شود.

پروداک فایل

تسهیل در دسترسی به فایل مورد نظر در فروشگاه های فایل دارای نماد اعتماد الکترونیکی

جستجو و دریافت سریع هر نوع فایل شامل: دانشگاهی: مقاله، تحقیق، گزارش کارآموزی، بررسی، نظری، مبانی نظری آموزشی و تدریسی: پاورپوینت، فایل، پروژه، درس‌نامه، طرح درس روزانه، درس پژوهی، یادگیری، آموزش، معلم، دانش‌آموزان، سناریوی آموزشی، بک‌آپ کودک. فناوری و دیجیتال: دانلود، بک‌آپ، ppt، اتوکد، قابل ویرایش، حسابداری، سامسونگ دیجیتال، pdf. روان‌شناسی و علوم تربیتی: پاورپوینت، طرح درس نویسی هنری و طراحی: معماری، عکاسی، وکتور، طراحی سایر: تم تولد، بک‌آپ تولد، ابتدایی، خرید دانلود رایگان، اصول، کورل، بک‌آپ آتلیه