کلمات کلیدی مربوط به کتاب گفتار غیر معمول: علوم و مهندسی کامپیوتر، پردازش داده رسانه، پردازش صدا، پردازش گفتار
در صورت تبدیل فایل کتاب Atypical Speech به فرمت های PDF، EPUB، AZW3، MOBI و یا DJVU می توانید به پشتیبان اطلاع دهید تا فایل مورد نظر را تبدیل نمایند.
توجه داشته باشید کتاب گفتار غیر معمول نسخه زبان اصلی می باشد و کتاب ترجمه شده به فارسی نمی باشد. وبسایت اینترنشنال لایبرری ارائه دهنده کتاب های زبان اصلی می باشد و هیچ گونه کتاب ترجمه شده یا نوشته شده به فارسی را ارائه نمی دهد.
مجله EURASIP در مورد پردازش صدا، گفتار و موسیقی، 2010، -90 ص.
یکی از مهمترین جنبه های
زبان گفتاری درجه تنوع زیاد آن است. تنوع در گفتار توسط منابع
مختلف ایجاد می شود، به عنوان مثال، تغییرات محیط صوتی یا کانال
انتقال و تفاوت بین بلندگوها یا سبک های مختلف صحبت کردن.
سیستمهای پردازش گفتار موفق معمولاً چندین ابزار مختلف را برای
مقابله با تغییرپذیری ناخواسته سیگنال ورودی ترکیب میکنند. در دو
دهه گذشته، پیشرفت زیادی در زمینههای نرمالسازی ویژگی، مدلسازی
آکوستیک مستقل از بلندگو و سازگار با سخنران و روشهای برآورد قوی
برای مدلهای زبان آماری صورت گرفته است. این منجر به بسیاری از
کاربردهای مفید پردازش گفتار شده است، مانند سیستم های گفتگوی
گفتاری که به شبکه تلفن متصل هستند، دیکته پزشکی، رونویسی اخبار
پخش شده، یا ورودی مقصد گفتاری برای سیستم های ناوبری در ماشین.
متأسفانه، الگوریتمهای مورد استفاده در سیستمهای فعلی برای
مدلسازی قوی، نرمالسازی بلندگو و تطبیق محدودیتهای زیادی
دارند، بهویژه برای گفتاری که به طور قابلتوجهی از دادههای
مجموعه آموزشی منحرف میشود. سخنرانان غیرمعمول مانند سخنرانان
غیربومی، کودکان یا اعضای جمعیت سالخورده همچنان به نرخ خطای
بسیار بالاتری در تشخیصدهندههای گفتار پیشرفته نسبت به سخنرانان
عادی یا معمولی بزرگسالان منجر میشوند.
این امر کاربردهای عملی را محدود میکند. پردازش خودکار گفتار به
طور قابل توجهی به عنوان مثال، یک سیستم گفتگوی گفتاری باید
بتواند هر کاربر را درک کند، حتی اگر او متعلق به جمعیت سالمند
باشد. علاوه بر این، سیستم باید بتواند در صورت تغییر حالت عاطفی
کاربر، به شیوه ای مناسب واکنش نشان دهد. یک نرم افزار برای
یادگیری زبان به کمک رایانه باید بتواند با گفتار غیربومی مقابله
کند.
از آنجایی که تحقیقات در گذشته بیشتر بر گفتار معمولی متمرکز شده
بود تا گفتار غیر معمول، برخی از سؤالات مهم در این زمینه هنوز تا
حد زیادی بی پاسخ هستند. به عنوان مثال، هنوز تعریف خوبی از واژه
گفتار غیر معمول وجود ندارد. مقالههایی که در این شماره ویژه
ارائه میکنیم به بررسی گفتار سخنرانان دارای معلولیت، گفتار
غیربومی، گفتار کودکان، گفتار سالمندان، گفتار با محتوای احساسی و
آواز میپردازد. برای بسیاری از انواع تنوع، دلایل افزایش نرخ خطا
هنوز ناشناخته است. علاوه بر این، مشخص نیست که آیا نرخ خطا را می
توان با جمع آوری مقادیر کافی از داده های آموزشی (یا انطباق)
کاهش داد یا اینکه آیا روش های پردازش جدید باید توسعه یابد.
امیدواریم مقالات این ویژه نامه به پیشروی در جهت پاسخگویی به این
سوالات کمک کند. اکثر مقالات تأثیر گفتار غیر معمول بر عملکرد
تشخیص خودکار گفتار را با جزئیات زیاد تجزیه و تحلیل میکنند و
روشهای مختلفی برای کاهش نرخ خطا برای گفتار غیر معمول پیشنهاد و
ارزیابی میشوند. دو مقاله بررسی میکنند که چگونه میتوان
کیفیتهای مختلف صدا را بهطور خودکار تشخیص داد.
گفتار غیر معمول
درباره تأثیر گفتار عاطفی کودکان بر مدلهای آکوستیک و زبان
صداهای پیر: تأثیر تغییر در پارامترهای صدا بر عملکرد ASR
تشخیص خودکار اشعار در آواز خواندن
کاوش در تأثیر تفاوت ها در همبستگی های صوتی گفتار بزرگسالان و
کودکان در زمینه گفتار خودکار< Recog br/>بهینه سازی تشخیص
خودکار گفتار برای افراد غیر بومی با مهارت کم
سیستم های تشخیص خودکار گفتار برای ارزیابی اختلالات گفتار و صدا
در سرطان سر و گردن
تجزیه و تحلیل نقش ها و دینامیک تنفس و کیفیت صدای زمزمه در گفتار
دیالوگ
EURASIP Journal on Audio, Speech, and Music Processing, 2010,
-90 pp.
One of the most important aspects of
spoken language is its large degree of variability. Variability
in speech is caused by many different sources, for instance,
changes of the acoustic environment or transmission channel and
differences between speakers or various speaking styles.
Successful speech processing systems typically combine several
different means to cope with the unwanted variability of the
input signal. In the last two decades, large progress has been
made in the areas of feature-normalization, speaker-independent
and speaker-adaptive acoustic modeling, and robust estimation
methods for statistical language models. This has led to many
useful applications of speech processing, like spoken dialogue
systems that are connected to the telephone network, medical
dictation, broadcast news transcription, or spoken destination
entry for navigation systems in the car. Unfortunately, the
algorithms used in current systems for robust modeling, speaker
normalization and adaptation have many limitations, in
particular for speech that deviates significantly from the data
in the training corpus. Atypical speakers like nonnative
speakers, children, or members of the elderly population still
lead to much higher error rates in state-of-the-art speech
recognizers than normal, or typical, adult native
speakers.
This limits the practical applications of automatic speech
processing significantly. For instance, a spoken dialogue
system should be able to understand any user, even if he or she
belongs to the elderly population. Furthermore, the system
should be able to react in an adequate manner if the user’s
emotional state changes. A software for computer-aided language
learning needs to be able to cope with nonnative speech.
As research in the past has concentrated more on typical speech
than on atypical speech, some important questions in this area
are still largely unanswered. For instance, there is no good
definition of the term atypical speech yet. The articles we
present in this special issue investigate speech from speakers
with disabilities, nonnative speech, children’s speech, speech
from the elderly, speech with emotional content and singing.
For many types of variability, the reasons for the increased
error rates are still unknown. Furthermore, it is unclear
whether the error rates could be reduced by collecting adequate
amounts of training (or adaptation) data or whether novel
processing methods have to be developed. We hope that the
papers in this special issue help to advance in the direction
of getting an answer to these questions. The majority of the
articles analyses the influence of atypical speech on automatic
speech recognition performance in great detail, and different
methods to reduce the error rates for atypical speech are
proposed and evaluated. Two papers investigate how different
voice qualities can be distinguished automatically.
Atypical Speech
On the Impact of Children’s Emotional Speech on Acoustic and
Language Models
Ageing Voices: The Effect of Changes in Voice Parameters on ASR
Performance
Automatic Recognition of Lyrics in Singing
Exploring the Effect of Differences in the Acoustic Correlates
of Adults’ and Children’s Speech in the Context of Automatic
Speech Recognition
Optimizing Automatic Speech Recognition for Low-Proficient
Non-Native Speakers
Automatic Speech Recognition Systems for the Evaluation of
Voice and Speech Disorders in Head and Neck Cancer
Analysis of the Roles and the Dynamics of Breathy and Whispery
Voice Qualities in Dialogue Speech