کلمات کلیدی مربوط به کتاب بهبود در سنتز گفتار: علوم و مهندسی کامپیوتر، پردازش داده رسانه، پردازش صدا، پردازش گفتار
در صورت تبدیل فایل کتاب Improvements in Speech Synthesis به فرمت های PDF، EPUB، AZW3، MOBI و یا DJVU می توانید به پشتیبان اطلاع دهید تا فایل مورد نظر را تبدیل نمایند.
توجه داشته باشید کتاب بهبود در سنتز گفتار نسخه زبان اصلی می باشد و کتاب ترجمه شده به فارسی نمی باشد. وبسایت اینترنشنال لایبرری ارائه دهنده کتاب های زبان اصلی می باشد و هیچ گونه کتاب ترجمه شده یا نوشته شده به فارسی را ارائه نمی دهد.
Издательство John Wiley, 2002, -407 pp.
اینکه ماشین ها مانند
انسان صحبت کنند رویایی است که کم کم در حال تحقق است. هنگامی که
بیست سال پیش اولین صداهای کامپیوتری خودکار از آزمایشگاههای
آنها پدیدار شد، کیفیت صدای روباتیک آنها به شدت استفاده عمومی
آنها را کاهش داد. اما اکنون پس از یک دوره طولانی بلوغ، گفتار
مصنوعی شروع به رسیدن به سطح اولیه مقبولیت می کند. برخی از
سیستمها آنقدر خوب هستند که حتی به این فکر میکنید که آیا ضبط
معتبر بوده یا ساخته شده است.
تلاش برای رسیدن به این نقطه قابل توجه بوده است. انواع
فنآوریهای کاملاً متفاوت باید توسعه داده میشد و عمیقاً مورد
بررسی قرار میگرفت، که نیازمند مهارتها و تلاشهای بینرشتهای
در ریاضیات، پردازش سیگنال، زبانشناسی، آمار، آواشناسی و چندین
زمینه دیگر بود. خلاصه کنونی در تحقیق در مورد سنتز گفتار کاملاً
نمایانگر این تلاش است، زیرا کارهایی را در زمینه پردازش سیگنال و
همچنین در زبانشناسی و علوم آوایی ارائه میکند، که با هدف صریح
دستیابی به درجه طبیعی بیشتر در گفتار سنتز شده انجام شده
است.
اما بیش از توصیف وضعیت موجود، حجم فعلی راه را به آینده نشان می
دهد. محققانی که در اینجا گردآوری شدهاند، عموماً موافقند که
وضعیت فعلی و فزایندهای سالم سنتز گفتار به هیچ وجه پایان یک
توسعه فناوری نیست، بلکه نقطه شروع عالی است. برای ایجاد تنوع و
انعطافپذیری بیشتر برای صداهای مصنوعی ما هنوز به کار بیشتری
نیاز است تا بتوان از آنها در مجموعه وسیعتری از برنامههای
روزمره استفاده کرد. این همان چیزی است که حجم کنونی با جزئیات
مشخص میشود.
کار در پردازش سیگنال شاید برای موفقیت بیشتر سنتز گفتار بسیار
مهم باشد، زیرا شالوده نظری و فناوری را برای پیشرفتهای آینده
میسازد. اما در پشت سر، تحقیقات گستردهتری در مورد عروض و
سبکهای گفتار دنبال میشود، کارهایی که انواع صداهایی را که
متناسب با زمینههای مختلف هستند، ردیابی میکند. و در نهایت، کار
بر روی رابطهای کاربری استاندارد شده فزاینده در قالب گزینههای
سیستم و نشانهگذاری متن، امکان باز کردن ترکیب گفتار را برای طیف
گستردهای از افراد غیرمتخصص فراهم میکند
تحقیق منتشر شده در اینجا از چهار مورد بیرون میآید. سال پروژه
COST 258 اروپا که عمدتاً برای گردآوری نویسندگان این جلد در
مجموعه ای از جلسات دو بار در سال از سال 1997 تا 2001 خدمت کرده
است.
بخش 1 مسائل
مربوط به تولید سیگنال
به سوی طبیعی بودن بیشتر
به سوی سیستم های تولید سیگنال همه کاره تر
مدل هارمونیک پارامتریک + نویز
آرایه آزمایشی تولید سیگنال COST 258
متن پیوسته سنتز -به گفتار بر اساس مدلسازی سینوسی
تغییر زیر و بمی شکل ثابت و مقیاس زمانی گفتار بر اساس مدل
هارمونیک
سنتز همبسته گفتار با استفاده از SRELP
بخش 2 مسائل در عروض</ strong>
عروض در گفتار مصنوعی
خلاصه پیشرفته تحقیق و توسعه عروضی مصنوعی اروپایی
مدل سازی F0 به زبان های مختلف عاشقانه
آکوستیک خصوصیات هجای تونیک در پرتغالی
پارامترهای عروضی چک مصنوعی
MFGI، یک مدل کمی با انگیزه زبانی از عروض آلمانی
پیشرفت در مدلسازی کانتور F0 برای انواع مختلف واحدهای
لحنی به زبان اسلوانسی
نماینده ریتم گفتار
ملاحظات آوایی و زمانبندی در سیستم TTS آلمان عالی سوئیس
توسعه مدلهای عروضی بر اساس پیکره در 6 زبان
کاهش صدادار در گفتار خواندنی آلمانی< br/>بخش سوم
مسائل مربوط به سبکهای گفتار
تغییرپذیری و سبکهای گفتار در ترکیب گفتار
تحلیل شنیداری عروضی سبکهای گفتار سریع و آهسته در انگلیسی،
هلندی و آلمانی
مدل سازی خودکار عروضی زبان گالیسی و کاربرد آن در
اسپانیایی
فرایندهای کاهش و جذب در مفاهیم گفتار فرانسوی مکالمه برای ترکیب
گفتار
الگوهای آکوستیک احساسات
نقش زیر و بم و تمپو در گفتار عاطفی اسپانیایی< br/>کیفیت
صدا و ترکیب افکت
پارامترهای عروضی سبک صحبتی \"Fun\"
دینامیک سیگنال منبع گلوتال
مولفه ریتمیک غیرخطی در سبک های مختلف گفتار
بخش 4 مسائل مربوط به بخش بندی و نشانه
گذاری
مشکلات مربوط به تقسیم بندی و نشانه گذاری
استفاده و پتانسیل نشانه گذاری توسعه پذیر (XML) در تولید
گفتار
نشانه گذاری برای سنتز گفتار
تجزیه و تحلیل خودکار عروض برای مجموعه گفتار چند زبانه
تقسیم بندی خودکار گفتار بر اساس تراز با سیستم متن به
گفتار
استفاده از COST 249 تشخیص دهنده گفتار مرجع برای گفتار
خودکار
بخش 5 چالش های آینده
چالش های آینده
به سوی طبیعی بودن یا چالش ذهنیت
ترکیب در سیستم های چندوجهی
ابزار ترکیب گفتار چند وجهی اعمال شد به عروض صوتی و تصویری
طراحی رابط برای سیستمهای سنتز گفتار
Издательство John Wiley, 2002, -407 pp.
Making machines speak like humans is
a dream that is slowly coming to fruition. When the first
automatic computer voices emerged from their laboratories
twenty years ago, their robotic sound quality severely
curtailed their general use. But now after a long period of
maturation, synthetic speech is beginning to reach an initial
level of acceptability. Some systems are so good that one even
wonders if the recording was authentic or manufactured.
The effort to get to this point has been considerable. A
variety of quite different technologies had to be developed
perfected and examined in depth, requiring skills and
interdisciplinary efforts in mathematics, signal processing,
linguistics, statistics, phonetics and several other fields.
The current compendium in research on speech synthesis is quite
representative of this effort, in that it presents work in
signal processing as well as in linguistics and the phonetic
sciences, performed with the explicit goal of arriving at a
greater degree of naturalness in synthesised speech.
But more than just describing the status quo, the current
volume points the way to the future. The researchers assembled
here generally concur that the current, increasingly healthy
state of speech synthesis is by no means the end of a
technological development, much rather that it is an excellent
starting point. A great deal more work is still needed to bring
about much greater variety and flexibility to our synthetic
voices, so that they can be used in a much wider set of
everyday applications. That is what the current volume traces
out in some detail.
Work in signal processing is perhaps the most crucial for the
further success of speech synthesis, since it lays the
theoretical and technological foundation for developments to
come. But right behind follows more extensive research on
prosody and styles of speech, work which will trace out the
types of voices that will be appropriate to a variety of
contexts. And finally, work on the increasingly standardised
user interfaces in the form of system options and text mark-up
is making it possible to open speech synthesis to a wide
variety of non-specialist
The research published here emerges from the four-year European
COST 258 project which has served primarily to assemble the
authors of this volume in a set of twice-yearly meetings from
1997 to 2001.
Part 1 Issues in Signal
Generation
Towards Greater Naturalness
Towards More Versatile Signal Generation Systems
Parametric Harmonic + Noise Model
COST 258 Signal Generation Test Array
Concatenative Text-to-Speech Synthesis Based on Sinusoidal
Modelling
Shape Invariant Pitch & Time-Scale Modification of Speech Based
on Harmonic Model
Concatenative Speech Synthesis using SRELP
Part 2 Issues in Prosody
Prosody in Synthetic Speech
State-of-the-Art Summary of European Synthetic Prosody
R&D
Modelling F
0 in Various Romance Languages
Acoustic Characterisation of Tonic Syllable in Portuguese
Prosodic Parameters of Synthetic Czech
MFGI, a Linguistically Motivated Quantitative Model of German
Prosody
Improvements in Modelling F
0 Contour for Different
Types of Intonation Units in Slovence
Representing Speech Rhythm
Phonetic & Timing Considerations in Swiss High German TTS
System
Corpus-Based Development of Prosodic Models across 6
Languages
Vowel Reduction in German Read Speech
Part 3 Issues in Styles of Speech
Variability & Speaking Styles in Speech Synthesis
Auditory Analysis of Prosody of Fast & Slow Speech Styles in
English, Dutch & German
Automatic Prosody Modelling of Galician & its Application to
Spanish
Reduction & Assimilatory Processes in Conversational French
Speech Implications for Speech Synthesis
Acoustic Patterns of Emotions
Role of Pitch & Tempo in Spanish Emotional Speech
Voice Quality & Synthesis of Affect
Prosodic Parameters of "Fun" Speaking Style
Dynamics of Glottal Source Signal
Nonlinear Rhythmic Component in Various Styles of Speech
Part 4 Issues in Segmentation & Mark-Up
Issues in Segmentation & Mark-Up
Use & Potential of Extensible Mark-Up (XML) in Speech
Generation
Mark-Up for Speech Synthesis
Automatic Analysis of Prosody for Multi-Lingual Speech
Corpora
Automatic Speech Segmentation Based on Alignment with
Text-to-Speech System
Using COST 249 Reference Speech Recogniser for Automatic Speech
Segmentation
Part 5 Future Challenges
Future Challenges
Towards Naturalness or Challenge of Subjectiveness
Synthesis within Multi-Modal Systems
Multi-Modal Speech Synthesis Tool applied to Audio-Visual
Prosody
Interface Design for Speech Synthesis Systems