ورود به حساب

نام کاربری گذرواژه

گذرواژه را فراموش کردید؟ کلیک کنید

حساب کاربری ندارید؟ ساخت حساب

ساخت حساب کاربری

نام نام کاربری ایمیل شماره موبایل گذرواژه

برای ارتباط با ما می توانید از طریق شماره موبایل زیر از طریق تماس و پیامک با ما در ارتباط باشید


09117307688
09117179751

در صورت عدم پاسخ گویی از طریق پیامک با پشتیبان در ارتباط باشید

دسترسی نامحدود

برای کاربرانی که ثبت نام کرده اند

ضمانت بازگشت وجه

درصورت عدم همخوانی توضیحات با کتاب

پشتیبانی

از ساعت 7 صبح تا 10 شب

دانلود کتاب Deep Learning Based Speech Quality Prediction

دانلود کتاب پیش بینی کیفیت گفتار مبتنی بر یادگیری عمیق

Deep Learning Based Speech Quality Prediction

مشخصات کتاب

Deep Learning Based Speech Quality Prediction

ویرایش:  
نویسندگان:   
سری: T-Labs Series in Telecommunication Services 
ISBN (شابک) : 303091478X, 9783030914783 
ناشر: Springer 
سال نشر: 2022 
تعداد صفحات: 170
[171] 
زبان: English 
فرمت فایل : PDF (درصورت درخواست کاربر به PDF، EPUB یا AZW3 تبدیل می شود) 
حجم فایل: 7 Mb 

قیمت کتاب (تومان) : 43,000



ثبت امتیاز به این کتاب

میانگین امتیاز به این کتاب :
       تعداد امتیاز دهندگان : 8


در صورت تبدیل فایل کتاب Deep Learning Based Speech Quality Prediction به فرمت های PDF، EPUB، AZW3، MOBI و یا DJVU می توانید به پشتیبان اطلاع دهید تا فایل مورد نظر را تبدیل نمایند.

توجه داشته باشید کتاب پیش بینی کیفیت گفتار مبتنی بر یادگیری عمیق نسخه زبان اصلی می باشد و کتاب ترجمه شده به فارسی نمی باشد. وبسایت اینترنشنال لایبرری ارائه دهنده کتاب های زبان اصلی می باشد و هیچ گونه کتاب ترجمه شده یا نوشته شده به فارسی را ارائه نمی دهد.


توضیحاتی در مورد کتاب پیش بینی کیفیت گفتار مبتنی بر یادگیری عمیق

این کتاب نحوه استفاده از روش‌های اخیر یادگیری ماشینی (یادگیری عمیق) را برای پیش‌بینی کیفیت گفتار ارائه می‌دهد. نویسنده نشان می‌دهد که چگونه می‌توان از پیشرفت‌های اخیر در یادگیری ماشین برای پیش‌بینی کیفیت گفتار استفاده کرد و تحلیل عمیقی از مناسب بودن معماری‌های مختلف یادگیری عمیق برای این کار ارائه می‌دهد. سپس نویسنده نشان می‌دهد که چگونه مدل به‌دست‌آمده از مدل‌های کیفیت گفتار سنتی بهتر عمل می‌کند و اطلاعات بیشتری درباره علت اختلال کیفیت از طریق پیش‌بینی ابعاد کیفیت گفتار نویز، رنگ‌آمیزی، ناپیوستگی و بلندی صدا ارائه می‌دهد.

< /p>


توضیحاتی درمورد کتاب به خارجی

This book presents how to apply recent machine learning (deep learning) methods for the task of speech quality prediction. The author shows how recent advancements in machine learning can be leveraged for the task of speech quality prediction and provides an in-depth analysis of the suitability of different deep learning architectures for this task. The author then shows how the resulting model outperforms traditional speech quality models and provides additional information about the cause of a quality impairment through the prediction of the speech quality dimensions of noisiness, coloration, discontinuity, and loudness.


فهرست مطالب

Preface
Acknowledgments
Contents
Acronyms
1 Introduction
	1.1 Motivation
	1.2 Thesis Objectives and Research Questions
	1.3 Outline
2 Quality Assessment of Transmitted Speech
	2.1 Speech Communication Networks
	2.2 Speech Quality and Speech Quality Dimensions
	2.3 Subjective Assessment
	2.4 Subjective Assessment via Crowdsourcing
	2.5 Traditional Instrumental Methods
		2.5.1 Parametric Models
		2.5.2 Double-Ended Signal-Based Models
		2.5.3 Single-Ended Signal-Based Models
	2.6 Machine Learning Based Instrumental Methods
		2.6.1 Non-Deep Learning Machine Learning Approaches
		2.6.2 Deep Learning Architectures
		2.6.3 Deep Learning Based Speech Quality Models
	2.7 Summary
3 Neural Network Architectures for Speech Quality Prediction
	3.1 Dataset
		3.1.1 Source Files
		3.1.2 Simulated Distortions
		3.1.3 Live Distortions
		3.1.4 Listening Experiment
	3.2 Overview of Neural Network Model
	3.3 Mel-Spec Segmentation
	3.4 Framewise Model
		3.4.1 CNN
		3.4.2 Feedforward Network
	3.5 Time-Dependency Modelling
		3.5.1 LSTM
		3.5.2 Transformer/Self-Attention
	3.6 Time Pooling
		3.6.1 Average-/Max-Pooling
		3.6.2 Last-Step-Pooling
		3.6.3 Attention-Pooling
	3.7 Experiments and Results
		3.7.1 Training and Evaluation Metric
		3.7.2 Framewise Model
		3.7.3 Time-Dependency Model
		3.7.4 Pooling Model
	3.8 Summary
4 Double-Ended Speech Quality Prediction Using Siamese Networks
	4.1 Introduction
	4.2 Method
		4.2.1 Siamese Neural Network
		4.2.2 Reference Alignment
		4.2.3 Feature Fusion
	4.3 Results
		4.3.1 LSTM vs Self-Attention
		4.3.2 Alignment
		4.3.3 Feature Fusion
		4.3.4 Double-Ended vs Single-Ended
	4.4 Summary
5 Prediction of Speech Quality Dimensions with Multi-TaskLearning
	5.1 Introduction
	5.2 Multi-Task Models
		5.2.1 Fully Connected (MTL-FC)
		5.2.2 Fully Connected + Pooling (MTL-POOL)
		5.2.3 Fully Connected + Pooling + Time-Dependency(MTL-TD)
		5.2.4 Fully Connected + Pooling + Time-Dependency + CNN (MTL-CNN)
	5.3 Results
		5.3.1 Per-Task Evaluation
		5.3.2 All-Tasks Evaluation
		5.3.3 Comparing Dimension
		5.3.4 Degradation Decomposition
	5.4 Summary
6 Bias-Aware Loss for Training from Multiple Datasets
	6.1 Method
		6.1.1 Learning with Bias-Aware Loss
		6.1.2 Anchoring Predictions
	6.2 Experiments and Results
		6.2.1 Synthetic Data
		6.2.2 Minimum Accuracy rth
		6.2.3 Training Examples with and Without Anchoring
		6.2.4 Configuration Comparisons
		6.2.5 Speech Quality Dataset
	6.3 Summary
7 NISQA: A Single-Ended Speech Quality Model
	7.1 Datasets
		7.1.1 POLQA Pool
		7.1.2 ITU-T P Suppl. 23
		7.1.3 Other Datasets
		7.1.4 Live-Talking Test Set
	7.2 Model and Training
		7.2.1 Model
		7.2.2 Bias-Aware Loss
		7.2.3 Handling Missing Dimension Ratings
		7.2.4 Training
	7.3 Results
		7.3.1 Evaluation Metrics
		7.3.2 Validation Set Results: Overall Quality
		7.3.3 Validation Set Results: Quality Dimensions
		7.3.4 Test Set Results
		7.3.5 Impairment Level vs Quality Prediction
	7.4 Summary
8 Conclusions
A Dataset Condition Tables
B Train and Validation Dataset Dimension Histograms
References
Index




نظرات کاربران