ورود به حساب

نام کاربری گذرواژه

گذرواژه را فراموش کردید؟ کلیک کنید

حساب کاربری ندارید؟ ساخت حساب

ساخت حساب کاربری

نام نام کاربری ایمیل شماره موبایل گذرواژه

برای ارتباط با ما می توانید از طریق شماره موبایل زیر از طریق تماس و پیامک با ما در ارتباط باشید


09117307688
09117179751

در صورت عدم پاسخ گویی از طریق پیامک با پشتیبان در ارتباط باشید

دسترسی نامحدود

برای کاربرانی که ثبت نام کرده اند

ضمانت بازگشت وجه

درصورت عدم همخوانی توضیحات با کتاب

پشتیبانی

از ساعت 7 صبح تا 10 شب

دانلود کتاب Machine Learning with PySpark: With Natural Language Processing and Recommender Systems

دانلود کتاب یادگیری ماشین با PySpark: با پردازش زبان طبیعی و سیستم‌های توصیه‌کننده

Machine Learning with PySpark: With Natural Language Processing and Recommender Systems

مشخصات کتاب

Machine Learning with PySpark: With Natural Language Processing and Recommender Systems

ویرایش: [2 ed.] 
نویسندگان:   
سری:  
ISBN (شابک) : 1484277767, 9781484277768 
ناشر: Apress 
سال نشر: 2021 
تعداد صفحات: 238 
زبان: English 
فرمت فایل : EPUB (درصورت درخواست کاربر به PDF، EPUB یا AZW3 تبدیل می شود) 
حجم فایل: 12 Mb 

قیمت کتاب (تومان) : 50,000



ثبت امتیاز به این کتاب

میانگین امتیاز به این کتاب :
       تعداد امتیاز دهندگان : 6


در صورت تبدیل فایل کتاب Machine Learning with PySpark: With Natural Language Processing and Recommender Systems به فرمت های PDF، EPUB، AZW3، MOBI و یا DJVU می توانید به پشتیبان اطلاع دهید تا فایل مورد نظر را تبدیل نمایند.

توجه داشته باشید کتاب یادگیری ماشین با PySpark: با پردازش زبان طبیعی و سیستم‌های توصیه‌کننده نسخه زبان اصلی می باشد و کتاب ترجمه شده به فارسی نمی باشد. وبسایت اینترنشنال لایبرری ارائه دهنده کتاب های زبان اصلی می باشد و هیچ گونه کتاب ترجمه شده یا نوشته شده به فارسی را ارائه نمی دهد.


توضیحاتی در مورد کتاب یادگیری ماشین با PySpark: با پردازش زبان طبیعی و سیستم‌های توصیه‌کننده



بر ویژگی های جدید PySpark 3.1 تسلط پیدا کنید تا برنامه های کاربردی هوشمند و مبتنی بر داده را توسعه دهید. این نسخه به‌روزرسانی شده موضوعاتی از ساخت مدل‌های یادگیری ماشینی مقیاس‌پذیر، پردازش زبان طبیعی، تا سیستم‌های توصیه‌گر را پوشش می‌دهد.

آموزش ماشین با PySpark، نسخه دوم با اصول Apache Spark آغاز می‌شود. ، از جمله آخرین به روز رسانی های چارچوب. در مرحله بعد، طیف کاملی از پیاده‌سازی الگوریتم‌های یادگیری ماشین سنتی، همراه با پردازش زبان طبیعی و سیستم‌های توصیه‌گر را خواهید آموخت. شما با فرآیند حیاتی انتخاب الگوریتم‌های یادگیری ماشین، جذب داده‌ها و پردازش داده‌ها برای حل مشکلات تجاری آشنا خواهید شد. نمایشی از نحوه ساخت مدل‌های یادگیری ماشین نظارت شده مانند رگرسیون خطی، رگرسیون لجستیک، درخت‌های تصمیم‌گیری و جنگل‌های تصادفی را مشاهده خواهید کرد. همچنین یاد خواهید گرفت که چگونه مراحل را با استفاده از خطوط لوله اسپارک و به دنبال آن مدل‌های بدون نظارت مانند K-means و خوشه‌بندی سلسله مراتبی خودکار کنید. بخشی در پردازش زبان طبیعی (NLP) پردازش متن، متن کاوی و جاسازی‌ها برای طبقه‌بندی را پوشش می‌دهد. این نسخه جدید همچنین کوآلاها را در Spark و نحوه خودکارسازی گردش کار داده ها با استفاده از Airflow و آخرین کتابخانه ML PySpark را معرفی می کند.

پس از تکمیل این کتاب، نحوه استفاده از کتابخانه یادگیری ماشین PySpark را برای ساخت و آموزش ماشین های مختلف خواهید فهمید. مدل‌های یادگیری، همراه با مؤلفه‌های مرتبط مانند جذب داده، پردازش و تجسم برای توسعه برنامه‌های کاربردی هوشمند مبتنی بر داده

آنچه خواهید آموخت:

</ p>

  • ساخت طیفی از الگوریتم‌های یادگیری ماشینی تحت نظارت و بدون نظارت
  • از کتابخانه یادگیری ماشین PySpark برای پیاده‌سازی سیستم‌های یادگیری ماشین و توصیه‌گر استفاده کنید 
  • از ویژگی‌های جدید در PySpark استفاده کنید. کتابخانه یادگیری ماشین
  • درک پردازش داده ها با استفاده از کوالاها در Spark
  • مشکلات مربوط به مهندسی ویژگی، تعادل کلاس، تعصب و واریانس، و اعتبار سنجی متقاطع را برای ساخت مدل های متناسب با بهینه حل کنید
  • /ul>

    این کتاب برای چه کسی است 

    متخصصان علم داده و یادگیری ماشین.

توضیحاتی درمورد کتاب به خارجی

Master the new features in PySpark 3.1 to develop data-driven, intelligent applications. This updated edition covers topics ranging from building scalable machine learning models, to natural language processing, to recommender systems.

Machine Learning with PySpark, Second Edition begins with the fundamentals of Apache Spark, including the latest updates to the framework. Next, you will learn the full spectrum of traditional machine learning algorithm implementations, along with natural language processing and recommender systems. You’ll gain familiarity with the critical process of selecting machine learning algorithms, data ingestion, and data processing to solve business problems. You’ll see a demonstration of how to build supervised machine learning models such as linear regression, logistic regression, decision trees, and random forests. You’ll also learn how to automate the steps using Spark pipelines, followed by unsupervised models such as K-means and hierarchical clustering. A section on Natural Language Processing (NLP) covers text processing, text mining, and embeddings for classification. This new edition also introduces Koalas in Spark and how to automate data workflow using Airflow and PySpark’s latest ML library.

After completing this book, you will understand how to use PySpark’s machine learning library to build and train various machine learning models, along with related components such as data ingestion, processing and visualization to develop data-driven intelligent applications

What you will learn:

  • Build a spectrum of supervised and unsupervised machine learning  algorithms
  • Use PySpark's machine learning library to implement machine learning and recommender systems 
  • Leverage the new features in PySpark’s machine learning library
  • Understand data processing using Koalas in Spark
  • Handle issues around feature engineering, class balance, bias and variance, and cross validation to build optimally fit models

Who This Book Is For 

Data science and machine learning professionals.


فهرست مطالب

Table of Contents
About the Author
About the Technical Reviewer
Acknowledgments
Foreword
Introduction
Chapter 1: Introduction to Spark
	Data Generation
		Before the 1990s
		The Internet and Social Media Era
		The Machine Data Era
	Spark
	Setting Up the Environment
		Downloading Spark
		Installing Spark
		Docker
		Databricks
		Spin a New Cluster
		Create a Notebook
	Conclusion
Chapter 2: Manage Data with PySpark
	Load and Read Data
	Data Filtering Using filter
	Data Filtering Using where
	Pandas UDF
	Drop Duplicate Values
	Writing Data
		CSV
		Parquet
	Data Handling Using Koalas
	Conclusion
Chapter 3: Introduction to Machine Learning
	Rise in Data
	Increased Computational Efficiency
	Improved ML Algorithms
	Availability of Data Scientists
	Supervised Machine Learning
	Unsupervised Machine Learning
		Semi-supervised Learning
		Reinforcement Learning
	Industrial Application and Challenges
		Retail
		Healthcare
		Finance
		Travel and Hospitality
		Media and Marketing
		Manufacturing and Automobile
		Social Media
		Others
	Conclusion
Chapter 4: Linear Regression
	Variables
	Theory
	Interpretation
	Evaluation
	Code
	Conclusion
Chapter 5: Logistic Regression
	Probability
		Using Linear Regression
		Using Logit
	Interpretation (Coefficients)
	Dummy Variables
	Model Evaluation
		True Positives
		True Negatives
		False Positives
		False Negatives
		Accuracy
		Recall
			Precision
		F1 Score
		Probability Cut-Off/Threshold
		ROC Curve
	Logistic Regression Code
		Data Info
		Confusion Matrix
			Accuracy
			Recall
			Precision
	Conclusion
Chapter 6: Random Forests Using PySpark
	Decision Tree
		Entropy
		Information Gain
	Random Forests
	Code
	Conclusion
Chapter 7: Clustering in PySpark
	Applications
		K-Means
			Deciding on the Number of Clusters (K)
			Elbow Method
		Hierarchical Clustering
			Agglomerative Clustering
	Code
		Data Info
	Conclusion
Chapter 8: Recommender Systems
	Recommendations
		Popularity-Based RS
		Content-Based RS
			User Profile
			Euclidean Distance
			Cosine Similarity
		Collaborative Filtering–Based RS
			User Item Matrix
			Explicit Feedback
			Implicit Feedback
			Nearest Neighbors–Based CF
			Missing Values
			Latent Factor–Based CF
		Hybrid Recommender Systems
	Code
		Data Info
	Conclusion
Chapter 9: Natural Language Processing
	Steps Involved in NLP
		Corpus
		Tokenize
		Stopword Removal
		Bag of Words
		CountVectorizer
		TF-IDF
		Text Classification Using Machine Learning
		Sequence Embeddings
			Embeddings
	Conclusion
Index




نظرات کاربران