دسترسی نامحدود
برای کاربرانی که ثبت نام کرده اند
برای ارتباط با ما می توانید از طریق شماره موبایل زیر از طریق تماس و پیامک با ما در ارتباط باشید
در صورت عدم پاسخ گویی از طریق پیامک با پشتیبان در ارتباط باشید
برای کاربرانی که ثبت نام کرده اند
درصورت عدم همخوانی توضیحات با کتاب
از ساعت 7 صبح تا 10 شب
ویرایش: [2 ed.]
نویسندگان: Pramod Singh
سری:
ISBN (شابک) : 1484277767, 9781484277768
ناشر: Apress
سال نشر: 2021
تعداد صفحات: 238
زبان: English
فرمت فایل : EPUB (درصورت درخواست کاربر به PDF، EPUB یا AZW3 تبدیل می شود)
حجم فایل: 12 Mb
در صورت تبدیل فایل کتاب Machine Learning with PySpark: With Natural Language Processing and Recommender Systems به فرمت های PDF، EPUB، AZW3، MOBI و یا DJVU می توانید به پشتیبان اطلاع دهید تا فایل مورد نظر را تبدیل نمایند.
توجه داشته باشید کتاب یادگیری ماشین با PySpark: با پردازش زبان طبیعی و سیستمهای توصیهکننده نسخه زبان اصلی می باشد و کتاب ترجمه شده به فارسی نمی باشد. وبسایت اینترنشنال لایبرری ارائه دهنده کتاب های زبان اصلی می باشد و هیچ گونه کتاب ترجمه شده یا نوشته شده به فارسی را ارائه نمی دهد.
بر ویژگی های جدید PySpark 3.1 تسلط پیدا کنید تا برنامه های کاربردی هوشمند و مبتنی بر داده را توسعه دهید. این نسخه بهروزرسانی شده موضوعاتی از ساخت مدلهای یادگیری ماشینی مقیاسپذیر، پردازش زبان طبیعی، تا سیستمهای توصیهگر را پوشش میدهد.
آموزش ماشین با PySpark، نسخه دوم با اصول Apache Spark آغاز میشود. ، از جمله آخرین به روز رسانی های چارچوب. در مرحله بعد، طیف کاملی از پیادهسازی الگوریتمهای یادگیری ماشین سنتی، همراه با پردازش زبان طبیعی و سیستمهای توصیهگر را خواهید آموخت. شما با فرآیند حیاتی انتخاب الگوریتمهای یادگیری ماشین، جذب دادهها و پردازش دادهها برای حل مشکلات تجاری آشنا خواهید شد. نمایشی از نحوه ساخت مدلهای یادگیری ماشین نظارت شده مانند رگرسیون خطی، رگرسیون لجستیک، درختهای تصمیمگیری و جنگلهای تصادفی را مشاهده خواهید کرد. همچنین یاد خواهید گرفت که چگونه مراحل را با استفاده از خطوط لوله اسپارک و به دنبال آن مدلهای بدون نظارت مانند K-means و خوشهبندی سلسله مراتبی خودکار کنید. بخشی در پردازش زبان طبیعی (NLP) پردازش متن، متن کاوی و جاسازیها برای طبقهبندی را پوشش میدهد. این نسخه جدید همچنین کوآلاها را در Spark و نحوه خودکارسازی گردش کار داده ها با استفاده از Airflow و آخرین کتابخانه ML PySpark را معرفی می کند.
پس از تکمیل این کتاب، نحوه استفاده از کتابخانه یادگیری ماشین PySpark را برای ساخت و آموزش ماشین های مختلف خواهید فهمید. مدلهای یادگیری، همراه با مؤلفههای مرتبط مانند جذب داده، پردازش و تجسم برای توسعه برنامههای کاربردی هوشمند مبتنی بر داده
آنچه خواهید آموخت:
</ p>
این کتاب برای چه کسی است
متخصصان علم داده و یادگیری ماشین.Master the new features in PySpark 3.1 to develop data-driven, intelligent applications. This updated edition covers topics ranging from building scalable machine learning models, to natural language processing, to recommender systems.
Machine Learning with PySpark, Second Edition begins with the fundamentals of Apache Spark, including the latest updates to the framework. Next, you will learn the full spectrum of traditional machine learning algorithm implementations, along with natural language processing and recommender systems. You’ll gain familiarity with the critical process of selecting machine learning algorithms, data ingestion, and data processing to solve business problems. You’ll see a demonstration of how to build supervised machine learning models such as linear regression, logistic regression, decision trees, and random forests. You’ll also learn how to automate the steps using Spark pipelines, followed by unsupervised models such as K-means and hierarchical clustering. A section on Natural Language Processing (NLP) covers text processing, text mining, and embeddings for classification. This new edition also introduces Koalas in Spark and how to automate data workflow using Airflow and PySpark’s latest ML library.
After completing this book, you will understand how to use PySpark’s machine learning library to build and train various machine learning models, along with related components such as data ingestion, processing and visualization to develop data-driven intelligent applications
What you will learn:
Who This Book Is For
Data science and machine learning professionals.Table of Contents About the Author About the Technical Reviewer Acknowledgments Foreword Introduction Chapter 1: Introduction to Spark Data Generation Before the 1990s The Internet and Social Media Era The Machine Data Era Spark Setting Up the Environment Downloading Spark Installing Spark Docker Databricks Spin a New Cluster Create a Notebook Conclusion Chapter 2: Manage Data with PySpark Load and Read Data Data Filtering Using filter Data Filtering Using where Pandas UDF Drop Duplicate Values Writing Data CSV Parquet Data Handling Using Koalas Conclusion Chapter 3: Introduction to Machine Learning Rise in Data Increased Computational Efficiency Improved ML Algorithms Availability of Data Scientists Supervised Machine Learning Unsupervised Machine Learning Semi-supervised Learning Reinforcement Learning Industrial Application and Challenges Retail Healthcare Finance Travel and Hospitality Media and Marketing Manufacturing and Automobile Social Media Others Conclusion Chapter 4: Linear Regression Variables Theory Interpretation Evaluation Code Conclusion Chapter 5: Logistic Regression Probability Using Linear Regression Using Logit Interpretation (Coefficients) Dummy Variables Model Evaluation True Positives True Negatives False Positives False Negatives Accuracy Recall Precision F1 Score Probability Cut-Off/Threshold ROC Curve Logistic Regression Code Data Info Confusion Matrix Accuracy Recall Precision Conclusion Chapter 6: Random Forests Using PySpark Decision Tree Entropy Information Gain Random Forests Code Conclusion Chapter 7: Clustering in PySpark Applications K-Means Deciding on the Number of Clusters (K) Elbow Method Hierarchical Clustering Agglomerative Clustering Code Data Info Conclusion Chapter 8: Recommender Systems Recommendations Popularity-Based RS Content-Based RS User Profile Euclidean Distance Cosine Similarity Collaborative Filtering–Based RS User Item Matrix Explicit Feedback Implicit Feedback Nearest Neighbors–Based CF Missing Values Latent Factor–Based CF Hybrid Recommender Systems Code Data Info Conclusion Chapter 9: Natural Language Processing Steps Involved in NLP Corpus Tokenize Stopword Removal Bag of Words CountVectorizer TF-IDF Text Classification Using Machine Learning Sequence Embeddings Embeddings Conclusion Index