ورود به حساب

نام کاربری گذرواژه

گذرواژه را فراموش کردید؟ کلیک کنید

حساب کاربری ندارید؟ ساخت حساب

ساخت حساب کاربری

نام نام کاربری ایمیل شماره موبایل گذرواژه

برای ارتباط با ما می توانید از طریق شماره موبایل زیر از طریق تماس و پیامک با ما در ارتباط باشید


09117307688
09117179751

در صورت عدم پاسخ گویی از طریق پیامک با پشتیبان در ارتباط باشید

دسترسی نامحدود

برای کاربرانی که ثبت نام کرده اند

ضمانت بازگشت وجه

درصورت عدم همخوانی توضیحات با کتاب

پشتیبانی

از ساعت 7 صبح تا 10 شب

دانلود کتاب Data Processing with Optimus: Supercharge big data preparation tasks for analytics and machine learning with Optimus using Dask and PySpark

دانلود کتاب پردازش داده با Optimus: وظایف آماده سازی کلان داده را برای تجزیه و تحلیل و یادگیری ماشین با Optimus با استفاده از Dask و PySpark افزایش دهید.

Data Processing with Optimus: Supercharge big data preparation tasks for analytics and machine learning with Optimus using Dask and PySpark

مشخصات کتاب

Data Processing with Optimus: Supercharge big data preparation tasks for analytics and machine learning with Optimus using Dask and PySpark

ویرایش:  
نویسندگان: ,   
سری:  
ISBN (شابک) : 1801079560, 9781801079563 
ناشر: Packt Publishing 
سال نشر: 2021 
تعداد صفحات: 300 
زبان: English 
فرمت فایل : EPUB (درصورت درخواست کاربر به PDF، EPUB یا AZW3 تبدیل می شود) 
حجم فایل: 4 Mb 

قیمت کتاب (تومان) : 57,000



ثبت امتیاز به این کتاب

میانگین امتیاز به این کتاب :
       تعداد امتیاز دهندگان : 4


در صورت تبدیل فایل کتاب Data Processing with Optimus: Supercharge big data preparation tasks for analytics and machine learning with Optimus using Dask and PySpark به فرمت های PDF، EPUB، AZW3، MOBI و یا DJVU می توانید به پشتیبان اطلاع دهید تا فایل مورد نظر را تبدیل نمایند.

توجه داشته باشید کتاب پردازش داده با Optimus: وظایف آماده سازی کلان داده را برای تجزیه و تحلیل و یادگیری ماشین با Optimus با استفاده از Dask و PySpark افزایش دهید. نسخه زبان اصلی می باشد و کتاب ترجمه شده به فارسی نمی باشد. وبسایت اینترنشنال لایبرری ارائه دهنده کتاب های زبان اصلی می باشد و هیچ گونه کتاب ترجمه شده یا نوشته شده به فارسی را ارائه نمی دهد.


توضیحاتی در مورد کتاب پردازش داده با Optimus: وظایف آماده سازی کلان داده را برای تجزیه و تحلیل و یادگیری ماشین با Optimus با استفاده از Dask و PySpark افزایش دهید.



نوشته شده توسط تیم اصلی Optimus، این راهنمای جامع به شما کمک می کند تا درک کنید که چگونه Optimus کل چشم انداز پردازش داده را بهبود می بخشد

ویژگی های کلیدی

    < li>بارگیری، ادغام و ذخیره کارآمد داده های کوچک و بزرگ با Optimus
  • آموزش عملکردهای Optimus برای تجزیه و تحلیل داده ها، مهندسی ویژگی، یادگیری ماشین، اعتبارسنجی متقابل و NLP
  • کشف چگونه Optimus سایر فناوری‌های قاب داده را بهبود می‌بخشد و به شما کمک می‌کند تا وظایف پردازش داده‌های خود را سرعت بخشید

توضیحات کتاب

Optimus یک کتابخانه Python است که به عنوان یک API یکپارچه برای پاک‌سازی داده‌ها کار می‌کند. پردازش و ادغام داده ها می‌توان از آن برای مدیریت داده‌های کوچک و بزرگ در لپ‌تاپ محلی یا در خوشه‌های راه دور با استفاده از CPU یا GPU استفاده کرد.

این کتاب با پوشش داخلی Optimus و نحوه عملکرد آن در کنار فناوری‌های موجود آغاز می‌شود. نیازهای پردازش داده شما را برآورده می کند. سپس یاد خواهید گرفت که چگونه از Optimus برای بارگیری و ذخیره داده ها از فرمت های داده متنی مانند فایل های CSV و JSON، کاوش فایل های باینری مانند اکسل و برای پردازش داده های ستونی با Parquet، Avro و OCR استفاده کنید. در مرحله بعد، با نمایه ساز و انواع داده های آن آشنا می شوید - یک ویژگی منحصر به فرد Optimus Dataframe که به کیفیت داده کمک می کند. خواهید دید که چگونه از نمودارهای موجود در Optimus مانند هیستوگرام، نمودارهای فرکانس، و نمودارهای پراکنده و جعبه استفاده کنید و خواهید فهمید که چگونه Optimus به شما امکان می دهد به کتابخانه هایی مانند Plotly و Altair متصل شوید. شما همچنین به برنامه های پیشرفته مانند مهندسی ویژگی، یادگیری ماشین، اعتبار سنجی متقابل و توابع پردازش زبان طبیعی خواهید پرداخت و پیشرفت های Optimus را کشف خواهید کرد. در نهایت، نحوه ایجاد عملکردهای پاکسازی و تبدیل داده و اضافه کردن یک موتور پردازش داده جدید فرضی با Optimus را خواهید آموخت.

در پایان این کتاب، می‌توانید گردش کار علم داده خود را بهبود ببخشید. با Optimus به راحتی.

آنچه یاد خواهید گرفت

  • از بیش از 100 تابع پردازش داده بر روی ستون ها و سایر مقادیر رشته مانند استفاده کنید
  • تغییر شکل داده و محوری داده ها برای دریافت خروجی در فرمت مورد نیاز
  • چگونگی رسم هیستوگرام، نمودار فرکانس، نمودار پراکندگی، نمودار جعبه و موارد دیگر را بیابید
  • Optimus را با کتابخانه های تجسمی محبوب پایتون مانند Plotly وصل کنید. و Altair
  • استفاده از تکنیک‌های خوشه‌بندی رشته‌ها برای عادی‌سازی رشته‌ها
  • کشف توابع برای کاوش، رفع و حذف داده‌های با کیفیت پایین
  • از تکنیک‌های پیشرفته برای حذف موارد پرت استفاده کنید. داده
  • افزودن موتورها و توابع سفارشی برای پاکسازی، پردازش و ادغام داده ها

این کتاب برای چه کسی است

این کتاب برای توسعه دهندگان پایتون است کسانی که می خواهند با استفاده از Optimus، یک API یکپارچه برای کار با Pandas، Dask، cuDF، Dask-cuDF، Vaex و Spark، کلان داده ها را برای یادگیری ماشین، تجزیه و تحلیل و گزارش کاوش، تبدیل و آماده کنند. اگرچه ضروری نیست، اما دانش سطح مبتدی پایتون مفید خواهد بود. برای نصب Optimus و الزامات آن، دانش اولیه CLI مورد نیاز است. برای استفاده از فناوری‌های GPU، به یک کارت گرافیک NVIDIA سازگار با کتابخانه RAPIDS NVIDIA نیاز دارید که با ویندوز 10 و لینوکس سازگار است.

فهرست محتوا

  1. سلام Optimus !
  2. بارگیری، ذخیره و قالب‌های فایل داده‌ها
  3. مشاهده داده‌ها
  4. ترکیب، شکل‌دهی مجدد و تجمیع داده‌ها
  5. تجسم و نمایه‌سازی داده‌ها
  6. خوشه بندی رشته ها
  7. مهندسی ویژگی
  8. آموزش ماشین
  9. پردازش زبان طبیعی
  10. هک Optimus
  11. Optimus به عنوان یک وب سرویس

توضیحاتی درمورد کتاب به خارجی

Written by the core Optimus team, this comprehensive guide will help you to understand how Optimus improves the whole data processing landscape

Key Features

  • Load, merge, and save small and big data efficiently with Optimus
  • Learn Optimus functions for data analytics, feature engineering, machine learning, cross-validation, and NLP
  • Discover how Optimus improves other data frame technologies and helps you speed up your data processing tasks

Book Description

Optimus is a Python library that works as a unified API for data cleaning, processing, and merging data. It can be used for handling small and big data on your local laptop or on remote clusters using CPUs or GPUs.

The book begins by covering the internals of Optimus and how it works in tandem with the existing technologies to serve your data processing needs. You'll then learn how to use Optimus for loading and saving data from text data formats such as CSV and JSON files, exploring binary files such as Excel, and for columnar data processing with Parquet, Avro, and OCR. Next, you'll get to grips with the profiler and its data types - a unique feature of Optimus Dataframe that assists with data quality. You'll see how to use the plots available in Optimus such as histogram, frequency charts, and scatter and box plots, and understand how Optimus lets you connect to libraries such as Plotly and Altair. You'll also delve into advanced applications such as feature engineering, machine learning, cross-validation, and natural language processing functions and explore the advancements in Optimus. Finally, you'll learn how to create data cleaning and transformation functions and add a hypothetical new data processing engine with Optimus.

By the end of this book, you'll be able to improve your data science workflow with Optimus easily.

What you will learn

  • Use over 100 data processing functions over columns and other string-like values
  • Reshape and pivot data to get the output in the required format
  • Find out how to plot histograms, frequency charts, scatter plots, box plots, and more
  • Connect Optimus with popular Python visualization libraries such as Plotly and Altair
  • Apply string clustering techniques to normalize strings
  • Discover functions to explore, fix, and remove poor quality data
  • Use advanced techniques to remove outliers from your data
  • Add engines and custom functions to clean, process, and merge data

Who this book is for

This book is for Python developers who want to explore, transform, and prepare big data for machine learning, analytics, and reporting using Optimus, a unified API to work with Pandas, Dask, cuDF, Dask-cuDF, Vaex, and Spark. Although not necessary, beginner-level knowledge of Python will be helpful. Basic knowledge of the CLI is required to install Optimus and its requirements. For using GPU technologies, you'll need an NVIDIA graphics card compatible with NVIDIA's RAPIDS library, which is compatible with Windows 10 and Linux.

Table of Contents

  1. Hi Optimus!
  2. Data Loading, Saving, and File Formats
  3. Data Wrangling
  4. Combining, Reshaping, and Aggregating Data
  5. Data Visualization and Profiling
  6. String Clustering
  7. Feature Engineering
  8. Machine Learning
  9. Natural Language Processing
  10. Hacking Optimus
  11. Optimus as a Web Service


فهرست مطالب

Cover
Title
Copyright and Credits
Table of Contents
Section 1: Getting Started with Optimus
Chapter 1: Hi Optimus!
	Technical requirements
	Introducing Optimus
		Exploring the DataFrame technologies
		Examining Optimus design principles
	Installing everything you need to run Optimus
		Installing Anaconda
		Installing Optimus
		Installing JupyterLab
		Installing RAPIDS
		Using Coiled
		Using a Docker container
	Using Optimus
		The Optimus instance
		The Optimus DataFrame
		Technical details
	Discovering Optimus internals
		Engines
		The DataFrame behind the DataFrame
		Meta
		Dummy functions
		Diagnostics
	Summary
Chapter 2: Data Loading, Saving, and File Formats
	Technical requirements
	How data moves internally
		File to RAM
		File to GPU memory
		Database to RAM
		Database to GPU memory
	Loading a file
		Loading a local CSV file
		Wildcards
		Loading large files
		Loading a file from a remote connection
		Loading data from a database
		Special dependencies for every technology
		Creating a dataframe from scratch
		Connecting to remote data sources
		Connection credentials
	Connecting to databases
	Saving a dataframe
		Saving to a local file
		Saving a file using a remote connection
		Saving a dataframe to a database table
		Loading and saving data in parallel
	Summary
Section 2: Optimus – Transform and Rollout
Chapter 3:  Data Wrangling
	Technical requirements
	Exploring Optimus data types
		Converting data types
	Operating columns
		Selecting columns
		Moving columns
		Renaming columns
		Removing columns
		Input and output columns
		Managing functions
		String functions
		Numeric functions
		Date and time functions
		URL functions
		Email functions
	Experimenting with user-defined functions
		Using apply
		Supporting multiple engines
	Summary
	Further reading
Chapter 4: Combining, Reshaping, and Aggregating Data
	Technical requirements
	Concatenating data
		Mapping
		Concatenating columns
	Joining data
	Reshaping and pivoting
		Pivoting
		Stacking
		Unstacking
		Melting
		Aggregations
	Aggregating and grouping
	Summary
Chapter 5: Data Visualization and Profiling
	Technical requirements
	Data quality
		Handling matches, mismatches, and nulls
	Exploratory data analysis
		Single variable non-graphical methods
		Single variable graphical methods
		Multi-variable non-graphical methods
		Multi-variable graphical methods
	Data profiling
	Cache flushing
	Summary
Chapter 6: String Clustering
	Technical requirements
	Exploring string clustering
	Key collision methods
		Fingerprinting
		N-gram fingerprinting
		Phonetic encoding
	Nearest-neighbor methods
		Levenshtein distance
	Applying suggestions
	Summary
Chapter 7: Feature Engineering
	Technical requirements
	Handling missing values
		Removing data
		Imputation
	Handling outliers
		Tukey
		Z-score
		Modified Z-score
	Binning
	Variable transformation
		Logarithmic transformation
		Square root transformation
		Reciprocal transformation
		Exponential or power transformation
		String to index
	One-hot encoding
	Feature splitting
	Scaling
		Normalization
		Standardization
		Max abs scaler
	Summary
Section 3: Advanced Features of Optimus
Chapter 8: Machine Learning
	Technical requirements
	Optimus as a cohesive API
		How Optimus can help
	Implementing a train-test split procedure
		When to use a train-test split procedure
		Test size
		Repeatable train-test splits
		Using k-fold cross-validation
	Training models in Optimus
		Linear regression
		Logistic regression
		Model performance
		K-means
		PCA
		Loading and saving models
	Summary
Chapter 9: Natural Language Processing
	Technical requirements
	Natural language processing
	Removing unwanted strings
		Stripping the HTML
		Removing stopwords
		Removing URLs
		Removing special characters
		Expanding contracted words
	Stemming and lemmatization
		Stemming
		Lemmatization
	word_tokenizer
		Part-of-speech tagging
		Applying the transformation
	Feature extraction from text
		Bag of words
	Summary
Chapter 10: Hacking Optimus
	Technical requirements
		Installing Git
	Adding a new engine
		Cloning the repository from GitHub
		How the project is organized
		The entry point
		Base class functions
		Applying functions
		I/O operations
		Plots
		Profiler data types
	Bumblebee
	Joining the community
	The future
	Limitations
	Summary
Chapter 11: Optimus as a Web Service
	Technical requirements
	Introducing Blurr
	Setting up the environment
		Pre-requisites for Blurr
		Installing the package
		Importing the package
		Creating a Blurr session
		Multiple engines in one session
		Quickest setup
	Making requests
		Loading a dataframe
		Saving a dataframe
		Getting information from the dataset
		Transforming a dataset
		Passing arguments
		Getting the content of the dataset
		Multiple operations in one request
		Using other types of data
	Summary
Index




نظرات کاربران