ورود به حساب

نام کاربری گذرواژه

گذرواژه را فراموش کردید؟ کلیک کنید

حساب کاربری ندارید؟ ساخت حساب

ساخت حساب کاربری

نام نام کاربری ایمیل شماره موبایل گذرواژه

برای ارتباط با ما می توانید از طریق شماره موبایل زیر از طریق تماس و پیامک با ما در ارتباط باشید


09117307688
09117179751

در صورت عدم پاسخ گویی از طریق پیامک با پشتیبان در ارتباط باشید

دسترسی نامحدود

برای کاربرانی که ثبت نام کرده اند

ضمانت بازگشت وجه

درصورت عدم همخوانی توضیحات با کتاب

پشتیبانی

از ساعت 7 صبح تا 10 شب

دانلود کتاب Luraschi, J: Mastering Spark with R

دانلود کتاب Luraschi، J: Mastering Spark با R

Luraschi, J: Mastering Spark with R

مشخصات کتاب

Luraschi, J: Mastering Spark with R

ویرایش:  
نویسندگان: , ,   
سری:  
ISBN (شابک) : 149204637X, 9781492046370 
ناشر: O'Reilly UK Ltd. 
سال نشر: 2019 
تعداد صفحات: 288 
زبان: English 
فرمت فایل : EPUB (درصورت درخواست کاربر به PDF، EPUB یا AZW3 تبدیل می شود) 
حجم فایل: 15 Mb 

قیمت کتاب (تومان) : 42,000



ثبت امتیاز به این کتاب

میانگین امتیاز به این کتاب :
       تعداد امتیاز دهندگان : 8


در صورت تبدیل فایل کتاب Luraschi, J: Mastering Spark with R به فرمت های PDF، EPUB، AZW3، MOBI و یا DJVU می توانید به پشتیبان اطلاع دهید تا فایل مورد نظر را تبدیل نمایند.

توجه داشته باشید کتاب Luraschi، J: Mastering Spark با R نسخه زبان اصلی می باشد و کتاب ترجمه شده به فارسی نمی باشد. وبسایت اینترنشنال لایبرری ارائه دهنده کتاب های زبان اصلی می باشد و هیچ گونه کتاب ترجمه شده یا نوشته شده به فارسی را ارائه نمی دهد.


توضیحاتی در مورد کتاب Luraschi، J: Mastering Spark با R

اگر مانند اکثر کاربران R هستید، دانش عمیق و عشق به آمار دارید. اما از آنجایی که سازمان شما به جمع آوری حجم عظیمی از داده ها ادامه می دهد، افزودن ابزارهایی مانند Apache Spark بسیار منطقی است. با این کتاب کاربردی، دانشمندان داده و متخصصانی که با برنامه های داده در مقیاس بزرگ کار می کنند، یاد می گیرند که چگونه از Spark از R برای مقابله با داده های بزرگ و مشکلات بزرگ محاسباتی استفاده کنند. نویسندگان خاویر لوراشی، کوین کو و ادگار رویز به شما نشان می‌دهند که چگونه از R با اسپارک برای حل مسائل مختلف تجزیه و تحلیل داده‌ها استفاده کنید. این کتاب موضوعات مرتبط با علم داده، محاسبات خوشه‌ای و مسائلی را پوشش می‌دهد که باید حتی پیشرفته‌ترین کاربران را نیز مورد توجه قرار دهد. تجزیه و تحلیل، کاوش، تبدیل و تجسم داده ها در Apache Spark با R ایجاد مدل های آماری برای استخراج اطلاعات و پیش بینی نتایج. خودکارسازی فرآیند در گردش‌های کاری آماده تولید انجام تجزیه و تحلیل و مدل‌سازی در بسیاری از ماشین‌ها با استفاده از تکنیک‌های محاسباتی توزیع‌شده استفاده از داده‌های مقیاس بزرگ از منابع متعدد و فرمت‌های مختلف به راحتی از داخل Spark درباره چارچوب‌های مدل‌سازی جایگزین برای پردازش گراف، تجزیه و تحلیل جغرافیایی، و ژنومیک در مقیاس شیرجه رفتن به موضوعات پیشرفته از جمله تبدیل های سفارشی، پردازش داده ها در زمان واقعی، و ایجاد برنامه های افزودنی Spark سفارشی


توضیحاتی درمورد کتاب به خارجی

If you're like most R users, you have deep knowledge and love for statistics. But as your organization continues to collect huge amounts of data, adding tools such as Apache Spark makes a lot of sense. With this practical book, data scientists and professionals working with large-scale data applications will learn how to use Spark from R to tackle big data and big compute problems. Authors Javier Luraschi, Kevin Kuo, and Edgar Ruiz show you how to use R with Spark to solve different data analysis problems. This book covers relevant data science topics, cluster computing, and issues that should interest even the most advanced users. Analyze, explore, transform, and visualize data in Apache Spark with R Create statistical models to extract information and predict outcomes; automate the process in production-ready workflows Perform analysis and modeling across many machines using distributed computing techniques Use large-scale data from multiple sources and different formats with ease from within Spark Learn about alternative modeling frameworks for graph processing, geospatial analysis, and genomics at scale Dive into advanced topics including custom transformations, real-time data processing, and creating custom Spark extensions



فهرست مطالب

Cover
Copyright
Table of Contents
Foreword
Preface
	Formatting
	Acknowledgments
	Conventions Used in This Book
	Using Code Examples
	O’Reilly Online Learning
	How to Contact Us
Chapter 1. Introduction
	Overview
	Hadoop
	Spark
	R
	sparklyr
	Recap
Chapter 2. Getting Started
	Overview
	Prerequisites
		Installing sparklyr
		Installing Spark
	Connecting
	Using Spark
		Web Interface
		Analysis
		Modeling
		Data
		Extensions
		Distributed R
		Streaming
		Logs
	Disconnecting
	Using RStudio
	Resources
	Recap
Chapter 3. Analysis
	Overview
	Import
	Wrangle
		Built-in Functions
		Correlations
	Visualize
		Using ggplot2
		Using dbplot
	Model
		Caching
	Communicate
	Recap
Chapter 4. Modeling
	Overview
	Exploratory Data Analysis
	Feature Engineering
	Supervised Learning
		Generalized Linear Regression
		Other Models
	Unsupervised Learning
		Data Preparation
		Topic Modeling
	Recap
Chapter 5. Pipelines
	Overview
	Creation
	Use Cases
		Hyperparameter Tuning
	Operating Modes
	Interoperability
	Deployment
		Batch Scoring
		Real-Time Scoring
	Recap
Chapter 6. Clusters
	Overview
	On-Premises
		Managers
		Distributions
	Cloud
		Amazon
		Databricks
		Google
		IBM
		Microsoft
		Qubole
	Kubernetes
	Tools
		RStudio
		Jupyter
		Livy
	Recap
Chapter 7. Connections
	Overview
		Edge Nodes
		Spark Home
	Local
	Standalone
	YARN
		YARN Client
		YARN Cluster
	Livy
	Mesos
	Kubernetes
	Cloud
	Batches
	Tools
	Multiple Connections
	Troubleshooting
		Logging
		Spark Submit
		Windows
	Recap
Chapter 8. Data
	Overview
	Reading Data
		Paths
		Schema
		Memory
		Columns
	Writing Data
	Copying Data
	File Formats
		CSV
		JSON
		Parquet
		Others
	File Systems
	Storage Systems
		Hive
		Cassandra
		JDBC
	Recap
Chapter 9. Tuning
	Overview
		Graph
		Timeline
	Configuring
		Connect Settings
		Submit Settings
		Runtime Settings
		sparklyr Settings
	Partitioning
		Implicit Partitions
		Explicit Partitions
	Caching
		Checkpointing
		Memory
	Shuffling
	Serialization
	Configuration Files
	Recap
Chapter 10. Extensions
	Overview
	H2O
	Graphs
	XGBoost
	Deep Learning
	Genomics
	Spatial
	Troubleshooting
	Recap
Chapter 11. Distributed R
	Overview
	Use Cases
		Custom Parsers
		Partitioned Modeling
		Grid Search
		Web APIs
		Simulations
	Partitions
	Grouping
	Columns
	Context
	Functions
	Packages
	Cluster Requirements
		Installing R
		Apache Arrow
	Troubleshooting
		Worker Logs
		Resolving Timeouts
		Inspecting Partitions
		Debugging Workers
	Recap
Chapter 12. Streaming
	Overview
	Transformations
		Analysis
		Modeling
		Pipelines
		Distributed R
	Kafka
	Shiny
	Recap
Chapter 13. Contributing
	Overview
	The Spark API
	Spark Extensions
	Using Scala Code
	Recap
Appendix A. Supplemental Code References
	Preface
		Formatting
	Chapter 1
		The World’s Capacity to Store Information
		Daily Downloads of CRAN Packages
	Chapter 2
		Prerequisites
	Chapter 3
		Hive Functions
	Chapter 4
		MLlib Functions
	Chapter 6
		Google Trends for On-Premises (Mainframes), Cloud Computing, and Kubernetes
	Chapter 12
		Stream Generator
		Installing Kafka
Index
About the Authors
Colophon




نظرات کاربران