ورود به حساب

نام کاربری گذرواژه

گذرواژه را فراموش کردید؟ کلیک کنید

حساب کاربری ندارید؟ ساخت حساب

ساخت حساب کاربری

نام نام کاربری ایمیل شماره موبایل گذرواژه

برای ارتباط با ما می توانید از طریق شماره موبایل زیر از طریق تماس و پیامک با ما در ارتباط باشید


09117307688
09117179751

در صورت عدم پاسخ گویی از طریق پیامک با پشتیبان در ارتباط باشید

دسترسی نامحدود

برای کاربرانی که ثبت نام کرده اند

ضمانت بازگشت وجه

درصورت عدم همخوانی توضیحات با کتاب

پشتیبانی

از ساعت 7 صبح تا 10 شب

دانلود کتاب In-Memory Analytics with Apache Arrow: Perform fast and efficient data analytics on both flat and hierarchical structured data

دانلود کتاب تجزیه و تحلیل درون حافظه با پیکان آپاچی: تجزیه و تحلیل داده‌های سریع و کارآمد را بر روی داده‌های ساختاری مسطح و سلسله مراتبی انجام دهید.

In-Memory Analytics with Apache Arrow: Perform fast and efficient data analytics on both flat and hierarchical structured data

مشخصات کتاب

In-Memory Analytics with Apache Arrow: Perform fast and efficient data analytics on both flat and hierarchical structured data

ویرایش: [1 ed.] 
نویسندگان:   
سری:  
ISBN (شابک) : 1801071039, 9781801071031 
ناشر: Packt Publishing 
سال نشر: 2022 
تعداد صفحات: 392 
زبان: English 
فرمت فایل : PDF (درصورت درخواست کاربر به PDF، EPUB یا AZW3 تبدیل می شود) 
حجم فایل: 8 Mb 

قیمت کتاب (تومان) : 66,000



ثبت امتیاز به این کتاب

میانگین امتیاز به این کتاب :
       تعداد امتیاز دهندگان : 9


در صورت تبدیل فایل کتاب In-Memory Analytics with Apache Arrow: Perform fast and efficient data analytics on both flat and hierarchical structured data به فرمت های PDF، EPUB، AZW3، MOBI و یا DJVU می توانید به پشتیبان اطلاع دهید تا فایل مورد نظر را تبدیل نمایند.

توجه داشته باشید کتاب تجزیه و تحلیل درون حافظه با پیکان آپاچی: تجزیه و تحلیل داده‌های سریع و کارآمد را بر روی داده‌های ساختاری مسطح و سلسله مراتبی انجام دهید. نسخه زبان اصلی می باشد و کتاب ترجمه شده به فارسی نمی باشد. وبسایت اینترنشنال لایبرری ارائه دهنده کتاب های زبان اصلی می باشد و هیچ گونه کتاب ترجمه شده یا نوشته شده به فارسی را ارائه نمی دهد.


توضیحاتی در مورد کتاب تجزیه و تحلیل درون حافظه با پیکان آپاچی: تجزیه و تحلیل داده‌های سریع و کارآمد را بر روی داده‌های ساختاری مسطح و سلسله مراتبی انجام دهید.

پردازش داده های جدولی و ساخت موتورهای پرس و جو با کارایی بالا بر روی CPU ها و GPU های مدرن با استفاده از Apache Arrow، یک فرمت حافظه استاندارد شده مستقل از زبان، برای عملکرد بهینه ویژگی های کلیدی • با انواع داده های Apache Arrow و قابلیت همکاری با پانداها و پارکت آشنا شوید • برای تولید و مصرف داده های جدولی، با Apache Arrow Flight RPC، Compute و Dataset API کار کنید • بازبینی، مشارکت و پشتیبانی Dremio، سازنده Apache Arrow توضیحات کتاب Apache Arrow برای تسریع تجزیه و تحلیل و امکان تبادل داده ها در سیستم های کلان داده به راحتی طراحی شده است. تجزیه و تحلیل In-Memory با Apache Arrow با مروری اجمالی از قالب Apache Arrow شروع می شود، قبل از اینکه به شما کمک کند تا در هنگام قدم زدن در انواع موارد استفاده در دنیای واقعی، تطبیق پذیری و مزایای Arrow را درک کنید. شما وظایف کلیدی مانند بهبود گردش‌های کاری علم داده با Arrow، استفاده از Arrow و Apache Parket با Apache Spark و Jupyter برای عملکرد بهتر و ترجمه داده‌ها بدون دردسر، و همچنین کار با Perspective، یک تحلیل گرافیکی و جدولی تعاملی منبع باز را پوشش خواهید داد. ابزاری برای مرورگرها با پیشروی، فرمت‌های مختلف تبادل و ذخیره‌سازی داده‌ها را بررسی خواهید کرد و با روابط بین Arrow، Parket، Feather، Protobuf، Flatbuffers، JSON و CSV آشنا خواهید شد. علاوه بر درک ساختار اصلی پروتکل‌های Arrow Flight و Flight SQL، با استفاده Dremio از Apache Arrow برای بهبود تجزیه و تحلیل SQL و نحوه استفاده از Arrow در برنامه‌های مرورگر مبتنی بر وب آشنا خواهید شد. در نهایت، با ویژگی‌های آتی Arrow آشنا می‌شوید تا به شما کمک کند جلوتر از منحنی باشید. تا پایان این کتاب، شما تمام اجزای سازنده را برای ایجاد سرویس‌ها و ابزارهای تحلیلی مفید، کارآمد و قدرتمند با Apache Arrow خواهید داشت. آنچه خواهید آموخت • از کتابخانه های Apache Arrow برای دسترسی به فایل های داده هم به صورت محلی و هم در فضای ابری استفاده کنید • عناصر صفر کپی فرمت Apache Arrow را درک کنید • بهبود عملکرد خواندن با فایل های نقشه برداری حافظه با پیکان آپاچی • داده های Apache Arrow را با استفاده از C API به طور موثر تولید یا مصرف کنید • از Apache Arrow Compute APIs برای انجام عملیات پیچیده استفاده کنید • سرورها و کلاینت های Arrow Flight را برای انتقال سریع داده ها ایجاد کنید • کتابخانه های Arrow را به صورت محلی بسازید و به جامعه کمک کنید این کتاب برای چه کسی است این کتاب برای توسعه دهندگان، تحلیلگران داده و دانشمندان داده است که به دنبال کشف قابلیت های Apache Arrow از ابتدا هستند. این کتاب همچنین برای هر مهندسانی که بر روی ساخت ابزارهای کاربردی برای تجزیه و تحلیل داده ها و موتورهای پرس و جو کار می کنند، یا در غیر این صورت با داده های جدولی کار می کنند، بدون توجه به زبان برنامه نویسی مفید خواهد بود. آشنایی با مفاهیم اولیه تجزیه و تحلیل داده ها به شما کمک می کند تا بیشترین بهره را از این کتاب ببرید، اما لازم نیست. نمونه کد در زبان های برنامه نویسی C++، Go و Python ارائه شده است.


توضیحاتی درمورد کتاب به خارجی

Process tabular data and build high-performance query engines on modern CPUs and GPUs using Apache Arrow, a standardized language-independent memory format, for optimal performance Key Features • Learn about Apache Arrow's data types and interoperability with pandas and Parquet • Work with Apache Arrow Flight RPC, Compute, and Dataset APIs to produce and consume tabular data • Reviewed, contributed, and supported by Dremio, the co-creator of Apache Arrow Book Description Apache Arrow is designed to accelerate analytics and allow the exchange of data across big data systems easily. In-Memory Analytics with Apache Arrow begins with a quick overview of the Apache Arrow format, before moving on to helping you to understand Arrow's versatility and benefits as you walk through a variety of real-world use cases. You'll cover key tasks such as enhancing data science workflows with Arrow, using Arrow and Apache Parquet with Apache Spark and Jupyter for better performance and hassle-free data translation, as well as working with Perspective, an open source interactive graphical and tabular analysis tool for browsers. As you advance, you'll explore the different data interchange and storage formats and become well-versed with the relationships between Arrow, Parquet, Feather, Protobuf, Flatbuffers, JSON, and CSV. In addition to understanding the basic structure of the Arrow Flight and Flight SQL protocols, you'll learn about Dremio's usage of Apache Arrow to enhance SQL analytics and discover how Arrow can be used in web-based browser apps. Finally, you'll get to grips with the upcoming features of Arrow to help you stay ahead of the curve. By the end of this book, you will have all the building blocks to create useful, efficient, and powerful analytical services and utilities with Apache Arrow. What you will learn • Use Apache Arrow libraries to access data files both locally and in the cloud • Understand the zero-copy elements of the Apache Arrow format • Improve read performance by memory-mapping files with Apache Arrow • Produce or consume Apache Arrow data efficiently using a C API • Use the Apache Arrow Compute APIs to perform complex operations • Create Arrow Flight servers and clients for transferring data quickly • Build the Arrow libraries locally and contribute back to the community Who this book is for This book is for developers, data analysts, and data scientists looking to explore the capabilities of Apache Arrow from the ground up. This book will also be useful for any engineers who are working on building utilities for data analytics and query engines, or otherwise working with tabular data, regardless of the programming language. Some familiarity with basic concepts of data analysis will help you to get the most out of this book but isn't required. Code examples are provided in the C++, Go, and Python programming languages.



فهرست مطالب

Cover
Title Page
Copyright and Credits
Contributors
Foreword
Table of Contents
Preface
Section 1: Overview of What Arrow Is, its Capabilities, Benefits, and Goals
Chapter 1: Getting Started with Apache Arrow
	Technical requirements
	Understanding the Arrow format and specifications
	Why does Arrow use a columnar in-memory format?
	Learning the terminology and physical memory layout
		Quick summary of physical layouts, or TL;DR
		How to speak Arrow
	Arrow format versioning and stability
	Would you download a library? Of course!
	Setting up your shooting range
		Using pyarrow For Python
		C++ for the 1337 coders
		Go Arrow go!
	Summary
	References
Chapter 2: Working with Key Arrow Functionality
	Technical requirements
	Playing with data, wherever it might be!
		Working with Arrow tables
		Accessing data files with pyarrow
		Accessing data files with Arrow in C++
	pandas firing Arrow
		Putting pandas in your quiver
		Making pandas run fast
		Keeping pandas from running wild
	Sharing is caring… especially when it's your memory
		Diving into memory management
		Managing buffers for performance
		Crossing the boundaries
	Summary
Chapter 3: Data Science with Apache Arrow
	Technical requirements
	ODBC takes an Arrow to the knee
	Lost in translation
	SPARKing new ideas on Jupyter
		Understanding the integration
		Everyone gets a containerized development environment!
		SPARKing joy with Arrow and PySpark
	Interactive charting powered by Arrow
	Stretching workflows onto Elasticsearch
		Indexing the data
	Summary
Section 2: Interoperability with Arrow: pandas, Parquet, Flight, and Datasets
Chapter 4: Format and Memory Handling
	Technical requirements
	Storage versus runtime in-memory versus message-passing formats
		Long-term storage formats
		In-memory runtime formats
		Message-passing formats
		Summing up
	Passing your Arrows around
		What is this sorcery?!
		Producing and consuming Arrows
	Learning about memory cartography
		The base case
		Parquet versus CSV
		Mapping data into memory
		Too long; didn't read (TL;DR) – Computers are magic
	Summary
Chapter 5: Crossing the Language Barrier with the Arrow C Data API
	Technical requirements
	Using the Arrow C data interface
		The ArrowSchema structure
		The ArrowArray structure
	Example use cases
		Using the C API to export Arrow-formatted data
		Importing Arrow data with Python
		Exporting Arrow data with the C API from Python to Go
	Streaming across the C Data API
		Streaming record batches from Python to Go
	Other use cases
		Some exercises
	Summary
Chapter 6: Leveraging the Arrow Compute APIs
	Technical requirements
	Letting Arrow do the work for you
		Input shaping
		Value casting
		Types of functions
	Executing compute functions
		Using the C++ compute library
		Using the compute library in Python
	Picking the right tools
		Adding a constant value to an array
	Summary
Chapter 7: Using the Arrow Datasets API
	Technical requirements
	Querying multifile datasets
		Creating a sample dataset
		Discovering dataset fragments
	Filtering data programmatically
		Expressing yourself – a quick detour
		Using expressions for filtering data
		Deriving and renaming columns (projecting)
	Using the Datasets API in Python
		Creating our sample dataset
		Discovering the dataset
		Using different file formats
		Filtering and projecting columns with Python
	Streaming results
		Working with partitioned datasets
	Summary
Chapter 8: Exploring Apache Arrow Flight RPC
	Technical requirements
	The basics and complications of gRPC
		Building modern APIs for data
		Efficiency and streaming are important
	Arrow Flight's building blocks
		Horizontal scalability with Arrow Flight
		Adding your business logic to Flight
		Other bells and whistles
		Understanding the Flight Protocol Buffer definitions
	Using Flight, choose your language!
		Building a Python Flight Server
		Building a Go Flight server
	What is Flight SQL?
		Setting up a performance test
		Running the performance test
		Flight SQL, the new kid on the block
	Summary
Section 3: Real-World Examples, Use Cases, and Future Development
Chapter 9: Powered by Apache Arrow
	Swimming in data with Dremio Sonar
		Clarifying Dremio Sonar's architecture
		The library of the Gods…of data analysis
	Spicing up your ML workflows
		Bringing the AI engine to where the data lives
	Arrow in the browser using JavaScript
		Gaining a little perspective
		Taking flight with Falcon
	Summary
Chapter 10: How to Leave Your Mark on Arrow
	Technical requirements
	Contributing to open source projects
		Communication is key
		You don't necessarily have to contribute code
		There are a lot of reasons why you should contribute!
	Preparing your first pull request
		Navigating JIRA
		Setting up Git
		Orienting yourself in the code base
		Building the Arrow libraries
		Creating the PR
		Understanding the CI configuration
		Development using Archery
	Find your interest and expand on it
	Getting that sweet, sweet approval
	Finishing up with style!
		C++ styling
		Python code styling
		Go code styling
	Summary
Chapter 11: Future Development and Plans
	Examining Flight SQL (redux)
		Why Flight SQL?
		Defining the Flight SQL protocol
	Firing a Ballista using Data(Fusion)
		What about Spark?
		Looking at Ballista's development roadmap
	Building a cross-language compute serialization
		Why Substrait?
		Working with Substrait serialization
		Getting involved with Substrait development
	Final words
Index
Other Books You May Enjoy




نظرات کاربران