دسترسی نامحدود
برای کاربرانی که ثبت نام کرده اند
برای ارتباط با ما می توانید از طریق شماره موبایل زیر از طریق تماس و پیامک با ما در ارتباط باشید
در صورت عدم پاسخ گویی از طریق پیامک با پشتیبان در ارتباط باشید
برای کاربرانی که ثبت نام کرده اند
درصورت عدم همخوانی توضیحات با کتاب
از ساعت 7 صبح تا 10 شب
ویرایش: 2
نویسندگان: Alan Gates. Daniel Dai
سری:
ناشر: O’Reilly Media
سال نشر: 2016
تعداد صفحات: 390
زبان: English
فرمت فایل : PDF (درصورت درخواست کاربر به PDF، EPUB یا AZW3 تبدیل می شود)
حجم فایل: 12 مگابایت
در صورت تبدیل فایل کتاب Programming Pig Dataflow Scripting with Hadoop به فرمت های PDF، EPUB، AZW3، MOBI و یا DJVU می توانید به پشتیبان اطلاع دهید تا فایل مورد نظر را تبدیل نمایند.
توجه داشته باشید کتاب برنامه نویسی Pig Dataflow Scripting با Hadoop نسخه زبان اصلی می باشد و کتاب ترجمه شده به فارسی نمی باشد. وبسایت اینترنشنال لایبرری ارائه دهنده کتاب های زبان اصلی می باشد و هیچ گونه کتاب ترجمه شده یا نوشته شده به فارسی را ارائه نمی دهد.
برای بسیاری از سازمان ها، Hadoop اولین گام برای مقابله با حجم عظیم داده است. گام بعدی؟ پردازش و تجزیه و تحلیل مجموعه داده ها با پلت فرم برنامه نویسی Apache Pig. با Pig، میتوانید دادهها را بدون نیاز به ایجاد یک برنامه کامل پردازش کنید و آزمایش مجموعه دادههای جدید را آسان میکند. این نسخه دوم که با موارد استفاده و نمونه های برنامه نویسی به روز شده است، ابزار یادگیری ایده آلی برای کاربران جدید و با تجربه است. پوشش جامعی در مورد ویژگی های کلیدی مانند زبان اسکریپت لاتین Pig و پوسته Grunt پیدا خواهید کرد. هنگامی که شما نیاز به تجزیه و تحلیل ترابایت داده دارید، این کتاب به شما نشان می دهد که چگونه این کار را به طور موثر با Pig انجام دهید. در مدل دادههای Pig، از جمله انواع دادههای اسکالر و پیچیده، اسکریپتهای لاتین Pig را بنویسید تا دادههای خود را مرتب کنید، گروهبندی کنید، بپیوندید، پروژه دهید و فیلتر کنید. از Grunt برای کار با سیستم فایل توزیع شده Hadoop (HDFS) استفاده کنید. و ویژگیهای ماژولاریت جاسازی Pig Latin در Python برای پردازش تکراری و سایر کارهای پیشرفته از Pig با Apache Tez برای ساخت برنامههای پردازش دادههای دستهای و تعاملی با کارایی بالا استفاده کنید بار خود را ایجاد کنید و توابع ذخیرهسازی را برای مدیریت قالبهای داده و مکانیسمهای ذخیرهسازی ایجاد کنید.
For many organizations, Hadoop is the first step for dealing with massive amounts of data. The next step? Processing and analyzing datasets with the Apache Pig scripting platform. With Pig, you can batch-process data without having to create a full-fledged application, making it easy to experiment with new datasets. Updated with use cases and programming examples, this second edition is the ideal learning tool for new and experienced users alike. You’ll find comprehensive coverage on key features such as the Pig Latin scripting language and the Grunt shell. When you need to analyze terabytes of data, this book shows you how to do it efficiently with Pig. Delve into Pig’s data model, including scalar and complex data types Write Pig Latin scripts to sort, group, join, project, and filter your data Use Grunt to work with the Hadoop Distributed File System (HDFS) Build complex data processing pipelines with Pig’s macros and modularity features Embed Pig Latin in Python for iterative processing and other advanced tasks Use Pig with Apache Tez to build high-performance batch and interactive data processing applications Create your own load and store functions to handle data formats and storage mechanisms