دسترسی نامحدود
برای کاربرانی که ثبت نام کرده اند
برای ارتباط با ما می توانید از طریق شماره موبایل زیر از طریق تماس و پیامک با ما در ارتباط باشید
در صورت عدم پاسخ گویی از طریق پیامک با پشتیبان در ارتباط باشید
برای کاربرانی که ثبت نام کرده اند
درصورت عدم همخوانی توضیحات با کتاب
از ساعت 7 صبح تا 10 شب
ویرایش: [1 ed.]
نویسندگان: Sakti Mishra
سری:
ISBN (شابک) : 1801071071, 9781801071079
ناشر:
سال نشر: 2022
تعداد صفحات: 430
زبان: English
فرمت فایل : PDF (درصورت درخواست کاربر به PDF، EPUB یا AZW3 تبدیل می شود)
حجم فایل: 11 Mb
در صورت تبدیل فایل کتاب Simplify Big Data Analytics with Amazon EMR: A Beginner's Guide to Learning and Implementing Amazon EMR for Building Data Analytics Solutions به فرمت های PDF، EPUB، AZW3، MOBI و یا DJVU می توانید به پشتیبان اطلاع دهید تا فایل مورد نظر را تبدیل نمایند.
توجه داشته باشید کتاب ساده سازی تجزیه و تحلیل داده های بزرگ با آمازون EMR: راهنمای مبتدیان برای یادگیری و پیاده سازی آمازون EMR برای ایجاد راه حل های تجزیه و تحلیل داده ها نسخه زبان اصلی می باشد و کتاب ترجمه شده به فارسی نمی باشد. وبسایت اینترنشنال لایبرری ارائه دهنده کتاب های زبان اصلی می باشد و هیچ گونه کتاب ترجمه شده یا نوشته شده به فارسی را ارائه نمی دهد.
طراحی راهحلهای کلان داده مقیاسپذیر با استفاده از سرویسهای بومی ابری Hadoop، Spark و AWS ویژگیهای کلیدی: ایجاد خطوط لوله دادهای که به قابلیتهای پردازش توزیع شده روی حجم زیادی از دادهها نیاز دارند کشف ویژگیهای امنیتی EMR مانند حفاظت از دادهها و مدیریت مجوز گرانول کاوش بهترین شیوهها و تکنیکهای بهینهسازی برای ساخت راهحلهای تجزیه و تحلیل داده در آمازون EMR شرح کتاب: Amazon EMR، قبلاً Amazon Elastic MapReduce، یک خوشه Hadoop مدیریتشده در خدمات وب آمازون (AWS) ارائه میکند که میتوانید از آن برای پیادهسازی خطوط لوله داده دستهای یا جریانی استفاده کنید. با کسب تخصص در آمازون EMR، می توانید خطوط لوله تجزیه و تحلیل داده را با خوشه های EMR پایدار یا گذرا در AWS طراحی و پیاده سازی کنید. این کتاب راهنمای عملی آمازون EMR برای ساخت خطوط لوله داده است. شما با درک معماری آمازون EMR، گرههای خوشه، ویژگیها و گزینههای استقرار، همراه با قیمتگذاری آنها شروع خواهید کرد. در مرحله بعد، این کتاب برنامه های مختلف داده های بزرگی را که EMR پشتیبانی می کند را پوشش می دهد. سپس روی پیکربندی پیشرفته برنامههای EMR، سختافزار، شبکه، امنیت، عیبیابی، گزارشگیری، و SDKها و APIهای مختلفی که ارائه میکند تمرکز خواهید کرد. فصلهای بعدی به شما نشان میدهند که چگونه موارد استفاده متداول آمازون EMR، از جمله ETL دستهای با Spark، استریم بلادرنگ با Spark Streaming و مدیریت UPSERT در S3 Data Lake با Apache Hudi را به شما نشان میدهند. در نهایت، مشاغل EMR خود را سازماندهی خواهید کرد و مهاجرت خوشه Hadoop به EMR را در محل سازماندهی خواهید کرد. علاوه بر این، هنگام پیادهسازی خط لوله تجزیه و تحلیل دادهها در EMR، بهترین شیوهها و تکنیکهای بهینهسازی هزینه را بررسی خواهید کرد. تا پایان این کتاب، میتوانید برنامههای مبتنی بر Hadoop یا Spark را در آمازون EMR بسازید و استقرار دهید و همچنین حجمهای کاری Hadoop موجود در محل خود را به AWS منتقل کنید. آنچه خواهید آموخت: کاوش ویژگیهای آمازون EMR، معماری، رابطهای Hadoop و EMR Studio پیکربندی، استقرار، و هماهنگسازی مشاغل Hadoop یا Spark در تولید پیادهسازی امنیت، مدیریت دادهها و قابلیتهای نظارت برنامههای EMR Build به صورت دستهای و در زمان واقعی راهحلهای تجزیه و تحلیل دادههای جریانی انجام توسعه تعاملی با خوشه EMR و نوتبوک مداوم یک کار EMR Spark با استفاده از AWS Step Functions و Apache Airflow این کتاب برای چه کسی است: این کتاب برای مهندسان داده، تحلیلگران داده، دانشمندان داده و معماران راهحل است. علاقه مند به ساخت راه حل های تجزیه و تحلیل داده با خدمات اکوسیستم Hadoop و آمازون EMR است. تجربه قبلی در برنامه نویسی پایتون، اسکالا یا زبان برنامه نویسی جاوا و درک اولیه Hadoop و AWS به شما کمک می کند تا از این کتاب نهایت استفاده را ببرید.
Design scalable big data solutions using Hadoop, Spark, and AWS cloud native services Key Features: Build data pipelines that require distributed processing capabilities on a large volume of data Discover the security features of EMR such as data protection and granular permission management Explore best practices and optimization techniques for building data analytics solutions in Amazon EMR Book Description: Amazon EMR, formerly Amazon Elastic MapReduce, provides a managed Hadoop cluster in Amazon Web Services (AWS) that you can use to implement batch or streaming data pipelines. By gaining expertise in Amazon EMR, you can design and implement data analytics pipelines with persistent or transient EMR clusters in AWS. This book is a practical guide to Amazon EMR for building data pipelines. You'll start by understanding the Amazon EMR architecture, cluster nodes, features, and deployment options, along with their pricing. Next, the book covers the various big data applications that EMR supports. You'll then focus on the advanced configuration of EMR applications, hardware, networking, security, troubleshooting, logging, and the different SDKs and APIs it provides. Later chapters will show you how to implement common Amazon EMR use cases, including batch ETL with Spark, real-time streaming with Spark Streaming, and handling UPSERT in S3 Data Lake with Apache Hudi. Finally, you'll orchestrate your EMR jobs and strategize on-premises Hadoop cluster migration to EMR. In addition to this, you'll explore best practices and cost optimization techniques while implementing your data analytics pipeline in EMR. By the end of this book, you'll be able to build and deploy Hadoop- or Spark-based apps on Amazon EMR and also migrate your existing on-premises Hadoop workloads to AWS. What You Will Learn: Explore Amazon EMR features, architecture, Hadoop interfaces, and EMR Studio Configure, deploy, and orchestrate Hadoop or Spark jobs in production Implement the security, data governance, and monitoring capabilities of EMR Build applications for batch and real-time streaming data analytics solutions Perform interactive development with a persistent EMR cluster and Notebook Orchestrate an EMR Spark job using AWS Step Functions and Apache Airflow Who this book is for: This book is for data engineers, data analysts, data scientists, and solution architects who are interested in building data analytics solutions with the Hadoop ecosystem services and Amazon EMR. Prior experience in either Python programming, Scala, or the Java programming language and a basic understanding of Hadoop and AWS will help you make the most out of this book.