دسترسی نامحدود
برای کاربرانی که ثبت نام کرده اند
برای ارتباط با ما می توانید از طریق شماره موبایل زیر از طریق تماس و پیامک با ما در ارتباط باشید
در صورت عدم پاسخ گویی از طریق پیامک با پشتیبان در ارتباط باشید
برای کاربرانی که ثبت نام کرده اند
درصورت عدم همخوانی توضیحات با کتاب
از ساعت 7 صبح تا 10 شب
ویرایش: نویسندگان: Angelica Lo Duca, Tim Meehan, Vivek Bharathan, and Ying Su سری: ISBN (شابک) : 9781098141851 ناشر: O’Reilly Media, Inc. سال نشر: 2023 تعداد صفحات: 194 زبان: English فرمت فایل : PDF (درصورت درخواست کاربر به PDF، EPUB یا AZW3 تبدیل می شود) حجم فایل: 5 Mb
در صورت تبدیل فایل کتاب Learning and Operating Presto: Fast, Reliable SQL for Data Analytics and Lakehouses به فرمت های PDF، EPUB، AZW3، MOBI و یا DJVU می توانید به پشتیبان اطلاع دهید تا فایل مورد نظر را تبدیل نمایند.
توجه داشته باشید کتاب یادگیری و اجرای Presto: SQL سریع و قابل اعتماد برای تجزیه و تحلیل داده ها و Lakehouses نسخه زبان اصلی می باشد و کتاب ترجمه شده به فارسی نمی باشد. وبسایت اینترنشنال لایبرری ارائه دهنده کتاب های زبان اصلی می باشد و هیچ گونه کتاب ترجمه شده یا نوشته شده به فارسی را ارائه نمی دهد.
جامعه Presto از زمان پیدایش آن در فیس بوک در سال 2012 به صورت قارچ گونه رشد کرده است. اما افزایش این موتور جستجوی توزیع شده SQL می تواند حتی برای باتجربه ترین مهندسان نیز چالش برانگیز باشد. این کتاب عملی به شما نشان می دهد که چگونه عملیات Presto را در سازمان خود شروع کنید تا بینش هایی را در مورد مجموعه داده ها در هر کجا که ساکن هستند به دست آورید. نویسندگان Angelica Lo Duca، Vivek Bharathan و George Wang توضیح میدهند که Presto چیست، از کجا آمده است، و تفاوت آن با سایر راهحلهای ذخیرهسازی داده چیست. متوجه خواهید شد که چرا فیس بوک، اوبر، توییتر و ارائه دهندگان ابر، از جمله AWS، Google Cloud، و Alibaba از Presto استفاده می کنند و چگونه می توانید به سرعت Presto را در تولید مستقر کنید. شما درباره موارد زیر یاد خواهید گرفت: امنیت و مدیریت Presto نحو و اتصالات خوشهها و تنظیم عیبیابی: گزارشها، پیامهای خطا و موارد دیگر گسترش Presto برای بینش تجاری در زمان واقعی گسترش PrestoDB
The Presto community has mushroomed since its origins at Facebook in 2012. But ramping up this distributed SQL query engine can be challenging even for the most experienced engineers. This practical book shows you how to begin Presto operations at your organization to derive insights on datasets wherever they reside. Authors Angelica Lo Duca, Vivek Bharathan, and George Wang explain what Presto is, where it came from, and how it differs from other data warehousing solutions. You\'ll discover why Facebook, Uber, Twitter, and cloud providers, including AWS, Google Cloud, and Alibaba, use Presto and how you can quickly deploy Presto in production. You\'ll learn about: Presto security and administration Syntax and connectors Clusters and tuning Troubleshooting: logs, error messages, and more Extending Presto for real-time business insight Extending PrestoDB
Preface Why We Wrote This Book Who This Book Is For Conventions Used in This Book Using Code Examples O’Reilly Online Learning How to Contact Us Acknowledgments Angelica Lo Duca Tim Meehan Vivek Bharathan Ying Su 1. Introduction to Presto Data Warehouses and Data Lakes The Role of Presto in a Data Lake Presto Origins and Design Considerations High Performance High Scalability Compliance with the ANSI SQL Standard Federation of Data Sources Running in the Cloud Presto Architecture and Core Components Alternatives to Presto Apache Impala Apache Hive Spark SQL Trino Presto Use Cases Reporting and Dashboarding Ad Hoc Querying ETL Using SQL Data Lakehouse Real-Time Analytics with Real-Time Databases Introducing Our Case Study Conclusion 2. Getting Started with Presto Presto Manual Installation Running Presto on Docker Installing Docker Presto Docker Image Dockerfile The etc/ directory node.properties jvm.config config.properties log.properties catalog/.properties Building and Running Presto on Docker The Presto Sandbox Deploying Presto on Kubernetes Introducing Kubernetes Configuring Presto on Kubernetes presto-coordinator.yaml presto-workers.yaml presto-config-map.yaml presto-secrets.yaml Adding a New Catalog Running the Deployment on Kubernetes Querying Your Presto Instance Listing Catalogs Listing Schemas Listing Tables Querying a Table Conclusion 3. Connectors Service Provider Interface Connector Architecture Popular Connectors Thrift Writing a Custom Connector Prerequisites Plugin and Module ExamplePlugin ExampleConnectorFactory ExampleModule ExampleConnector ExampleHandleResolver Configuration ExampleConfig SessionProperties TableProperties Metadata Data model Handles ExampleMetadata ExampleClient Input/Output ExampleSplitManager ExampleSplit ExampleRecordSetProvider and ExampleRecordSet ExampleRecordCursor Deploying Your Connector Apache Pinot Setting Up and Configuring Presto Setting up Pinot Configuring Pinot Configuring Presto with Pinot Presto-Pinot Querying in Action Conclusion 4. Client Connectivity Setting Up the Environment Presto Client Docker Image Kubernetes Node Connectivity to Presto REST API Python R JDBC Node.js ODBC Other Presto Client Libraries Building a Client Dashboard in Python Setting Up the Client Building the Dashboard Connecting to and querying Presto Preparing the results of the query Building the first graph Building the second graph Conclusion 5. Open Data Lakehouse Analytics The Emergence of the Lakehouse Data Lakehouse Architecture Data Lake File Store File Format Table Format Query Engine Metadata Management Data Governance Data Access Control Building a Data Lakehouse Configuring MinIO Populating MinIO Configuring HMS Configuring Spark Registering Hudi Tables with HMS Connecting and Querying Presto Conclusion 6. Presto Administration Introducing Presto Administration Configuration Properties How to configure a cluster Sessions Using sessions JVM Memory Out-of-memory errors Garbage collection Monitoring Console Using the console for monitoring Using the console for debugging Using the console for going over the interactive plan REST API Metrics JMX connector REST API JMX exporters Management Resource Groups Configuring resource groups Resource groups properties Example Verifiers Setting up the system Configuring the MySQL database Configuring the Presto verifier Running a test Session Properties Managers Configuring a session property manager Namespace Functions Setting up the system Configuring a function Running a test Conclusion 7. Understanding Security in Presto Introducing Presto Security Building Secure Communication in Presto Encryption Keystore Management Configuring HTTPS/TLS Running a Presto client Running the Presto console Authentication File-Based Authentication Running a Presto client Running the Presto console LDAP Kerberos Prerequisites Configuring the Presto coordinator and workers Configuring the Presto client Creating a Custom Authenticator Authorization Authorizing Access to the Presto REST API Configuring System Access Control Authorization Through Apache Ranger Building a custom audit function Conclusion 8. Performance Tuning Introducing Performance Tuning Reasons for Performance Tuning The Performance Tuning Life Cycle Query Execution Model Approaches for Performance Tuning in Presto Resource Allocation Storage Query Optimization Aria Scan Table Scanning Repartitioning Implementing Performance Tuning Building and Importing the Sample CSV Table in MinIO Converting the CSV Table in ORC Defining the Tuning Parameters Running Tests Default parameters Reducing CPU usage Query optimization Aria scan Conclusion 9. Operating Presto at Scale Introducing Scalability Reasons to Scale Presto Common Issues Design Considerations Availability Manageability Performance Protection Configuration How to Scale Presto Multiple Coordinators Presto on Spark Spilling Using a Cloud Service Conclusion Index