دسترسی نامحدود
برای کاربرانی که ثبت نام کرده اند
برای ارتباط با ما می توانید از طریق شماره موبایل زیر از طریق تماس و پیامک با ما در ارتباط باشید
در صورت عدم پاسخ گویی از طریق پیامک با پشتیبان در ارتباط باشید
برای کاربرانی که ثبت نام کرده اند
درصورت عدم همخوانی توضیحات با کتاب
از ساعت 7 صبح تا 10 شب
ویرایش: [1 ed.]
نویسندگان: Sev Leonard
سری:
ISBN (شابک) : 1492098647, 9781492098645
ناشر: O'Reilly Media
سال نشر: 2023
تعداد صفحات: 275
زبان: English
فرمت فایل : EPUB (درصورت درخواست کاربر به PDF، EPUB یا AZW3 تبدیل می شود)
حجم فایل: 5 Mb
در صورت تبدیل فایل کتاب Cost-Effective Data Pipelines: Balancing Trade-Offs When Developing Pipelines in the Cloud به فرمت های PDF، EPUB، AZW3، MOBI و یا DJVU می توانید به پشتیبان اطلاع دهید تا فایل مورد نظر را تبدیل نمایند.
توجه داشته باشید کتاب خطوط لوله داده مقرون به صرفه: ایجاد تعادل در معاملات هنگام توسعه خطوط لوله در فضای ابری نسخه زبان اصلی می باشد و کتاب ترجمه شده به فارسی نمی باشد. وبسایت اینترنشنال لایبرری ارائه دهنده کتاب های زبان اصلی می باشد و هیچ گونه کتاب ترجمه شده یا نوشته شده به فارسی را ارائه نمی دهد.
هزینه پایین شروع خدمات ابری به راحتی می تواند به هزینه های قابل توجهی تبدیل شود. این برای تیم هایی که خطوط لوله داده را توسعه می دهند، چالش برانگیز است، به ویژه زمانی که تغییرات سریع در فناوری و حجم کاری نیازمند چرخه ثابتی از طراحی مجدد است. چگونه محصولات مقیاس پذیر و بسیار در دسترس را در حالی که هزینه ها را کنترل می کنید، ارائه می دهید؟ با این راهنمای عملی، نویسنده Sev Leonard یک رویکرد جامع برای طراحی خطوط لوله داده مقیاس پذیر در ابر ارائه می دهد. مهندسان دادههای متوسط، توسعهدهندگان نرمافزار، و معماران یاد میگیرند که چگونه در مبادلات هزینه/عملکرد و نحوه انتخاب و پیکربندی محاسبات و ذخیرهسازی پیمایش کنند. همچنین بهترین روشها را برای توسعه کد، آزمایش و نظارت انتخاب خواهید کرد. با تمرکز بر کل فرآیند طراحی، شما قادر خواهید بود محصولات مقرون به صرفه و با کیفیت بالا ارائه دهید. این کتاب به شما کمک می کند: با ارائه خدمات ابری کم هزینه و استراتژی های طراحی هوشمند، هزینه های ابری را کاهش دهید. وابستگیهای سرویس ابری ایجاد پایگاههای کد خط لوله داده که قابل آزمایش و توسعه هستند، توسعه و تکامل سریع را تقویت میکنند. کیفیت داده و عملکرد خط لوله را از طریق اعتبارسنجی و آزمایش بهبود میبخشند.
The low cost of getting started with cloud services can easily evolve into a significant expense down the road. That\'s challenging for teams developing data pipelines, particularly when rapid changes in technology and workload require a constant cycle of redesign. How do you deliver scalable, highly available products while keeping costs in check? With this practical guide, author Sev Leonard provides a holistic approach to designing scalable data pipelines in the cloud. Intermediate data engineers, software developers, and architects will learn how to navigate cost/performance trade-offs and how to choose and configure compute and storage. You\'ll also pick up best practices for code development, testing, and monitoring. By focusing on the entire design process, you\'ll be able to deliver cost-effective, high-quality products. This book helps you: Reduce cloud spend with lower cost cloud service offerings and smart design strategies Minimize waste without sacrificing performance by rightsizing compute resources Drive pipeline evolution, head off performance issues, and quickly debug with effective monitoring Set up development and test environments that minimize cloud service dependencies Create data pipeline code bases that are testable and extensible, fostering rapid development and evolution Improve data quality and pipeline operation through validation and testing
Cover Copyright Table of Contents Preface Who This Book Is For What You Will Learn What This Book Is Not Running Example Conventions Used in This Book Using Code Examples O’Reilly Online Learning How to Contact Us Acknowledgments Chapter 1. Designing Compute for Data Pipelines Understanding Availability of Cloud Compute Outages Capacity Limits Account Limits Infrastructure Leveraging Different Purchasing Options in Pipeline Design On Demand Spot/Interruptible Contractual Discounts Contractual Discounts in the Real World: A Cautionary Tale Requirements Gathering for Compute Design Business Requirements Architectural Requirements Requirements-Gathering Example: HoD Batch Ingest Benchmarking Instance Family Identification Cluster Sizing Monitoring Benchmarking Example Undersized Oversized Right-Sized Summary Recommended Readings Chapter 2. Responding to Changes in Demand by Scaling Compute Identifying Scaling Opportunities Variation in Data Pipelines Scaling Metrics Pipeline Scaling Example Designing for Scaling Implementing Scaling Plans Scaling Mechanics Common Autoscaling Pitfalls Autoscaling Example Summary Recommended Readings Chapter 3. Data Organization in the Cloud Cloud Storage Costs Storage at Rest Egress Data Access Cloud Storage Organization Storage Bucket Strategies Lifecycle Configurations File Structure Design File Formats Partitioning Compaction Summary Recommended Readings Chapter 4. Economical Pipeline Fundamentals Idempotency Preventing Data Duplication Tolerating Data Duplication Checkpointing Automatic Retries Retry Considerations Retry Levels in Data Pipelines Data Validation Validating Data Characteristics Schemas Summary Chapter 5. Setting Up Effective Development Environments Environments Software Environments Data Environments Data Pipeline Environments Environment Planning Local Development Containers Resource Dependency Reduction Resource Cleanup Summary Chapter 6. Software Development Strategies Managing Different Coding Environments Example: A Multimodal Pipeline Example: How Code Becomes Difficult to Change Modular Design Single Responsibility Dependency Inversion Modular Design with DataFrames Configurable Design Summary Recommended Readings Chapter 7. Unit Testing The Role of Unit Testing in Data Pipelines Unit Testing Overview Example: Identifying Unit Testing Needs Pipeline Areas to Unit-Test Data Logic Connections Observability Data Modification Processes Cloud Components Working with Dependencies Interfaces Data Example: Unit Testing Plan Identifying Components to Test Identifying Dependencies Summary Chapter 8. Mocks Considerations for Replacing Dependencies Placement Dependency Stability Complexity Versus Criticality Mocking Generic Interfaces Responses Requests Connectivity Mocking Cloud Services Building Your Own Mocks Mocking with Moto Testing with Databases Test Database Example Working with Test Databases Summary Further Exploration More Moto Mocks Mock Placement Chapter 9. Data for Testing Working with Live Data Benefits Challenges Working with Synthetic Data Benefits Challenges Is Synthetic Data the Right Approach? Manual Data Generation Automated Data Generation Synthetic Data Libraries Schema-Driven Generation Property-Based Testing Summary Chapter 10. Logging Logging Costs Impact of Scale Impact of Cloud Storage Elasticity Reducing Logging Costs Effective Logging Summary Chapter 11. Finding Your Way with Monitoring Costs of Inadequate Monitoring Getting Lost in the Woods Navigation to the Rescue System Monitoring Data Volume Throughput Consumer Lag Worker Utilization Resource Monitoring Understanding the Bounds Understanding Reliability Impacts Pipeline Performance Pipeline Stage Duration Profiling Errors to Watch Out For Query Monitoring Minimizing Monitoring Costs Summary Recommended Readings Chapter 12. Essential Takeaways An Ounce of Prevention Is Worth a Pound of Cure Reign In Compute Spend Organize Your Resources Design for Interruption Build In Data Quality Change Is the Only Constant Design for Change Monitor for Change Parting Thoughts Appendix A. Preparing a Cloud Budget It’s All About the Details Historical Data Estimating for New Projects Changes That Impact Costs Creating a Budget Budget Summary Changes Between Previous and Next Budget Periods Cost Breakdown Communicating the Budget Summary Index About the Author Colophon