ورود به حساب

نام کاربری گذرواژه

گذرواژه را فراموش کردید؟ کلیک کنید

حساب کاربری ندارید؟ ساخت حساب

ساخت حساب کاربری

نام نام کاربری ایمیل شماره موبایل گذرواژه

برای ارتباط با ما می توانید از طریق شماره موبایل زیر از طریق تماس و پیامک با ما در ارتباط باشید


09117307688
09117179751

در صورت عدم پاسخ گویی از طریق پیامک با پشتیبان در ارتباط باشید

دسترسی نامحدود

برای کاربرانی که ثبت نام کرده اند

ضمانت بازگشت وجه

درصورت عدم همخوانی توضیحات با کتاب

پشتیبانی

از ساعت 7 صبح تا 10 شب

دانلود کتاب Cost-Effective Data Pipelines: Balancing Trade-Offs When Developing Pipelines in the Cloud

دانلود کتاب خطوط لوله داده مقرون به صرفه: ایجاد تعادل در معاملات هنگام توسعه خطوط لوله در فضای ابری

Cost-Effective Data Pipelines: Balancing Trade-Offs When Developing Pipelines in the Cloud

مشخصات کتاب

Cost-Effective Data Pipelines: Balancing Trade-Offs When Developing Pipelines in the Cloud

ویرایش: [1 ed.] 
نویسندگان:   
سری:  
ISBN (شابک) : 1492098647, 9781492098645 
ناشر: O'Reilly Media 
سال نشر: 2023 
تعداد صفحات: 275 
زبان: English 
فرمت فایل : EPUB (درصورت درخواست کاربر به PDF، EPUB یا AZW3 تبدیل می شود) 
حجم فایل: 5 Mb 

قیمت کتاب (تومان) : 44,000



ثبت امتیاز به این کتاب

میانگین امتیاز به این کتاب :
       تعداد امتیاز دهندگان : 6


در صورت تبدیل فایل کتاب Cost-Effective Data Pipelines: Balancing Trade-Offs When Developing Pipelines in the Cloud به فرمت های PDF، EPUB، AZW3، MOBI و یا DJVU می توانید به پشتیبان اطلاع دهید تا فایل مورد نظر را تبدیل نمایند.

توجه داشته باشید کتاب خطوط لوله داده مقرون به صرفه: ایجاد تعادل در معاملات هنگام توسعه خطوط لوله در فضای ابری نسخه زبان اصلی می باشد و کتاب ترجمه شده به فارسی نمی باشد. وبسایت اینترنشنال لایبرری ارائه دهنده کتاب های زبان اصلی می باشد و هیچ گونه کتاب ترجمه شده یا نوشته شده به فارسی را ارائه نمی دهد.


توضیحاتی در مورد کتاب خطوط لوله داده مقرون به صرفه: ایجاد تعادل در معاملات هنگام توسعه خطوط لوله در فضای ابری

هزینه پایین شروع خدمات ابری به راحتی می تواند به هزینه های قابل توجهی تبدیل شود. این برای تیم هایی که خطوط لوله داده را توسعه می دهند، چالش برانگیز است، به ویژه زمانی که تغییرات سریع در فناوری و حجم کاری نیازمند چرخه ثابتی از طراحی مجدد است. چگونه محصولات مقیاس پذیر و بسیار در دسترس را در حالی که هزینه ها را کنترل می کنید، ارائه می دهید؟ با این راهنمای عملی، نویسنده Sev Leonard یک رویکرد جامع برای طراحی خطوط لوله داده مقیاس پذیر در ابر ارائه می دهد. مهندسان داده‌های متوسط، توسعه‌دهندگان نرم‌افزار، و معماران یاد می‌گیرند که چگونه در مبادلات هزینه/عملکرد و نحوه انتخاب و پیکربندی محاسبات و ذخیره‌سازی پیمایش کنند. همچنین بهترین روش‌ها را برای توسعه کد، آزمایش و نظارت انتخاب خواهید کرد. با تمرکز بر کل فرآیند طراحی، شما قادر خواهید بود محصولات مقرون به صرفه و با کیفیت بالا ارائه دهید. این کتاب به شما کمک می کند: با ارائه خدمات ابری کم هزینه و استراتژی های طراحی هوشمند، هزینه های ابری را کاهش دهید. وابستگی‌های سرویس ابری ایجاد پایگاه‌های کد خط لوله داده که قابل آزمایش و توسعه هستند، توسعه و تکامل سریع را تقویت می‌کنند. کیفیت داده و عملکرد خط لوله را از طریق اعتبارسنجی و آزمایش بهبود می‌بخشند.


توضیحاتی درمورد کتاب به خارجی

The low cost of getting started with cloud services can easily evolve into a significant expense down the road. That\'s challenging for teams developing data pipelines, particularly when rapid changes in technology and workload require a constant cycle of redesign. How do you deliver scalable, highly available products while keeping costs in check? With this practical guide, author Sev Leonard provides a holistic approach to designing scalable data pipelines in the cloud. Intermediate data engineers, software developers, and architects will learn how to navigate cost/performance trade-offs and how to choose and configure compute and storage. You\'ll also pick up best practices for code development, testing, and monitoring. By focusing on the entire design process, you\'ll be able to deliver cost-effective, high-quality products. This book helps you: Reduce cloud spend with lower cost cloud service offerings and smart design strategies Minimize waste without sacrificing performance by rightsizing compute resources Drive pipeline evolution, head off performance issues, and quickly debug with effective monitoring Set up development and test environments that minimize cloud service dependencies Create data pipeline code bases that are testable and extensible, fostering rapid development and evolution Improve data quality and pipeline operation through validation and testing



فهرست مطالب

Cover
Copyright
Table of Contents
Preface
	Who This Book Is For
	What You Will Learn
	What This Book Is Not
	Running Example
	Conventions Used in This Book
	Using Code Examples
	O’Reilly Online Learning
	How to Contact Us
	Acknowledgments
Chapter 1. Designing Compute for Data Pipelines
	Understanding Availability of Cloud Compute
		Outages
		Capacity Limits
		Account Limits
		Infrastructure
	Leveraging Different Purchasing Options in Pipeline Design
		On Demand
		Spot/Interruptible
		Contractual Discounts
		Contractual Discounts in the Real World: A Cautionary Tale
	Requirements Gathering for Compute Design
		Business Requirements
		Architectural Requirements
		Requirements-Gathering Example: HoD Batch Ingest
	Benchmarking
		Instance Family Identification
		Cluster Sizing
		Monitoring
	Benchmarking Example
		Undersized
		Oversized
		Right-Sized
	Summary
	Recommended Readings
Chapter 2. Responding to Changes in Demand by Scaling Compute
	Identifying Scaling Opportunities
		Variation in Data Pipelines
		Scaling Metrics
		Pipeline Scaling Example
	Designing for Scaling
	Implementing Scaling Plans
		Scaling Mechanics
		Common Autoscaling Pitfalls
	Autoscaling Example
	Summary
	Recommended Readings
Chapter 3. Data Organization in the Cloud
	Cloud Storage Costs
		Storage at Rest
		Egress
		Data Access
	Cloud Storage Organization
		Storage Bucket Strategies
		Lifecycle Configurations
	File Structure Design
		File Formats
		Partitioning
		Compaction
	Summary
	Recommended Readings
Chapter 4. Economical Pipeline Fundamentals
	Idempotency
		Preventing Data Duplication
		Tolerating Data Duplication
	Checkpointing
	Automatic Retries
		Retry Considerations
		Retry Levels in Data Pipelines
	Data Validation
		Validating Data Characteristics
		Schemas
	Summary
Chapter 5. Setting Up Effective Development Environments
	Environments
		Software Environments
		Data Environments
		Data Pipeline Environments
		Environment Planning
	Local Development
		Containers
		Resource Dependency Reduction
		Resource Cleanup
	Summary
Chapter 6. Software Development Strategies
	Managing Different Coding Environments
		Example: A Multimodal Pipeline
	Example: How Code Becomes Difficult to Change
	Modular Design
		Single Responsibility
		Dependency Inversion
		Modular Design with DataFrames
	Configurable Design
	Summary
	Recommended Readings
Chapter 7. Unit Testing
	The Role of Unit Testing in Data Pipelines
		Unit Testing Overview
		Example: Identifying Unit Testing Needs
	Pipeline Areas to Unit-Test
		Data Logic
		Connections
		Observability
		Data Modification Processes
		Cloud Components
	Working with Dependencies
		Interfaces
		Data
	Example: Unit Testing Plan
		Identifying Components to Test
		Identifying Dependencies
	Summary
Chapter 8. Mocks
	Considerations for Replacing Dependencies
		Placement
		Dependency Stability
		Complexity Versus Criticality
	Mocking Generic Interfaces
		Responses
		Requests
		Connectivity
	Mocking Cloud Services
		Building Your Own Mocks
		Mocking with Moto
	Testing with Databases
		Test Database Example
		Working with Test Databases
	Summary
	Further Exploration
		More Moto Mocks
		Mock Placement
Chapter 9. Data for Testing
	Working with Live Data
		Benefits
		Challenges
	Working with Synthetic Data
		Benefits
		Challenges
		Is Synthetic Data the Right Approach?
	Manual Data Generation
	Automated Data Generation
		Synthetic Data Libraries
		Schema-Driven Generation
	Property-Based Testing
	Summary
Chapter 10. Logging
	Logging Costs
		Impact of Scale
		Impact of Cloud Storage Elasticity
	Reducing Logging Costs
	Effective Logging
	Summary
Chapter 11. Finding Your Way with Monitoring
	Costs of Inadequate Monitoring
		Getting Lost in the Woods
		Navigation to the Rescue
	System Monitoring
		Data Volume
		Throughput
		Consumer Lag
		Worker Utilization
	Resource Monitoring
		Understanding the Bounds
		Understanding Reliability Impacts
	Pipeline Performance
		Pipeline Stage Duration
		Profiling
		Errors to Watch Out For
	Query Monitoring
	Minimizing Monitoring Costs
	Summary
	Recommended Readings
Chapter 12. Essential Takeaways
	An Ounce of Prevention Is Worth a Pound of Cure
		Reign In Compute Spend
		Organize Your Resources
		Design for Interruption
		Build In Data Quality
	Change Is the Only Constant
		Design for Change
		Monitor for Change
	Parting Thoughts
Appendix A. Preparing a Cloud Budget
	It’s All About the Details
		Historical Data
		Estimating for New Projects
		Changes That Impact Costs
	Creating a Budget
		Budget Summary
		Changes Between Previous and Next Budget Periods
		Cost Breakdown
	Communicating the Budget
	Summary
Index
About the Author
Colophon




نظرات کاربران