دسترسی نامحدود
برای کاربرانی که ثبت نام کرده اند
برای ارتباط با ما می توانید از طریق شماره موبایل زیر از طریق تماس و پیامک با ما در ارتباط باشید
در صورت عدم پاسخ گویی از طریق پیامک با پشتیبان در ارتباط باشید
برای کاربرانی که ثبت نام کرده اند
درصورت عدم همخوانی توضیحات با کتاب
از ساعت 7 صبح تا 10 شب
ویرایش: 1
نویسندگان: Mark Kromer
سری:
ISBN (شابک) : 1484286111, 9781484286111
ناشر: Apress
سال نشر: 2022
تعداد صفحات: 204
زبان: English
فرمت فایل : PDF (درصورت درخواست کاربر به PDF، EPUB یا AZW3 تبدیل می شود)
حجم فایل: 10 مگابایت
در صورت تبدیل فایل کتاب Mapping Data Flows in Azure Data Factory: Building Scalable ETL Projects in the Microsoft Cloud به فرمت های PDF، EPUB، AZW3، MOBI و یا DJVU می توانید به پشتیبان اطلاع دهید تا فایل مورد نظر را تبدیل نمایند.
توجه داشته باشید کتاب نگاشت جریان داده در کارخانه داده Azure: ساخت پروژه های مقیاس پذیر ETL در Microsoft Cloud نسخه زبان اصلی می باشد و کتاب ترجمه شده به فارسی نمی باشد. وبسایت اینترنشنال لایبرری ارائه دهنده کتاب های زبان اصلی می باشد و هیچ گونه کتاب ترجمه شده یا نوشته شده به فارسی را ارائه نمی دهد.
Table of Contents About the Author About the Technical Reviewer Introduction Part I: Getting Started with Azure Data Factory and Mapping Data Flows Chapter 1: ETL for the Cloud Data Engineer General ETL Process Differences in Cloud-Based ETL Data Drift Landing the Refined Data Typical SDLC Summary Chapter 2: Introduction to Azure Data Factory What Is Azure Data Factory? Factory Resources Pipelines Activities Triggers Mapping Data Flows Linked Services Datasets Azure Integration Runtime Self-Hosted Integration Runtime Elements of a Pipeline Pipeline Execution Pipeline Triggers Pipeline Monitoring Summary Chapter 3: Introduction to Mapping Data Flows Getting Started Design Surface Connector Lines and Reference Lines Repositioning Nodes Data Flow Script Transformation Primitives Multiple Inputs/Outputs New Branch Join Conditional Split Exists Union Lookup Schema Modifier Derived Column Select Aggregate Surrogate Key Pivot Unpivot Window Rank External Call Formatters Flatten Parse Stringify Row Modifier Filter Sort Alter Row Assert Flowlets Destination Expression language Functions Input Schema Parameters Cached Lookup Locals Data Preview Manage Compute Environment from Azure IR Debugging from the Data Flow Surface Debugging from Pipeline Summary Untitled Part II: Designing Scalable ETL Jobs with ADF Mapping Data Flows Chapter 4: Build Your First ETL Pipeline in ADF Scenario Data Quality Task 1: Start with a New Data Flow Task 2: Metadata Checker Task 3: Add Asserts for Data Validation Task 4: Filter Out NULLs Task 5: Create Full Address Field Final Step: Land the Data As Parquet in the Data Lake Summary Chapter 5: Common ETL Pipeline Practices in ADF with Mapping Data Flows Task 1: Create a New Pipeline Task 2: Debug the Pipeline Task 3: Evaluate Execution Plan Task 4: Evaluate Results Task 5: Prepare Pipeline for Operational Deployment Summary Chapter 6: Slowly Changing Dimensions Building a Slowly Changing Dimension Pattern in Mapping Data Flows Data Sources NewProducts ExistingProducts Cached Lookup Create Cache Create Row Hashes Surrogate Key Generation Check for Existing Dimension Members Set Dimension Properties Bring the Streams Together Prepare Data for Writing to Database Summary Chapter 7: Data Deduplication The Need for Data Deduplication Type 1: Distinct Rows Type 2: Fuzzy Matching Column Pattern Matching Self-Join Match Scoring Scoring Your Data for Duplication Evaluation Turn the Data Flow into a Reusable Flowlet Debugging a Flowlet Summary Chapter 8: Mapping Data Flow Advanced Topics Working with Complex Data Types Hierarchical Structures Working with an Existing Hierarchical Structure Building a Structure Using Other Transformations Arrays Build an Array Work with an Existing Array Maps Create a New Map Data Lake File Formats Parquet Delta Lake Optimized Row Columnar Avro JSON and Delimited Text Data Flow Script Summary Part III: Operationalize Your ETL Data Pipelines Chapter 9: Basics of CI/CD and Pipeline Scheduling Configure Git New Factory Existing Factory Branching Publish Changes Pipeline Scheduling Debug Run Trigger Now Schedule Trigger Tumbling Window Trigger Storage Events Trigger Custom Events Trigger Summary Chapter 10: Monitor, Manage, and Optimize Monitoring Your Jobs Error Row Handling Partitioning Strategies Optimizing Integration Runtimes Compute Settings Time to Live (TTL) Iterating over Files Parameterizing Pipeline Parameters Data Flow Parameters Late Binding Data Profiling Mapping Data Flow Statistics Data Preview Statistics Profile Stats Power Query Activity Transformation Optimization byName( ) and byNames( ) Rank and Surrogate Key Sorting Database Queries Joins and Lookups Broadcasting Cached Lookup Pipeline Optimizations for Data Flow Activity Run in Parallel Logging Level Database Staging Summary Untitled Untitled Index