ورود به حساب

نام کاربری گذرواژه

گذرواژه را فراموش کردید؟ کلیک کنید

حساب کاربری ندارید؟ ساخت حساب

ساخت حساب کاربری

نام نام کاربری ایمیل شماره موبایل گذرواژه

برای ارتباط با ما می توانید از طریق شماره موبایل زیر از طریق تماس و پیامک با ما در ارتباط باشید


09117307688
09117179751

در صورت عدم پاسخ گویی از طریق پیامک با پشتیبان در ارتباط باشید

دسترسی نامحدود

برای کاربرانی که ثبت نام کرده اند

ضمانت بازگشت وجه

درصورت عدم همخوانی توضیحات با کتاب

پشتیبانی

از ساعت 7 صبح تا 10 شب

دانلود کتاب Mapping Data Flows in Azure Data Factory: Building Scalable ETL Projects in the Microsoft Cloud

دانلود کتاب نگاشت جریان داده در کارخانه داده Azure: ساخت پروژه های مقیاس پذیر ETL در Microsoft Cloud

Mapping Data Flows in Azure Data Factory: Building Scalable ETL Projects in the Microsoft Cloud

مشخصات کتاب

Mapping Data Flows in Azure Data Factory: Building Scalable ETL Projects in the Microsoft Cloud

ویرایش: 1 
نویسندگان:   
سری:  
ISBN (شابک) : 1484286111, 9781484286111 
ناشر: Apress 
سال نشر: 2022 
تعداد صفحات: 204 
زبان: English 
فرمت فایل : PDF (درصورت درخواست کاربر به PDF، EPUB یا AZW3 تبدیل می شود) 
حجم فایل: 10 مگابایت 

قیمت کتاب (تومان) : 69,000



ثبت امتیاز به این کتاب

میانگین امتیاز به این کتاب :
       تعداد امتیاز دهندگان : 4


در صورت تبدیل فایل کتاب Mapping Data Flows in Azure Data Factory: Building Scalable ETL Projects in the Microsoft Cloud به فرمت های PDF، EPUB، AZW3، MOBI و یا DJVU می توانید به پشتیبان اطلاع دهید تا فایل مورد نظر را تبدیل نمایند.

توجه داشته باشید کتاب نگاشت جریان داده در کارخانه داده Azure: ساخت پروژه های مقیاس پذیر ETL در Microsoft Cloud نسخه زبان اصلی می باشد و کتاب ترجمه شده به فارسی نمی باشد. وبسایت اینترنشنال لایبرری ارائه دهنده کتاب های زبان اصلی می باشد و هیچ گونه کتاب ترجمه شده یا نوشته شده به فارسی را ارائه نمی دهد.


توضیحاتی درمورد کتاب به خارجی



فهرست مطالب

Table of Contents
About the Author
About the Technical Reviewer
Introduction
Part I: Getting Started with Azure Data Factory and Mapping Data Flows
	Chapter 1: ETL for the Cloud Data Engineer
		General ETL Process
		Differences in Cloud-Based ETL
		Data Drift
		Landing the Refined Data
		Typical SDLC
		Summary
	Chapter 2: Introduction to Azure Data Factory
		What Is Azure Data Factory?
		Factory Resources
		Pipelines
		Activities
		Triggers
		Mapping Data Flows
		Linked Services
		Datasets
		Azure Integration Runtime
		Self-Hosted Integration Runtime
		Elements of a Pipeline
		Pipeline Execution
		Pipeline Triggers
		Pipeline Monitoring
		Summary
	Chapter 3: Introduction to Mapping Data Flows
		Getting Started
		Design Surface
			Connector Lines and Reference Lines
			Repositioning Nodes
		Data Flow Script
		Transformation Primitives
			Multiple Inputs/Outputs
				New Branch
				Join
				Conditional Split
				Exists
				Union
				Lookup
			Schema Modifier
				Derived Column
				Select
				Aggregate
				Surrogate Key
				Pivot
				Unpivot
				Window
				Rank
				External Call
			Formatters
				Flatten
				Parse
				Stringify
			Row Modifier
				Filter
				Sort
				Alter Row
				Assert
			Flowlets
			Destination
		Expression language
			Functions
			Input Schema
			Parameters
			Cached Lookup
			Locals
			Data Preview
		Manage Compute Environment from Azure IR
		Debugging from the Data Flow Surface
		Debugging from Pipeline
		Summary
	Untitled
Part II: Designing Scalable ETL Jobs with ADF Mapping Data Flows
	Chapter 4: Build Your First ETL Pipeline in ADF
		Scenario
		Data Quality
		Task 1: Start with a New Data Flow
		Task 2: Metadata Checker
		Task 3: Add Asserts for Data Validation
		Task 4: Filter Out NULLs
		Task 5: Create Full Address Field
		Final Step: Land the Data As Parquet in the Data Lake
		Summary
	Chapter 5: Common ETL Pipeline Practices in ADF with Mapping Data Flows
		Task 1: Create a New Pipeline
		Task 2: Debug the Pipeline
		Task 3: Evaluate Execution Plan
		Task 4: Evaluate Results
		Task 5: Prepare Pipeline for Operational Deployment
		Summary
	Chapter 6: Slowly Changing Dimensions
		Building a Slowly Changing Dimension Pattern in Mapping Data Flows
		Data Sources
			NewProducts
			ExistingProducts
			Cached Lookup
		Create Cache
		Create Row Hashes
		Surrogate Key Generation
		Check for Existing Dimension Members
		Set Dimension Properties
		Bring the Streams Together
		Prepare Data for Writing to Database
		Summary
	Chapter 7: Data Deduplication
		The Need for Data Deduplication
		Type 1: Distinct Rows
		Type 2: Fuzzy Matching
			Column Pattern Matching
			Self-Join
			Match Scoring
			Scoring Your Data for Duplication Evaluation
			Turn the Data Flow into a Reusable Flowlet
			Debugging a Flowlet
		Summary
	Chapter 8: Mapping Data Flow Advanced Topics
		Working with Complex Data Types
			Hierarchical Structures
				Working with an Existing Hierarchical Structure
				Building a Structure
				Using Other Transformations
			Arrays
				Build an Array
				Work with an Existing Array
			Maps
				Create a New Map
		Data Lake File Formats
			Parquet
			Delta Lake
			Optimized Row Columnar
			Avro
			JSON and Delimited Text
		Data Flow Script
		Summary
Part III: Operationalize Your ETL Data Pipelines
	Chapter 9: Basics of CI/CD and Pipeline Scheduling
		Configure Git
			New Factory
			Existing Factory
			Branching
			Publish Changes
		Pipeline Scheduling
			Debug Run
			Trigger Now
			Schedule Trigger
			Tumbling Window Trigger
			Storage Events Trigger
			Custom Events Trigger
		Summary
	Chapter 10: Monitor, Manage, and Optimize
		Monitoring Your Jobs
			Error Row Handling
		Partitioning Strategies
		Optimizing Integration Runtimes
			Compute Settings
			Time to Live (TTL)
			Iterating over Files
		Parameterizing
			Pipeline Parameters
			Data Flow Parameters
			Late Binding
		Data Profiling
			Mapping Data Flow Statistics
			Data Preview Statistics
			Profile Stats
			Power Query Activity
		Transformation Optimization
			byName( ) and byNames( )
			Rank and Surrogate Key
			Sorting
			Database Queries
			Joins and Lookups
				Broadcasting
				Cached Lookup
		Pipeline Optimizations for Data Flow Activity
			Run in Parallel
			Logging Level
			Database Staging
		Summary
	Untitled
	Untitled
Index




نظرات کاربران