ورود به حساب

نام کاربری گذرواژه

گذرواژه را فراموش کردید؟ کلیک کنید

حساب کاربری ندارید؟ ساخت حساب

ساخت حساب کاربری

نام نام کاربری ایمیل شماره موبایل گذرواژه

برای ارتباط با ما می توانید از طریق شماره موبایل زیر از طریق تماس و پیامک با ما در ارتباط باشید


09117307688
09117179751

در صورت عدم پاسخ گویی از طریق پیامک با پشتیبان در ارتباط باشید

دسترسی نامحدود

برای کاربرانی که ثبت نام کرده اند

ضمانت بازگشت وجه

درصورت عدم همخوانی توضیحات با کتاب

پشتیبانی

از ساعت 7 صبح تا 10 شب

دانلود کتاب The Enterprise Big Data Lake: Delivering the Promise of Big Data and Data Science

دانلود کتاب Enterprise Big Data Lake: ارائه نوید علم داده بزرگ و داده

The Enterprise Big Data Lake: Delivering the Promise of Big Data and Data Science

مشخصات کتاب

The Enterprise Big Data Lake: Delivering the Promise of Big Data and Data Science

دسته بندی: کامپیوتر
ویرایش: Paperback 
نویسندگان:   
سری:  
ISBN (شابک) : 1491931558, 9781491931554 
ناشر: O’Reilly Media 
سال نشر: 2019 
تعداد صفحات: 218 
زبان: English 
فرمت فایل : PDF (درصورت درخواست کاربر به PDF، EPUB یا AZW3 تبدیل می شود) 
حجم فایل: 11 مگابایت 

قیمت کتاب (تومان) : 33,000



ثبت امتیاز به این کتاب

میانگین امتیاز به این کتاب :
       تعداد امتیاز دهندگان : 10


در صورت تبدیل فایل کتاب The Enterprise Big Data Lake: Delivering the Promise of Big Data and Data Science به فرمت های PDF، EPUB، AZW3، MOBI و یا DJVU می توانید به پشتیبان اطلاع دهید تا فایل مورد نظر را تبدیل نمایند.

توجه داشته باشید کتاب Enterprise Big Data Lake: ارائه نوید علم داده بزرگ و داده نسخه زبان اصلی می باشد و کتاب ترجمه شده به فارسی نمی باشد. وبسایت اینترنشنال لایبرری ارائه دهنده کتاب های زبان اصلی می باشد و هیچ گونه کتاب ترجمه شده یا نوشته شده به فارسی را ارائه نمی دهد.


توضیحاتی در مورد کتاب Enterprise Big Data Lake: ارائه نوید علم داده بزرگ و داده

شرکت‌ها در حال آزمایش استفاده از Hadoop برای ساخت دریاچه‌های داده بزرگ هستند، اما بسیاری از پروژه‌ها متوقف می‌شوند یا با شکست مواجه می‌شوند، زیرا رویکردهایی که در شرکت‌های اینترنتی کار می‌کردند باید برای شرکت اتخاذ شوند. این کتابچه راهنمای کاربردی، مدیران و متخصصان فناوری اطلاعات را از تحقیقات اولیه و فرآیند تصمیم‌گیری از طریق برنامه‌ریزی، انتخاب محصولات، و پیاده‌سازی، نگهداری و اداره دریاچه داده‌های مدرن راهنمایی می‌کند.

شما رویکردهای مختلفی را برای شروع و رشد یک دریاچه داده، از جمله بارگیری انبار داده، جعبه‌های شنی تحلیلی، و \"پاک‌های داده‌ها". نویسنده الکس گورلیک روش‌هایی را برای تنظیم سطوح مختلف داده‌ها، از مناطق فرود خام درمان‌نشده تا داده‌های مدیریت شده و خلاصه‌شده به دقت به شما نشان می‌دهد. . شما یاد خواهید گرفت که چگونه خدمات سلف سرویس را برای کمک به کاربران در یافتن، درک و ارائه داده ها فعال کنید. نحوه ارائه رابط های مختلف به کاربران با سطوح مهارت های مختلف. و چگونه می توان همه اینها را مطابق با سیاست های حاکمیت داده های سازمانی انجام داد.


توضیحاتی درمورد کتاب به خارجی

Enterprises are experimenting with using Hadoop to build Big Data Lakes, but many projects are stalling or failing because the approaches that worked at Internet companies have to be adopted for the enterprise. This practical handbook guides managers and IT professionals from the initial research and decision-making process through planning, choosing products, and implementing, maintaining, and governing the modern data lake.

You'll explore various approaches to starting and growing a Data Lake, including Data Warehouse off-loading, analytical sandboxes, and "Data Puddles." Author Alex Gorelik shows you methods for setting up different tiers of data, from raw untreated landing areas to carefully managed and summarized data. You'll learn how to enable self-service to help users find, understand, and provision data; how to provide different interfaces to users with different skill levels; and how to do all of that in compliance with enterprise data governance policies.



فهرست مطالب

Copyright
Table of Contents
Preface
	Who Should Read This Book?
	Conventions Used in This Book
	O’Reilly Online Learning
	How to Contact Us
	Acknowledgments
Chapter 1. Introduction to Data Lakes
	Data Lake Maturity
		Data Puddles
		Data Ponds
	Creating a Successful Data Lake
		The Right Platform
		The Right Data
		The Right Interface
		The Data Swamp
	Roadmap to Data Lake Success
		Standing Up a Data Lake
		Organizing the Data Lake
		Setting Up the Data Lake for Self-Service
	Data Lake Architectures
		Data Lakes in the Public Cloud
		Logical Data Lakes
	Conclusion
Chapter 2. Historical Perspective
	The Drive for Self-Service Data—The Birth of Databases
	The Analytics Imperative—The Birth of Data Warehousing
	The Data Warehouse Ecosystem
		Storing and Querying the Data
		Loading the Data—Data Integration Tools
		Organizing and Managing the Data
		Consuming the Data
	Conclusion
Chapter 3. Introduction to Big Data and Data Science
	Hadoop Leads the Historic Shift to Big Data
		The Hadoop File System
		How Processing and Storage Interact in a MapReduce Job
		Schema on Read
		Hadoop Projects
	Data Science
	What Should Your Analytics Organization Focus On?
	Machine Learning
		Explainability
		Change Management
	Conclusion
Chapter 4. Starting a Data Lake
	The What and Why of Hadoop
	Preventing Proliferation of Data Puddles
	Taking Advantage of Big Data
		Leading with Data Science
		Strategy 1: Offload Existing Functionality
		Strategy 2: Data Lakes for New Projects
		Strategy 3: Establish a Central Point of Governance
		Which Way Is Right for You?
	Conclusion
Chapter 5. From Data Ponds/Big Data Warehouses to Data Lakes
	Essential Functions of a Data Warehouse
		Dimensional Modeling for Analytics
		Integrating Data from Disparate Sources
		Preserving History Using Slowly Changing Dimensions
		Limitations of the Data Warehouse as a Historical Repository
	Moving to a Data Pond
		Keeping History in a Data Pond
		Implementing Slowly Changing Dimensions in a Data Pond
	Growing Data Ponds into a Data Lake—Loading Data That’s Not in the Data Warehouse
		Raw Data
		External Data
		Internet of Things (IoT) and Other Streaming Data
	Real-Time Data Lakes
	The Lambda Architecture
	Data Transformations
	Target Systems
		Data Warehouses
		Operational Data Stores
		Real-Time Applications and Data Products
	Conclusion
Chapter 6. Optimizing for Self-Service
	The Beginnings of Self-Service
	Business Analysts
		Finding and Understanding Data—Documenting the Enterprise
		Establishing Trust
		Provisioning
		Preparing Data for Analysis
	Data Wrangling in the Data Lake
		Situating Data Preparation in Hadoop
		Common Use Cases for Data Preparation
	Analyzing and Visualizing
	The New World of Self-Service Business Intelligence
		The New Analytic Workflow
		Gatekeepers to Shopkeepers
		Governing Self-Service
	Conclusion
Chapter 7. Architecting the Data Lake
	Organizing the Data Lake
		Landing or Raw Zone
		Gold Zone
		Work Zone
		Sensitive Zone
	Multiple Data Lakes
		Advantages of Keeping Data Lakes Separate
		Advantages of Merging the Data Lakes
	Cloud Data Lakes
	Virtual Data Lakes
		Data Federation
		Big Data Virtualization
		Eliminating Redundancy
	Conclusion
Chapter 8. Cataloging the Data Lake
	Organizing the Data
		Technical Metadata
		Business Metadata
	Tagging
		Automated Cataloging
	Logical Data Management
		Sensitive Data Management and Access Control
		Data Quality
	Relating Disparate Data
	Establishing Lineage
	Data Provisioning
	Tools for Building a Catalog
		Tool Comparison
	The Data Ocean
	Conclusion
Chapter 9. Governing Data Access
	Authorization or Access Control
	Tag-Based Data Access Policies
	Deidentifying Sensitive Data
		Data Sovereignty and Regulatory Compliance
	Self-Service Access Management
		Provisioning Data
	Conclusion
Chapter 10. Industry-Specific Perspectives
	Big Data in Financial Services
		Consumers, Digitization, and Data Are Changing Finance as We Know It
		Saving the Bank
		New Opportunities Offered by New Data
		Key Processes in Making Use of the Data Lake
	Value Added by Data Lakes in Financial Services
	Data Lakes in the Insurance Industry
	Smart Cities
	Big Data in Medicine
Index
About the Author
Colophon




نظرات کاربران