دسترسی نامحدود
برای کاربرانی که ثبت نام کرده اند
برای ارتباط با ما می توانید از طریق شماره موبایل زیر از طریق تماس و پیامک با ما در ارتباط باشید
در صورت عدم پاسخ گویی از طریق پیامک با پشتیبان در ارتباط باشید
برای کاربرانی که ثبت نام کرده اند
درصورت عدم همخوانی توضیحات با کتاب
از ساعت 7 صبح تا 10 شب
دسته بندی: کامپیوتر ویرایش: Paperback نویسندگان: Alex Gorelik سری: ISBN (شابک) : 1491931558, 9781491931554 ناشر: O’Reilly Media سال نشر: 2019 تعداد صفحات: 218 زبان: English فرمت فایل : PDF (درصورت درخواست کاربر به PDF، EPUB یا AZW3 تبدیل می شود) حجم فایل: 11 مگابایت
در صورت تبدیل فایل کتاب The Enterprise Big Data Lake: Delivering the Promise of Big Data and Data Science به فرمت های PDF، EPUB، AZW3، MOBI و یا DJVU می توانید به پشتیبان اطلاع دهید تا فایل مورد نظر را تبدیل نمایند.
توجه داشته باشید کتاب Enterprise Big Data Lake: ارائه نوید علم داده بزرگ و داده نسخه زبان اصلی می باشد و کتاب ترجمه شده به فارسی نمی باشد. وبسایت اینترنشنال لایبرری ارائه دهنده کتاب های زبان اصلی می باشد و هیچ گونه کتاب ترجمه شده یا نوشته شده به فارسی را ارائه نمی دهد.
شرکتها در حال آزمایش استفاده از Hadoop برای ساخت دریاچههای
داده بزرگ هستند، اما بسیاری از پروژهها متوقف میشوند یا با
شکست مواجه میشوند، زیرا رویکردهایی که در شرکتهای اینترنتی کار
میکردند باید برای شرکت اتخاذ شوند. این کتابچه راهنمای کاربردی،
مدیران و متخصصان فناوری اطلاعات را از تحقیقات اولیه و فرآیند
تصمیمگیری از طریق برنامهریزی، انتخاب محصولات، و پیادهسازی،
نگهداری و اداره دریاچه دادههای مدرن راهنمایی میکند.
شما رویکردهای مختلفی را برای شروع و رشد یک دریاچه داده، از جمله
بارگیری انبار داده، جعبههای شنی تحلیلی، و \"پاکهای دادهها".
نویسنده الکس گورلیک روشهایی را برای تنظیم سطوح مختلف دادهها،
از مناطق فرود خام درماننشده تا دادههای مدیریت شده و خلاصهشده
به دقت به شما نشان میدهد. . شما یاد خواهید گرفت که چگونه خدمات
سلف سرویس را برای کمک به کاربران در یافتن، درک و ارائه داده ها
فعال کنید. نحوه ارائه رابط های مختلف به کاربران با سطوح مهارت
های مختلف. و چگونه می توان همه اینها را مطابق با سیاست های
حاکمیت داده های سازمانی انجام داد.
Enterprises are experimenting with using Hadoop to build Big
Data Lakes, but many projects are stalling or failing because
the approaches that worked at Internet companies have to be
adopted for the enterprise. This practical handbook guides
managers and IT professionals from the initial research and
decision-making process through planning, choosing products,
and implementing, maintaining, and governing the modern data
lake.
You'll explore various approaches to starting and growing a
Data Lake, including Data Warehouse off-loading, analytical
sandboxes, and "Data Puddles." Author Alex Gorelik shows you
methods for setting up different tiers of data, from raw
untreated landing areas to carefully managed and summarized
data. You'll learn how to enable self-service to help users
find, understand, and provision data; how to provide different
interfaces to users with different skill levels; and how to do
all of that in compliance with enterprise data governance
policies.
Copyright Table of Contents Preface Who Should Read This Book? Conventions Used in This Book O’Reilly Online Learning How to Contact Us Acknowledgments Chapter 1. Introduction to Data Lakes Data Lake Maturity Data Puddles Data Ponds Creating a Successful Data Lake The Right Platform The Right Data The Right Interface The Data Swamp Roadmap to Data Lake Success Standing Up a Data Lake Organizing the Data Lake Setting Up the Data Lake for Self-Service Data Lake Architectures Data Lakes in the Public Cloud Logical Data Lakes Conclusion Chapter 2. Historical Perspective The Drive for Self-Service Data—The Birth of Databases The Analytics Imperative—The Birth of Data Warehousing The Data Warehouse Ecosystem Storing and Querying the Data Loading the Data—Data Integration Tools Organizing and Managing the Data Consuming the Data Conclusion Chapter 3. Introduction to Big Data and Data Science Hadoop Leads the Historic Shift to Big Data The Hadoop File System How Processing and Storage Interact in a MapReduce Job Schema on Read Hadoop Projects Data Science What Should Your Analytics Organization Focus On? Machine Learning Explainability Change Management Conclusion Chapter 4. Starting a Data Lake The What and Why of Hadoop Preventing Proliferation of Data Puddles Taking Advantage of Big Data Leading with Data Science Strategy 1: Offload Existing Functionality Strategy 2: Data Lakes for New Projects Strategy 3: Establish a Central Point of Governance Which Way Is Right for You? Conclusion Chapter 5. From Data Ponds/Big Data Warehouses to Data Lakes Essential Functions of a Data Warehouse Dimensional Modeling for Analytics Integrating Data from Disparate Sources Preserving History Using Slowly Changing Dimensions Limitations of the Data Warehouse as a Historical Repository Moving to a Data Pond Keeping History in a Data Pond Implementing Slowly Changing Dimensions in a Data Pond Growing Data Ponds into a Data Lake—Loading Data That’s Not in the Data Warehouse Raw Data External Data Internet of Things (IoT) and Other Streaming Data Real-Time Data Lakes The Lambda Architecture Data Transformations Target Systems Data Warehouses Operational Data Stores Real-Time Applications and Data Products Conclusion Chapter 6. Optimizing for Self-Service The Beginnings of Self-Service Business Analysts Finding and Understanding Data—Documenting the Enterprise Establishing Trust Provisioning Preparing Data for Analysis Data Wrangling in the Data Lake Situating Data Preparation in Hadoop Common Use Cases for Data Preparation Analyzing and Visualizing The New World of Self-Service Business Intelligence The New Analytic Workflow Gatekeepers to Shopkeepers Governing Self-Service Conclusion Chapter 7. Architecting the Data Lake Organizing the Data Lake Landing or Raw Zone Gold Zone Work Zone Sensitive Zone Multiple Data Lakes Advantages of Keeping Data Lakes Separate Advantages of Merging the Data Lakes Cloud Data Lakes Virtual Data Lakes Data Federation Big Data Virtualization Eliminating Redundancy Conclusion Chapter 8. Cataloging the Data Lake Organizing the Data Technical Metadata Business Metadata Tagging Automated Cataloging Logical Data Management Sensitive Data Management and Access Control Data Quality Relating Disparate Data Establishing Lineage Data Provisioning Tools for Building a Catalog Tool Comparison The Data Ocean Conclusion Chapter 9. Governing Data Access Authorization or Access Control Tag-Based Data Access Policies Deidentifying Sensitive Data Data Sovereignty and Regulatory Compliance Self-Service Access Management Provisioning Data Conclusion Chapter 10. Industry-Specific Perspectives Big Data in Financial Services Consumers, Digitization, and Data Are Changing Finance as We Know It Saving the Bank New Opportunities Offered by New Data Key Processes in Making Use of the Data Lake Value Added by Data Lakes in Financial Services Data Lakes in the Insurance Industry Smart Cities Big Data in Medicine Index About the Author Colophon