دسترسی نامحدود
برای کاربرانی که ثبت نام کرده اند
برای ارتباط با ما می توانید از طریق شماره موبایل زیر از طریق تماس و پیامک با ما در ارتباط باشید
در صورت عدم پاسخ گویی از طریق پیامک با پشتیبان در ارتباط باشید
برای کاربرانی که ثبت نام کرده اند
درصورت عدم همخوانی توضیحات با کتاب
از ساعت 7 صبح تا 10 شب
ویرایش: نویسندگان: Ziawasch Abedjan, Lukasz Golab, Felix Naumann سری: Synthesis Lectures on Data Management ISBN (شابک) : 168173446X, 9781681734460 ناشر: Morgan & Claypool Publishers سال نشر: 2018 تعداد صفحات: 156 زبان: English فرمت فایل : PDF (درصورت درخواست کاربر به PDF، EPUB یا AZW3 تبدیل می شود) حجم فایل: 4 مگابایت
در صورت ایرانی بودن نویسنده امکان دانلود وجود ندارد و مبلغ عودت داده خواهد شد
در صورت تبدیل فایل کتاب Data Profiling (Synthesis Lectures on Data Management) به فرمت های PDF، EPUB، AZW3، MOBI و یا DJVU می توانید به پشتیبان اطلاع دهید تا فایل مورد نظر را تبدیل نمایند.
توجه داشته باشید کتاب پروفایل سازی داده ها (سخنرانی ترکیبی در مورد مدیریت داده ها) نسخه زبان اصلی می باشد و کتاب ترجمه شده به فارسی نمی باشد. وبسایت اینترنشنال لایبرری ارائه دهنده کتاب های زبان اصلی می باشد و هیچ گونه کتاب ترجمه شده یا نوشته شده به فارسی را ارائه نمی دهد.
پروفایلسازی داده به فعالیت جمعآوری دادهها در مورد دادهها، به عنوان مثال، فراداده اشاره دارد. اکثر متخصصان و محققان فناوری اطلاعات که با داده ها کار می کنند، حداقل به صورت غیررسمی، برای درک و کاوش یک مجموعه داده ناآشنا یا برای تعیین اینکه آیا یک مجموعه داده جدید برای یک کار خاص مناسب است یا خیر، درگیر پروفایل داده شده اند. نتایج پروفایل داده ها در موقعیت های مختلف دیگر از جمله بهینه سازی پرس و جو، یکپارچه سازی داده ها و پاکسازی داده ها نیز مهم هستند. ابرداده های ساده آماری هستند، مانند تعداد سطرها و ستون ها، اطلاعات طرحواره و نوع داده، تعداد مقادیر متمایز، توزیع مقادیر آماری، و تعداد مقادیر پوچ یا خالی در هر ستون. انواع پیچیدهتر ابردادهها عبارتهایی درباره ستونهای متعدد و همبستگی آنها هستند، مانند کلیدهای نامزد، وابستگیهای عملکردی، و انواع دیگر وابستگیها.
این کتاب طبقهبندی انواع مختلف ابردادههای سودآور را ارائه میکند، در مورد محبوب بحث میکند. وظایف پروفایل داده ها و بررسی الگوریتم های نمایه سازی پیشرفته. در حالی که بیشتر کتاب بر روی وظایف و الگوریتمهای پروفایل دادههای رابطهای تمرکز دارد، ما همچنین به طور مختصر درباره سیستمها و تکنیکهای پروفایل دادههای غیرمرتبط مانند نمودارها و متن بحث میکنیم. ما با بحث در مورد چالشهای پروفایل دادهها و جهتگیریها برای کار آینده در این زمینه به پایان میرسیم.
Data profiling refers to the activity of collecting data about data, i.e., metadata. Most IT professionals and researchers who work with data have engaged in data profiling, at least informally, to understand and explore an unfamiliar dataset or to determine whether a new dataset is appropriate for a particular task at hand. Data profiling results are also important in a variety of other situations, including query optimization, data integration, and data cleaning. Simple metadata are statistics, such as the number of rows and columns, schema and datatype information, the number of distinct values, statistical value distributions, and the number of null or empty values in each column. More complex types of metadata are statements about multiple columns and their correlation, such as candidate keys, functional dependencies, and other types of dependencies.
This book provides a classification of the various types of profilable metadata, discusses popular data profiling tasks, and surveys state-of-the-art profiling algorithms. While most of the book focuses on tasks and algorithms for relational data profiling, we also briefly discuss systems and techniques for profiling non-relational data such as graphs and text. We conclude with a discussion of data profiling challenges and directions for future work in this area.
Preface Acknowledgments Discovering Metadata Motivation and Overview Data Profiling and Data Mining Use Cases Organization of This Book Data Profiling Tasks Single-Column Analysis Dependency Discovery Relaxed Dependencies Single-Column Analysis Cardinalities Value Distributions Data Types, Patterns, and Domains Data Completeness Approximate Statistics Summary and Discussion Dependency Discovery Dependency Definitions Functional Dependencies Unique Column Combinations Inclusion Dependencies Search Space and Data Structures Lattices and Search Space Sizes Position List Indexes and Search Space Validation Search Complexity Null Semantics Discovering Unique Column Combinations Gordian HCA Ducc HyUCC Swan Discovering Functional Dependencies Tane Fun FD_Mine Dfd Dep-Miner FastFDs Fdep HyFD Discovering Inclusion Dependencies SQL-Based IND Validation B&B DeMarchi Binder Spider S-IndD Sindy Mind Find2 ZigZag Mind2 Relaxed and Other Dependencies Relaxing the Extent of a Dependency Partial Dependencies Conditional Dependencies Relaxing Attribute Comparisons Metric and Matching Dependencies Order and Sequential Dependencies Approximating the Dependency Discovery Generalizing Functional Dependencies Denial Constraints Multivalued Dependencies Use Cases Data Exploration Schema Engineering Data Cleaning Query Optimization Data Integration Profiling Non-Relational Data XML RDF Time Series Graphs Text Data Profiling Tools Research Prototypes Commercial Tools Data Profiling Challenges Functional Challenges Profiling Dynamic Data Interactive Profiling Profiling for Integration Interpreting Profiling Results Non-Functional Challenges Efficiency and Scalability Profiling on New Architectures Benchmarking Profiling Methods Conclusions Bibliography Authors\' Biographies Blank Page