دسترسی نامحدود
برای کاربرانی که ثبت نام کرده اند
برای ارتباط با ما می توانید از طریق شماره موبایل زیر از طریق تماس و پیامک با ما در ارتباط باشید
در صورت عدم پاسخ گویی از طریق پیامک با پشتیبان در ارتباط باشید
برای کاربرانی که ثبت نام کرده اند
درصورت عدم همخوانی توضیحات با کتاب
از ساعت 7 صبح تا 10 شب
ویرایش: 1st Edition
نویسندگان: Harry Foxwell
سری:
ISBN (شابک) : 148426102X, 9781484261033
ناشر: Apress
سال نشر: 2020
تعداد صفحات: 112
زبان: English
فرمت فایل : PDF (درصورت درخواست کاربر به PDF، EPUB یا AZW3 تبدیل می شود)
حجم فایل: 2 مگابایت
کلمات کلیدی مربوط به کتاب ایجاد داده های خوب: راهنمای ساختار مجموعه داده ها و نمایش داده ها: اطلاعات بزرگ
در صورت تبدیل فایل کتاب Creating Good Data: A Guide To Dataset Structure And Data Representation به فرمت های PDF، EPUB، AZW3، MOBI و یا DJVU می توانید به پشتیبان اطلاع دهید تا فایل مورد نظر را تبدیل نمایند.
توجه داشته باشید کتاب ایجاد داده های خوب: راهنمای ساختار مجموعه داده ها و نمایش داده ها نسخه زبان اصلی می باشد و کتاب ترجمه شده به فارسی نمی باشد. وبسایت اینترنشنال لایبرری ارائه دهنده کتاب های زبان اصلی می باشد و هیچ گونه کتاب ترجمه شده یا نوشته شده به فارسی را ارائه نمی دهد.
داده های خوبی را از ابتدا ایجاد کنید، نه اینکه پس از جمع آوری آن ها را تعمیر کنید. با پیروی از دستورالعملهای این کتاب، میتوانید تحلیلهای مؤثرتری انجام دهید و دادههای پژوهشی را بهموقع ارائه کنید. تحلیلگران داده اغلب با مجموعه داده هایی برای کاوش و مطالعه ارائه می شوند که طراحی ضعیفی دارند و منجر به مشکلاتی در تفسیر و تأخیر در تولید نتایج معنادار می شود. بسیاری از آموزش های تجزیه و تحلیل داده ها بر نحوه تمیز کردن و تبدیل مجموعه داده ها قبل از شروع تجزیه و تحلیل جدی تمرکز دارد. نمایشهای نامناسب یا گیجکننده، انتخابهای واحد اندازهگیری، خطاهای کدگذاری، مقادیر از دست رفته، نقاط پرت و غیره را میتوان با استفاده از طراحی مجموعه داده خوب و با درک اینکه چگونه انواع دادهها انواع تحلیلهایی را که میتوان انجام داد، تعیین کرد. این کتاب اصول و بهترین شیوههای ایجاد مجموعه داده را مورد بحث قرار میدهد و انواع دادههای پایه و آمار و تجسمهای مناسب مربوط به آنها را پوشش میدهد. تمرکز اصلی کتاب این است که چرا انواع دادههای خاصی برای نمایش مفاهیم و اندازهگیریها انتخاب میشوند، برخلاف بحثهای معمول در مورد چگونگی تجزیه و تحلیل یک نوع داده خاص پس از انتخاب.
Create good data from the start, rather than fixing it after it is collected. By following the guidelines in this book, you will be able to conduct more effective analyses and produce timely presentations of research data. Data analysts are often presented with datasets for exploration and study that are poorly designed, leading to difficulties in interpretation and to delays in producing meaningful results. Much data analytics training focuses on how to clean and transform datasets before serious analyses can even be started. Inappropriate or confusing representations, unit of measurement choices, coding errors, missing values, outliers, etc., can be avoided by using good dataset design and by understanding how data types determine the kinds of analyses which can be performed. This book discusses the principles and best practices of dataset creation, and covers basic data types and their related appropriate statistics and visualizations. A key focus of the book is why certain data types are chosen for representing concepts and measurements, in contrast to the typical discussions of how to analyze a specific data type once it has been selected.
Table of Contents......Page 5
About the Author......Page 9
About the Technical Reviewer......Page 10
Acknowledgments......Page 11
Introduction......Page 12
Who This Book Is For......Page 13
Assumptions......Page 14
The Importance of Getting Data Right......Page 15
What Exactly Is “Data” and Where Does It Come From?......Page 16
What Is “Good” Data?......Page 17
Where “Bad” Data Comes From......Page 18
Some Causes of Bad Data......Page 19
Preventive Action......Page 20
Chapter References......Page 21
Chapter 2: Basic Data Types and When to Use Them......Page 22
Four Analytic Data Types......Page 23
Nominal/Categorical Data......Page 24
Ordinal Data......Page 27
Special Ordinal Data Types......Page 29
Ratio Data......Page 32
Interval Data......Page 34
Other Data Types......Page 35
Summary......Page 36
Chapter References......Page 37
Units of Measurement......Page 38
Magnitudes and Quantities......Page 39
Time Data......Page 40
Transformations and Indexing......Page 42
Measurement Standards......Page 43
Multicollinearity......Page 44
Chapter References......Page 45
Describing, Comparing, and Predicting......Page 47
Example: Choosing a Data Type......Page 48
Plan for Visualizing Your Data and Analysis......Page 49
The Purpose and Goal of Multivariate Relationship Statistics and Visualizations......Page 50
Independent and Dependent Variables......Page 51
Data Analysis Tools......Page 53
Summary......Page 54
Chapter References......Page 55
Sharing Data......Page 57
Dataset Dictionaries/Metadata......Page 58
Good Metadata......Page 59
Data Item Naming......Page 60
Dataset Formats......Page 61
Comma-Separated Values (.csv)......Page 62
HTML Data......Page 64
Managing Datasets......Page 65
Is Your Data Ready?......Page 66
Chapter References......Page 67
What Is Bias?......Page 69
Major Types of Bias......Page 70
What Does “Random” Selection Mean?......Page 71
More Data Collection Problems......Page 72
Understanding Outliers......Page 74
Summary......Page 75
Chapter References......Page 76
The Titanic Survivor Dataset......Page 77
The IBM Employee Attrition Dataset......Page 78
The Internet Movie Database (IMDb)......Page 79
US Hurricane Data......Page 80
UFO Sighting Data......Page 81
Useful Dataset Sources......Page 82
Chapter References......Page 83
Data Cleaning Challenges......Page 84
General Procedures......Page 86
Microsoft Excel......Page 87
Recording Errors......Page 88
Missing Data......Page 90
Outliers......Page 91
Python......Page 93
Operating System Utilities......Page 97
AI/ML-Based Software......Page 98
Chapter References......Page 99
What Is Good Analytics?......Page 101
Big Data Analytics......Page 102
Data for Good......Page 103
Chapter References......Page 105
Books......Page 106
Websites......Page 107
Oldies but Goodies......Page 108
Index......Page 110