ورود به حساب

نام کاربری گذرواژه

گذرواژه را فراموش کردید؟ کلیک کنید

حساب کاربری ندارید؟ ساخت حساب

ساخت حساب کاربری

نام نام کاربری ایمیل شماره موبایل گذرواژه

برای ارتباط با ما می توانید از طریق شماره موبایل زیر از طریق تماس و پیامک با ما در ارتباط باشید


09117307688
09117179751

در صورت عدم پاسخ گویی از طریق پیامک با پشتیبان در ارتباط باشید

دسترسی نامحدود

برای کاربرانی که ثبت نام کرده اند

ضمانت بازگشت وجه

درصورت عدم همخوانی توضیحات با کتاب

پشتیبانی

از ساعت 7 صبح تا 10 شب

دانلود کتاب Hands-On Entity Resolution: A Practical Guide to Data Matching With Python

دانلود کتاب وضوح موجودیت دستی: راهنمای عملی برای تطبیق داده ها با پایتون

Hands-On Entity Resolution: A Practical Guide to Data Matching With Python

مشخصات کتاب

Hands-On Entity Resolution: A Practical Guide to Data Matching With Python

ویرایش:  
نویسندگان:   
سری:  
ISBN (شابک) : 9781098148485 
ناشر: O'Reilly Media 
سال نشر: 2024 
تعداد صفحات: 200 
زبان: English 
فرمت فایل : EPUB (درصورت درخواست کاربر به PDF، EPUB یا AZW3 تبدیل می شود) 
حجم فایل: 5 Mb 

قیمت کتاب (تومان) : 51,000



ثبت امتیاز به این کتاب

میانگین امتیاز به این کتاب :
       تعداد امتیاز دهندگان : 8


در صورت تبدیل فایل کتاب Hands-On Entity Resolution: A Practical Guide to Data Matching With Python به فرمت های PDF، EPUB، AZW3، MOBI و یا DJVU می توانید به پشتیبان اطلاع دهید تا فایل مورد نظر را تبدیل نمایند.

توجه داشته باشید کتاب وضوح موجودیت دستی: راهنمای عملی برای تطبیق داده ها با پایتون نسخه زبان اصلی می باشد و کتاب ترجمه شده به فارسی نمی باشد. وبسایت اینترنشنال لایبرری ارائه دهنده کتاب های زبان اصلی می باشد و هیچ گونه کتاب ترجمه شده یا نوشته شده به فارسی را ارائه نمی دهد.


توضیحاتی در مورد کتاب وضوح موجودیت دستی: راهنمای عملی برای تطبیق داده ها با پایتون

وضوح موجودیت یک تکنیک تحلیلی کلیدی است که به شما امکان می‌دهد چندین رکورد داده را شناسایی کنید که به یک موجودیت واقعی اشاره می‌کنند. با این راهنمای عملی، مدیران محصول، تحلیلگران داده و دانشمندان داده یاد می‌گیرند که چگونه با پاکسازی، تجزیه و تحلیل و حل مجموعه داده‌ها با استفاده از کتابخانه‌های Python منبع باز و APIهای ابری، به داده‌ها ارزش بیافزایند. نویسنده مایکل شیرر به شما نشان می دهد که چگونه فرآیندهای تطبیق داده های خود را افزایش دهید و دقت تطابق خود را بهبود بخشید. وقتی کلیدهای مشترک در دسترس نیستند، می‌توانید ورودی‌های تکراری را در یک منبع حذف کنید و منابع داده متفاوت را به یکدیگر بپیوندید. با استفاده از نمونه‌های داده‌های دنیای واقعی، این کتاب به شما کمک می‌کند تا درک عملی برای تسریع در ارائه ارزش واقعی کسب‌وکار به دست آورید. با وضوح موجودیت، دارایی‌های داده‌ای غنی و جامع خواهید ساخت که روابط را برای اهداف بازاریابی و مدیریت ریسک نشان می‌دهد، که کلیدی برای بهره‌گیری از پتانسیل کامل ML و AI است. این کتاب شامل موارد زیر است: چالش‌های حذف و پیوستن به مجموعه‌های داده استخراج، پاک‌سازی و آماده‌سازی مجموعه‌های داده برای تطبیق الگوریتم‌های تطبیق متن برای شناسایی موجودیت‌های معادل تکنیک‌هایی برای کپی‌برداری و پیوستن به مجموعه‌های داده در مقیاس. وضوح با استفاده از APIهای ابری تطبیق با استفاده از فناوری‌های تقویت‌کننده حریم خصوصی راه‌حل‌های وضوح نهاد تجاری


توضیحاتی درمورد کتاب به خارجی

Entity resolution is a key analytic technique that enables you to identify multiple data records that refer to the same real-world entity. With this hands-on guide, product managers, data analysts, and data scientists will learn how to add value to data by cleansing, analyzing, and resolving datasets using open source Python libraries and cloud APIs. Author Michael Shearer shows you how to scale up your data matching processes and improve the accuracy of your reconciliations. You\'ll be able to remove duplicate entries within a single source and join disparate data sources together when common keys aren\'t available. Using real-world data examples, this book helps you gain practical understanding to accelerate the delivery of real business value. With entity resolution, you\'ll build rich and comprehensive data assets that reveal relationships for marketing and risk management purposes, key to harnessing the full potential of ML and AI. This book covers: Challenges in deduplicating and joining datasets Extracting, cleansing, and preparing datasets for matching Text matching algorithms to identify equivalent entities Techniques for deduplicating and joining datasets at scale Matching datasets containing persons and organizations Evaluating data matches Optimizing and tuning data matching algorithms Entity resolution using cloud APIs Matching using privacy-enhancing technologies Commercial entity resolution solutions



فهرست مطالب

Preface
   Who Should Read This Book
   Why I Wrote This Book
   Navigating This Book
   Conventions Used in This Book
   Using Code Examples
   O’Reilly Online Learning
   How to Contact Us
   Acknowledgments
1. Introduction to Entity Resolution
   What Is Entity Resolution?
   Why Is Entity Resolution Needed?
   Main Challenges of Entity Resolution
      Lack of Unique Names
      Inconsistent Naming Conventions
      Data Capture Inconsistencies
      Worked Example
      Deliberate Obfuscation
      Match Permutations
      Blind Matching?
   The Entity Resolution Process
      Data Standardization
      Record Blocking
      Attribute Comparison
      Match Classification
      Clustering
      Canonicalization
      Worked Example
   Measuring Performance
   Getting Started
2. Data Standardization
   Sample Problem
   Environment Setup
   Acquiring Data
      Wikipedia Data
      TheyWorkForYou Data
         Adding Facebook links
   Cleansing Data
      Wikipedia
      TheyWorkForYou
   Attribute Comparison
   Constituency
   Measuring Performance
   Sample Calculation
   Summary
3. Text Matching
   Edit Distance Matching
      Levenshtein Distance
      Jaro Similarity
      Jaro-Winkler Similarity
   Phonetic Matching
      Metaphone
      Match Rating Approach
   Comparing the Techniques
   Sample Problem
   Full Similarity Comparison
   Measuring Performance
   Summary
4. Probabilistic Matching
   Sample Problem
   Single Attribute Match Probability
      First Name Match Probability
      Last Name Match Probability
   Multiple Attribute Match Probability
   Probabilistic Models
      Bayes’ Theorem
      m Value
      u Value
      Lambda ( λ ) Value
      Bayes Factor
      Fellegi-Sunter Model
      Match Weight
   Expectation-Maximization Algorithm
      Iteration 1
      Iteration 2
      Iteration 3
   Introducing Splink
      Configuring Splink
      Splink Performance
   Summary
5. Record Blocking
   Sample Problem
   Data Acquisition
      Wikipedia Data
      UK Companies House Data
   Data Standardization
      Wikipedia Data
      UK Companies House Data
   Record Blocking and Attribute Comparison
      Record Blocking with Splink
      Attribute Comparison
   Match Classification
   Measuring Performance
   Summary
6. Company Matching
   Sample Problem
   Data Acquisition
   Data Standardization
      Companies House Data
      Maritime and Coastguard Agency Data
   Record Blocking and Attribute Comparison
   Match Classification
   Measuring Performance
   Matching New Entities
   Summary
7. Clustering
   Simple Exact Match Clustering
   Approximate Match Clustering
   Sample Problem
      Data Acquisition
      Data Standardization
   Record Blocking and Attribute Comparison
      Data Analysis
      Expectation-Maximization Blocking Rules
   Match Classification and Clustering
   Cluster Visualization
   Cluster Analysis
   Summary
8. Scaling Up on Google Cloud
   Google Cloud Setup
      Setting Up Project Storage
   Creating a Dataproc Cluster
   Configuring a Dataproc Cluster
   Entity Resolution on Spark
   Measuring Performance
   Tidy Up!
   Summary
9. Cloud Entity Resolution Services
   Introduction to BigQuery
   Enterprise Knowledge Graph API
      Schema Mapping
      Reconciliation Job
      Result Processing
      Entity Reconciliation Python Client
   Measuring Performance
   Summary
10. Privacy-Preserving Record Linkage
   An Introduction to Private Set Intersection
   How PSI Works
   PSI Protocol Based on ECDH
      Bloom Filters
         Bloom filter example
      Golomb-Coded Sets
         GCS example
   Example: Using the PSI Process
      Environment Setup
         Google Cloud setup
         Option 1: Prebuilt PSI package
         Option 2: Build PSI package
         Server install
      Server Code
      Client Code
         Using raw encrypted server values
         Using Bloom filter–encoded encrypted server values
         Using GCS-encoded encrypted server values
      Full MCA and Companies House Sample Example
   Summary
11. Further Considerations
   Data Considerations
      Unstructured Data
      Data Quality
      Temporal Equivalence
   Attribute Comparison
      Set Matching
      Geocoding Location Matching
      Aggregating Comparisons
   Post Processing
   Graphical Representation
   Real-Time Considerations
   Performance Evaluation
      Pairwise Approach
      Cluster-Based Approach
   Future of Entity Resolution
Index




نظرات کاربران