ورود به حساب

نام کاربری گذرواژه

گذرواژه را فراموش کردید؟ کلیک کنید

حساب کاربری ندارید؟ ساخت حساب

ساخت حساب کاربری

نام نام کاربری ایمیل شماره موبایل گذرواژه

برای ارتباط با ما می توانید از طریق شماره موبایل زیر از طریق تماس و پیامک با ما در ارتباط باشید


09117307688
09117179751

در صورت عدم پاسخ گویی از طریق پیامک با پشتیبان در ارتباط باشید

دسترسی نامحدود

برای کاربرانی که ثبت نام کرده اند

ضمانت بازگشت وجه

درصورت عدم همخوانی توضیحات با کتاب

پشتیبانی

از ساعت 7 صبح تا 10 شب

دانلود کتاب Mastering Data Mining with Python - Find Patterns Hidden in Your Data

دانلود کتاب تسلط بر داده کاوی با پایتون - الگوهای پنهان در داده های خود را پیدا کنید

Mastering Data Mining with Python - Find Patterns Hidden in Your Data

مشخصات کتاب

Mastering Data Mining with Python - Find Patterns Hidden in Your Data

دسته بندی: برنامه نويسي
ویرایش:  
نویسندگان:   
سری:  
ISBN (شابک) : 1785889958, 9781785889950 
ناشر: Packt Publishing 
سال نشر: 2016 
تعداد صفحات: 269 
زبان: English 
فرمت فایل : PDF (درصورت درخواست کاربر به PDF، EPUB یا AZW3 تبدیل می شود) 
حجم فایل: 13 مگابایت 

قیمت کتاب (تومان) : 42,000



ثبت امتیاز به این کتاب

میانگین امتیاز به این کتاب :
       تعداد امتیاز دهندگان : 9


در صورت تبدیل فایل کتاب Mastering Data Mining with Python - Find Patterns Hidden in Your Data به فرمت های PDF، EPUB، AZW3، MOBI و یا DJVU می توانید به پشتیبان اطلاع دهید تا فایل مورد نظر را تبدیل نمایند.

توجه داشته باشید کتاب تسلط بر داده کاوی با پایتون - الگوهای پنهان در داده های خود را پیدا کنید نسخه زبان اصلی می باشد و کتاب ترجمه شده به فارسی نمی باشد. وبسایت اینترنشنال لایبرری ارائه دهنده کتاب های زبان اصلی می باشد و هیچ گونه کتاب ترجمه شده یا نوشته شده به فارسی را ارائه نمی دهد.


توضیحاتی در مورد کتاب تسلط بر داده کاوی با پایتون - الگوهای پنهان در داده های خود را پیدا کنید

بیاموزید که چگونه با استفاده از این راهنمای جامع Python برای پیشبرد تکنیک های تجزیه و تحلیل داده، برنامه های داده کاوی قدرتمندتر ایجاد کنید. از رایج‌ترین عناصر داده کاوی گرفته تا تکنیک‌های پیشرفته، ما شما را برای هر چالش مرتبط با داده تحت پوشش قرار داده‌ایم. با کنترل کامل طیف وسیعی از کتابخانه‌های آن Who This Book Is به یک تحلیلگر داده پایتون روان‌تر و مطمئن‌تر تبدیل شوید. برای این کتاب برای دانشمندان داده است که قبلاً با برخی از تکنیک های داده کاوی اولیه مانند SQL و یادگیری ماشین آشنا هستند و با پایتون راحت هستند. اگر برای تبدیل شدن به یک متخصص داده کاوی آماده یادگیری تکنیک های پیشرفته تری در داده کاوی هستید، این کتاب برای شماست! آنچه خواهید آموخت کاوش تکنیک های یافتن مجموعه آیتم های مکرر و قوانین مرتبط در مجموعه داده های بزرگ روش های شناسایی برای تطابق موجودیت با انواع مختلف داده ها را بیاموزید. احساس متن و مکان یابی موجودیت های نامگذاری شده در متن تکنیک های متعددی را برای استخراج خودکار خلاصه ها و تولید مدل های موضوعی برای متن مشاهده کنید نحوه استفاده از داده کاوی برای رفع ناهنجاری های داده و نحوه استفاده از یادگیری ماشین برای شناسایی نقاط پرت در یک مجموعه داده در جزئیات داده ها را مشاهده کنید. کاوی بخشی جدایی ناپذیر از خط لوله علم داده است. این پایه و اساس هر استراتژی موفقیت آمیز مبتنی بر داده است - بدون آن، هرگز نمی توانید بینش های واقعاً متحول کننده را کشف کنید. از آنجایی که داده‌ها تقریباً برای هر سازمان مدرن حیاتی است، ارزش برداشتن گام بعدی برای باز کردن ارزش بیشتر و درک معنادارتر را دارد. اگر از قبل اصول داده کاوی با پایتون را می‌دانید، اکنون آماده هستید تا با استفاده از رابط کاربری آسان پایتون و طیف وسیعی از کتابخانه‌ها، تکنیک‌های جالب‌تر و پیشرفته‌تر تجزیه و تحلیل داده را آزمایش کنید. در این کتاب، به بسیاری از حوزه‌های داده کاوی که اغلب نادیده گرفته می‌شوند، عمیق‌تر خواهید رفت، از جمله قوانین مرتبط، تطبیق موجودیت، استخراج شبکه، تجزیه و تحلیل احساسات، تشخیص موجودیت نام‌گذاری شده، خلاصه‌سازی متن، مدل‌سازی موضوع، و تشخیص ناهنجاری. برای هر تکنیک داده کاوی، قبل از مقایسه طیف گسترده ای از استراتژی ها برای حل هر مشکل، بهترین شیوه های جدید و فعلی را بررسی می کنیم. سپس راه‌حل‌های مثالی را با استفاده از داده‌های دنیای واقعی از حوزه مهندسی نرم‌افزار پیاده‌سازی می‌کنیم و زمانی را صرف یادگیری نحوه درک و تفسیر نتایجی خواهیم کرد. در پایان این کتاب، تجربه خوبی در پیاده سازی برخی از جالب ترین و مرتبط ترین تکنیک های داده کاوی موجود امروز خواهید داشت و تسلط بیشتری در زمینه مهم تجزیه و تحلیل داده پایتون خواهید داشت. سبک و رویکرد این کتاب پیچیدگی های استفاده از داده کاوی با استفاده از سناریوهای دنیای واقعی را به شما آموزش می دهد و به عنوان یک راه حل بسیار عملی برای نیازهای داده کاوی شما عمل می کند.


توضیحاتی درمورد کتاب به خارجی

Learn how to create more powerful data mining applications with this comprehensive Python guide to advance data analytics techniques About This Book Dive deeper into data mining with Python - don't be complacent, sharpen your skills! From the most common elements of data mining to cutting-edge techniques, we've got you covered for any data-related challenge Become a more fluent and confident Python data-analyst, in full control of its extensive range of libraries Who This Book Is For This book is for data scientists who are already familiar with some basic data mining techniques such as SQL and machine learning, and who are comfortable with Python. If you are ready to learn some more advanced techniques in data mining in order to become a data mining expert, this is the book for you! What You Will Learn Explore techniques for finding frequent itemsets and association rules in large data sets Learn identification methods for entity matches across many different types of data Identify the basics of network mining and how to apply it to real-world data sets Discover methods for detecting the sentiment of text and for locating named entities in text Observe multiple techniques for automatically extracting summaries and generating topic models for text See how to use data mining to fix data anomalies and how to use machine learning to identify outliers in a data set In Detail Data mining is an integral part of the data science pipeline. It is the foundation of any successful data-driven strategy - without it, you'll never be able to uncover truly transformative insights. Since data is vital to just about every modern organization, it is worth taking the next step to unlock even greater value and more meaningful understanding. If you already know the fundamentals of data mining with Python, you are now ready to experiment with more interesting, advanced data analytics techniques using Python's easy-to-use interface and extensive range of libraries. In this book, you'll go deeper into many often overlooked areas of data mining, including association rule mining, entity matching, network mining, sentiment analysis, named entity recognition, text summarization, topic modeling, and anomaly detection. For each data mining technique, we'll review the state-of-the-art and current best practices before comparing a wide variety of strategies for solving each problem. We will then implement example solutions using real-world data from the domain of software engineering, and we will spend time learning how to understand and interpret the results we get. By the end of this book, you will have solid experience implementing some of the most interesting and relevant data mining techniques available today, and you will have achieved a greater fluency in the important field of Python data analytics. Style and approach This book will teach you the intricacies in applying data mining using real-world scenarios and will act as a very practical solution to your data mining needs."



فهرست مطالب

Cover
Copyright
Credits
About the Author
About the Reviewers
www.PacktPub.com
Table of Contents
Preface
Expanding Your Data Mining Toolbox
	What is data mining?
	How do we do data mining?
		The Fayyad et al. KDD process
		The Han et al. KDD process
		The CRISP-DM process
		The Six Steps process
		Which data mining methodology is the best?
	What are the techniques used in data mining?
		What techniques are we going to use in THIS book?
	How do we set up our data mining work environment?
	Summary
Association Rule Mining
	What are frequent itemsets?
		The diapers and beer urban legend
		Frequent itemset mining basics
	Towards association rules
		Support
		Confidence
		Association rules
		An example with data
		Added value - fixing a flaw in the plan
		Methods for finding frequent itemsets
	A project – discovering association rules in software project tags
	Summary
Entity Matching
	What is entity matching?
		Merging data
			Merging datasets vertically
			Merging datasets horizontally
		Techniques for matching
		Attribute-based similarity matching
			Be careful of pairwise comparisons
			Leverage rare values
		Methods for matching attributes
			Range-based or distance from target
			String edit distance
			Hamming distance
			Levenshtein distance
			Soundex
		Leveraging disjoint sets
		Context-based similarity matching
		Machine learning-based entity matching
		Evaluation of entity matching techniques
			Efficiency - how long does it take to do the matching?
			Effectiveness – how accurate are the matches that we generate?
			Usefulness - how practical is the matching procedure to use?
	Entity matching project
		Difficulties with matching software projects
		Two examples
		Matching on project names
		Matching on people names
		Matching on URLs
		Matching on topics and description keywords
		The dataset
		The code
		The results
			How many entity matches did we find?
			How good are the pairs we found?
	Summary
Network Analysis
	What is a network?
	Measuring a network
		Degree of a network
		Diameter of a network
		Walks, paths, and trails in a network
		Components of a network
		Centrality of a network
			Closeness centrality
			Degree centrality
			Betweenness centrality
			Other measures of centrality
	Representing graph data
		Adjacency matrix
		Edge lists and adjacency lists
		Differences between graph data structures
		Importing data into a graph structure
			Adjacency list format
			Edge list format
			GEXF and GraphML
			GDF
			Python pickle
			JSON
			JSON node and link series
			JSON trees
			Pajek format
	A real project
		Exploring the data
		Generating the network files
		Understanding our data as a network
			Generating simple network metrics
			Playing with the parameters of a network
			Analyzing subgraphs
			Analyzing cliques and centrality in the subgraphs
			Looking for change over time
	Summary
Sentiment Analysis
	What is sentiment analysis?
	The basics of sentiment analysis
		The structure of an opinion
		Document-level and sentence-level analysis
		Important features of opinions
	Sentiment analysis algorithms
		General-purpose data collections
			Hu and Liu's sentiment analysis lexicon
			SentiWordNet
			Vader sentiment
	Sentiment mining application
		Motivating the project
		Data preparation
		Data analysis of chat messages
		Data analysis of e-mail messages
	Summary
Named Entity Recognition in Text
	Why look for named entities?
	Techniques for named entity recognition
		Tagging parts of speech
			Classes of named entities
	Building and evaluating NER systems
		NER and partial matches
		Handling partial matches
	Named entity recognition project
		A simple NER tool
			Apache Board meeting minutes
			Django IRC chat
			GnuIRC summaries
			LKML e-mails
	Summary
Automatic Text Summarization
	What is automatic text summarization?
	Tools for text summarization
		Naive text summarization using NLTK
		Text summarization using Gensim
		Text summarization using Sumy
			Sumy's Luhn summarizer
			Sumy's TextRank summarizer
			Sumy's LSA summarizer
			Sumy's Edmundson summarizer
	Summary
Topic Modeling
	What is topic modeling?
	Latent Dirichlet Allocation
	Gensim for topic modeling
		Understanding Gensim LDA topics
		Understanding Gensim LDA passes
		Applying a Gensim LDA model to new documents
		Serializing Gensim LDA objects
			Serializing a dictionary
			Serializing a corpus
			Serializing a model
	Gensim LDA for a larger project
	Summary
Mining for Data Anomalies
	What are data anomalies?
		Missing data
			Locating missing data
			Zero values
		Fixing missing data
			Ignore the problem rows
			Fix the problem manually
			Use a fabricated value
			Use a central measure
			Use Last Observation Carried Forward
			Use a similar value
			Use the most likely value
		Data errors
			Truncated fields
			Data type and character set errors
			Logic or semantic errors
		Outliers
			Visual mining for outliers
			Statistical detection of outliers
	Summary
Index




نظرات کاربران