دسترسی نامحدود
برای کاربرانی که ثبت نام کرده اند
برای ارتباط با ما می توانید از طریق شماره موبایل زیر از طریق تماس و پیامک با ما در ارتباط باشید
در صورت عدم پاسخ گویی از طریق پیامک با پشتیبان در ارتباط باشید
برای کاربرانی که ثبت نام کرده اند
درصورت عدم همخوانی توضیحات با کتاب
از ساعت 7 صبح تا 10 شب
دسته بندی: سایبرنتیک: هوش مصنوعی ویرایش: 2 نویسندگان: Stefanie Molin سری: ISBN (شابک) : 1800563450, 9781800563452 ناشر: Packt Publishing سال نشر: 2021 تعداد صفحات: 788 زبان: English فرمت فایل : PDF (درصورت درخواست کاربر به PDF، EPUB یا AZW3 تبدیل می شود) حجم فایل: 71 مگابایت
کلمات کلیدی مربوط به کتاب تجزیه و تحلیل داده های عملی با Pandas: کتابچه راهنمای علوم داده Python برای جمع آوری داده ها ، درگیری ها ، تجزیه و تحلیل ها و تجسم داده ها: یادگیری ماشینی، تجزیه و تحلیل داده، رگرسیون، تشخیص ناهنجاری، پایتون، طبقهبندی، خوشهبندی، تجسم دادهها، مهندسی ویژگیها، آمار، تنظیم فراپارامتر، امور مالی، scikit-learn، یادگیری گروهی، matplotlib، پانداها، Jupyter، Data Wrangling، Bitcoin، Seaborn استنتاج آماری، ارزش گذاری سهام، جمع آوری داده ها، آریما، پیش پردازش داده ها، اکتشاف داده ها
در صورت تبدیل فایل کتاب Hands-On Data Analysis with Pandas: A Python data science handbook for data collection, wrangling, analysis, and visualization به فرمت های PDF، EPUB، AZW3، MOBI و یا DJVU می توانید به پشتیبان اطلاع دهید تا فایل مورد نظر را تبدیل نمایند.
توجه داشته باشید کتاب تجزیه و تحلیل داده های عملی با Pandas: کتابچه راهنمای علوم داده Python برای جمع آوری داده ها ، درگیری ها ، تجزیه و تحلیل ها و تجسم داده ها نسخه زبان اصلی می باشد و کتاب ترجمه شده به فارسی نمی باشد. وبسایت اینترنشنال لایبرری ارائه دهنده کتاب های زبان اصلی می باشد و هیچ گونه کتاب ترجمه شده یا نوشته شده به فارسی را ارائه نمی دهد.
با پانداها آشنا شوید - یک کتابخانه همه کاره و با کارایی بالا برای دستکاری، پردازش، تمیز کردن و خرد کردن مجموعه داده ها در پایتون ویژگی های کلیدی • انجام تجزیه و تحلیل داده ها و وظایف دستکاری کارآمد با استفاده از پاندا 1.x • پیاده سازی پانداها در حوزه های مختلف دنیای واقعی با کمک نمایش های گام به گام • در استفاده از پانداها به عنوان یک ابزار موثر کاوش داده ها به خوبی آشنا شوید توضیحات کتاب pandas یک کتابخانه قدرتمند و پرطرفدار مترادف با علم داده پایتون است که به شما امکان می دهد با داده های جدولی به طور موثر کار کنید، بحث و تجسم داده ها را آسان می کند. این نسخه دوم به شما کمک می کند تا با ویژگی های جدید در pandas 1.x آشنا شوید و مهارت های تجزیه و تحلیل داده های خود را برای استخراج بینش و ارزش قابل توجه از داده ها افزایش دهید. تجزیه و تحلیل دستی داده با پانداها به شما نشان می دهد که چگونه داده های خود را تجزیه و تحلیل کنید، با یادگیری ماشینی شروع کنید و با کتابخانه های پایتون که اغلب برای علم داده استفاده می شوند، مانند پانداها، NumPy، matplotlib، seaborn و scikit-learn به طور موثر کار کنید. با استفاده از مجموعه داده های دنیای واقعی، این کتاب به شما نشان می دهد که چگونه از کتابخانه قدرتمند پانداها برای انجام جدال داده ها برای تغییر شکل، تمیز کردن و جمع آوری داده های خود استفاده کنید. همانطور که پیش می روید، یاد خواهید گرفت که چگونه با محاسبه آمار خلاصه و تجسم داده ها برای یافتن الگوها، تجزیه و تحلیل داده های اکتشافی را انجام دهید. همچنین برخی از کاربردهای تشخیص ناهنجاری، رگرسیون، خوشهبندی و طبقهبندی را با استفاده از scikit-learn برای پیشبینی بر اساس دادههای گذشته بررسی خواهید کرد. در پایان این کتاب تجزیه و تحلیل داده ها، شما به مهارت های لازم برای استفاده از پانداها برای اطمینان از صحت داده های خود، تجسم آن ها برای تصمیم گیری موثر و بازتولید قابل اعتماد تجزیه و تحلیل ها در چندین حوزه مجهز خواهید شد. آنچه خواهید آموخت • درک کنید که چگونه تحلیلگران و دانشمندان داده ها را جمع آوری و تجزیه و تحلیل می کنند • تجزیه و تحلیل داده ها و جدال داده ها را با استفاده از پایتون انجام دهید • ترکیب، گروه، و جمع آوری داده ها از منابع متعدد • تجسم داده ها را با پانداها، matplotlib و seaborn ایجاد کنید • از الگوریتم های یادگیری ماشین برای شناسایی الگوها و پیش بینی استفاده کنید • از کتابخانه های علوم داده پایتون برای تجزیه و تحلیل مجموعه داده های دنیای واقعی استفاده کنید • حل مشکلات رایج نمایش داده ها و تجزیه و تحلیل با استفاده از پانداها • ساخت اسکریپت ها، ماژول ها و بسته های پایتون برای کدهای تجزیه و تحلیل قابل استفاده مجدد این کتاب برای چه کسی است این کتاب برای مبتدیان علم داده، تحلیلگران داده و توسعه دهندگان پایتون است که می خواهند هر مرحله از تجزیه و تحلیل داده ها و محاسبات علمی را با استفاده از طیف گسترده ای از مجموعه داده ها کشف کنند. همچنین اگر دانشمند داده ای هستید که به دنبال پیاده سازی پانداها در گردش کار یادگیری ماشین خود هستید، این کتاب برای شما مفید خواهد بود. دانش کاری زبان برنامه نویسی پایتون به درک مفاهیم کلیدی پوشش داده شده در این کتاب کمک می کند.
Get to grips with pandas - a versatile and high-performance library for manipulating, processing, cleaning, and crunching datasets in Python Key Features • Perform efficient data analysis and manipulation tasks using pandas 1.x • Implement pandas in different real-world domains with the help of step-by-step demonstrations • Become well versed in using pandas as an effective data exploration tool Book Description pandas is a powerful and popular library synonymous with Python data science that makes data wrangling and visualization easy by enabling you to work efficiently with tabular data. This second edition will help you get well-versed with the new features in pandas 1.x and enhance your data analysis skills for extracting significant insights and value from data. Hands-On Data Analysis with Pandas will show you how to analyze your data, get started with machine learning, and work effectively with the Python libraries often used for data science, such as pandas, NumPy, matplotlib, seaborn, and scikit-learn. Using real-world datasets, the book shows you how to use the powerful pandas library to perform data wrangling to reshape, clean, and aggregate your data. As you advance, you'll learn how to conduct exploratory data analysis by calculating summary statistics and visualizing the data to find patterns. You'll also explore some applications of anomaly detection, regression, clustering, and classification using scikit-learn to make predictions based on past data. By the end of this data analysis book, you'll be equipped with the skills you need to use pandas to ensure the veracity of your data, visualize it for effective decision-making, and reliably reproduce analyses across multiple domains. What you will learn • Understand how data analysts and scientists gather and analyze data • Perform data analysis and data wrangling using Python • Combine, group, and aggregate data from multiple sources • Create data visualizations with pandas, matplotlib, and seaborn • Apply machine learning algorithms to identify patterns and make predictions • Use Python data science libraries to analyze real-world datasets • Solve common data representation and analysis problems using pandas • Build Python scripts, modules, and packages for reusable analysis code Who This Book Is For This book is for data science beginners, data analysts, and Python developers who want to explore each stage of data analysis and scientific computing using a wide range of datasets. You'll also find this book useful if you are a data scientist looking to implement pandas in your machine learning workflow. Working knowledge of the Python programming language will assist with understanding the key concepts covered in this book.
Cover Title Page Copyright and Credits Dedicated Foreword to the Second Edition Foreword to the First Edition Contributors Table of Contents Preface Section 1: Getting Started with Pandas Chapter 1: Introduction to Data Analysis Chapter materials The fundamentals of data analysis Data collection Data wrangling Exploratory data analysis Drawing conclusions Statistical foundations Sampling Descriptive statistics Prediction and forecasting Inferential statistics Setting up a virtual environment Virtual environments Installing the required Python packages Why pandas? Jupyter Notebooks Summary Exercises Further reading Chapter 2: Working with Pandas DataFrames Chapter materials Pandas data structures Series Index DataFrame Creating a pandas DataFrame From a Python object From a file From a database From an API Inspecting a DataFrame object Examining the data Describing and summarizing the data Grabbing subsets of the data Selecting columns Slicing Indexing Filtering Adding and removing data Creating new data Deleting unwanted data Summary Exercises Further reading Section 2: Using Pandas for Data Analysis Chapter 3: Data Wrangling with Pandas Chapter materials Understanding data wrangling Data cleaning Data transformation Data enrichment Exploring an API to find and collect temperature data Cleaning data Renaming columns Type conversion Reordering, reindexing, and sorting data Reshaping data Transposing DataFrames Pivoting DataFrames Melting DataFrames Handling duplicate, missing, or invalid data Finding the problematic data Mitigating the issues Summary Exercises Further reading Chapter 4: Aggregating Pandas DataFrames Chapter materials Performing database-style operations on DataFrames Querying DataFrames Merging DataFrames Using DataFrame operations to enrich data Arithmetic and statistics Binning Applying functions Window calculations Pipes Aggregating data Summarizing DataFrames Aggregating by group Pivot tables and crosstabs Working with time series data Time-based selection and filtering Shifting for lagged data Differenced data Resampling Merging time series Summary Exercises Further reading Chapter 5: Visualizing Data with Pandas and Matplotlib Chapter materials An introduction to matplotlib The basics Plot components Additional options Plotting with pandas Evolution over time Relationships between variables Distributions Counts and frequencies The pandas.plotting module Scatter matrices Lag plots Autocorrelation plots Bootstrap plots Summary Exercises Further reading Chapter 6: Plotting with Seaborn and Customization Techniques Chapter materials Utilizing seaborn for advanced plotting Categorical data Correlations and heatmaps Regression plots Faceting Formatting plots with matplotlib Titles and labels Legends Formatting axes Customizing visualizations Adding reference lines Shading regions Annotations Colors Textures Summary Exercises Further reading Section 3: Applications – Real-World Analyses Using Pandas Chapter 7: Financial Analysis – Bitcoin and the Stock Market Chapter materials Building a Python package Package structure Overview of the stock_analysis package UML diagrams Collecting financial data The StockReader class Collecting historical data from Yahoo! Finance Exploratory data analysis The Visualizer class family Visualizing a stock Visualizing multiple assets Technical analysis of financial instruments The StockAnalyzer class The AssetGroupAnalyzer class Comparing assets Modeling performance using historical data The StockModeler class Time series decomposition ARIMA Linear regression with statsmodels Comparing models Summary Exercises Further reading Chapter 8: Rule-Based Anomaly Detection Chapter materials Simulating login attempts Assumptions The login_attempt_simulator package Simulating from the command line Exploratory data analysis Implementing rule-based anomaly detection Percent difference Tukey fence Z-score Evaluating performance Summary Exercises Further reading Section 4: Introduction to Machine Learning with Scikit-Learn Chapter 9: Getting Started with Machine Learning in Python Chapter materials Overview of the machine learning landscape Types of machine learning Common tasks Machine learning in Python Exploratory data analysis Red wine quality data White and red wine chemical properties data Planets and exoplanets data Preprocessing data Training and testing sets Scaling and centering data Encoding data Imputing Additional transformers Building data pipelines Clustering k-means Evaluating clustering results Regression Linear regression Evaluating regression results Classification Logistic regression Evaluating classification results Summary Exercises Further reading Chapter 10: Making Better Predictions – Optimizing Models Chapter materials Hyperparameter tuning with grid search Feature engineering Interaction terms and polynomial features Dimensionality reduction Feature unions Feature importances Ensemble methods Random forest Gradient boosting Voting Inspecting classification prediction confidence Addressing class imbalance Under-sampling Over-sampling Regularization Summary Exercises Further reading Chapter 11: Machine Learning Anomaly Detection Chapter materials Exploring the simulated login attempts data Utilizing unsupervised methods of anomaly detection Isolation forest Local outlier factor Comparing models Implementing supervised anomaly detection Baselining Logistic regression Incorporating a feedback loop with online learning Creating the PartialFitPipeline subclass Stochastic gradient descent classifier Summary Exercises Further reading Section 5: Additional Resources Chapter 12: The Road Ahead Data resources Python packages Searching for data APIs Websites Practicing working with data Python practice Summary Exercises Further reading Solutions Appendix About Packt Other Books You May Enjoy Index