ورود به حساب

نام کاربری گذرواژه

گذرواژه را فراموش کردید؟ کلیک کنید

حساب کاربری ندارید؟ ساخت حساب

ساخت حساب کاربری

نام نام کاربری ایمیل شماره موبایل گذرواژه

برای ارتباط با ما می توانید از طریق شماره موبایل زیر از طریق تماس و پیامک با ما در ارتباط باشید


09117307688
09117179751

در صورت عدم پاسخ گویی از طریق پیامک با پشتیبان در ارتباط باشید

دسترسی نامحدود

برای کاربرانی که ثبت نام کرده اند

ضمانت بازگشت وجه

درصورت عدم همخوانی توضیحات با کتاب

پشتیبانی

از ساعت 7 صبح تا 10 شب

دانلود کتاب Hands-On Reinforcement Learning with Python: Master Reinforcement and Deep Reinforcement Learning Using OpenAI Gym and TensorFlow

دانلود کتاب آموزش تقویتی دستی با پایتون: آموزش تقویتی و تقویت عمیق با استفاده از OpenAI Gym و TensorFlow

Hands-On Reinforcement Learning with Python: Master Reinforcement and Deep Reinforcement Learning Using OpenAI Gym and TensorFlow

مشخصات کتاب

Hands-On Reinforcement Learning with Python: Master Reinforcement and Deep Reinforcement Learning Using OpenAI Gym and TensorFlow

ویرایش:  
نویسندگان:   
سری:  
ISBN (شابک) : 9781788836524, 178883691X 
ناشر: Packt Publishing Ltd 
سال نشر: 2018 
تعداد صفحات: 310 
زبان: English 
فرمت فایل : PDF (درصورت درخواست کاربر به PDF، EPUB یا AZW3 تبدیل می شود) 
حجم فایل: 17 مگابایت 

قیمت کتاب (تومان) : 33,000

در صورت ایرانی بودن نویسنده امکان دانلود وجود ندارد و مبلغ عودت داده خواهد شد



کلمات کلیدی مربوط به کتاب آموزش تقویتی دستی با پایتون: آموزش تقویتی و تقویت عمیق با استفاده از OpenAI Gym و TensorFlow: هوش مصنوعی، کامپیوتر--هوش (AI) و معناشناسی، کامپیوتر--شبکه‌های عصبی، کامپیوترها- جنبه‌های اجتماعی--تعامل انسان-رایانه، تعامل انسان-رایانه، یادگیری ماشین، شبکه‌های عصبی و سیستم‌های فازی، کتاب‌های الکترونیکی، رایانه‌ها - - هوش (AI) و معناشناسی، رایانه ها - شبکه های عصبی، رایانه ها - جنبه های اجتماعی - تعامل انسان و رایانه



ثبت امتیاز به این کتاب

میانگین امتیاز به این کتاب :
       تعداد امتیاز دهندگان : 16


در صورت تبدیل فایل کتاب Hands-On Reinforcement Learning with Python: Master Reinforcement and Deep Reinforcement Learning Using OpenAI Gym and TensorFlow به فرمت های PDF، EPUB، AZW3، MOBI و یا DJVU می توانید به پشتیبان اطلاع دهید تا فایل مورد نظر را تبدیل نمایند.

توجه داشته باشید کتاب آموزش تقویتی دستی با پایتون: آموزش تقویتی و تقویت عمیق با استفاده از OpenAI Gym و TensorFlow نسخه زبان اصلی می باشد و کتاب ترجمه شده به فارسی نمی باشد. وبسایت اینترنشنال لایبرری ارائه دهنده کتاب های زبان اصلی می باشد و هیچ گونه کتاب ترجمه شده یا نوشته شده به فارسی را ارائه نمی دهد.


توضیحاتی در مورد کتاب آموزش تقویتی دستی با پایتون: آموزش تقویتی و تقویت عمیق با استفاده از OpenAI Gym و TensorFlow

یادگیری تقویتی یک نوع خود تکاملی از یادگیری ماشینی است که ما را به دستیابی به هوش مصنوعی واقعی نزدیکتر می کند. این راهنمای آسان برای دنبال کردن همه چیز را از ابتدا با استفاده از نمونه های غنی نوشته شده در پایتون توضیح می دهد. صفحه عنوان؛ حق چاپ و اعتبار؛ فداکاری؛ Packt Upsell; مشارکت کنندگان؛ فهرست مطالب؛ پیشگفتار؛ فصل 1: مقدمه ای بر یادگیری تقویتی. RL چیست؟ الگوریتم RL؛ چگونه RL با سایر پارادایم های ML متفاوت است. عناصر RL; عامل؛ تابع سیاست؛ تابع ارزش؛ مدل؛ رابط محیط عامل. انواع محیط RL; محیط قطعی؛ محیط تصادفی؛ محیط کاملاً قابل مشاهده؛ محیط تا حدی قابل مشاهده؛ محیط گسسته؛ محیط پیوسته؛ محیط اپیزودیک و غیر اپیزودیک; محیط تک و چند عاملی؛ پلتفرم های RL


توضیحاتی درمورد کتاب به خارجی

Reinforcement learning is a self-evolving type of machine learning that takes us closer to achieving true artificial intelligence. This easy-to-follow guide explains everything from scratch using rich examples written in Python.;Cover; Title Page; Copyright and Credits; Dedication; Packt Upsell; Contributors; Table of Contents; Preface; Chapter 1: Introduction to Reinforcement Learning; What is RL?; RL algorithm; How RL differs from other ML paradigms; Elements of RL; Agent; Policy function; Value function; Model; Agent environment interface; Types of RL environment; Deterministic environment; Stochastic environment; Fully observable environment; Partially observable environment; Discrete environment; Continuous environment; Episodic and non-episodic environment; Single and multi-agent environment; RL platforms.



فهرست مطالب

Cover
Title Page
Copyright and Credits
Dedication
Packt Upsell
Contributors
Table of Contents
Preface
Chapter 1: Introduction to Reinforcement Learning
What is RL?
RL algorithm
How RL differs from other ML paradigms
Elements of RL
Agent
Policy function
Value function
Model
Agent environment interface
Types of RL environment
Deterministic environment
Stochastic environment
Fully observable environment
Partially observable environment
Discrete environment
Continuous environment
Episodic and non-episodic environment
Single and multi-agent environment
RL platforms. OpenAI Gym and UniverseDeepMind Lab
RL-Glue
Project Malmo
ViZDoom
Applications of RL
Education
Medicine and healthcare
Manufacturing
Inventory management
Finance
Natural Language Processing and Computer Vision
Summary
Questions
Further reading
Chapter 2: Getting Started with OpenAI and TensorFlow
Setting up your machine
Installing Anaconda
Installing Docker
Installing OpenAI Gym and Universe
Common error fixes
OpenAI Gym
Basic simulations
Training a robot to walk
OpenAI Universe
Building a video game bot
TensorFlow
Variables, constants, and placeholders
Variables. ConstantsPlaceholders
Computation graph
Sessions
TensorBoard
Adding scope
Summary
Questions
Further reading
Chapter 3: The Markov Decision Process and Dynamic Programming
The Markov chain and Markov process
Markov Decision Process
Rewards and returns
Episodic and continuous tasks
Discount factor
The policy function
State value function
State-action value function (Q function)
The Bellman equation and optimality
Deriving the Bellman equation for value and Q functions
Solving the Bellman equation
Dynamic programming
Value iteration
Policy iteration. Solving the frozen lake problemValue iteration
Policy iteration
Summary
Questions
Further reading
Chapter 4: Gaming with Monte Carlo Methods
Monte Carlo methods
Estimating the value of pi using Monte Carlo
Monte Carlo prediction
First visit Monte Carlo
Every visit Monte Carlo
Let\'s play Blackjack with Monte Carlo
Monte Carlo control
Monte Carlo exploration starts
On-policy Monte Carlo control
Off-policy Monte Carlo control
Summary
Questions
Further reading
Chapter 5: Temporal Difference Learning
TD learning
TD prediction
TD control
Q learning. Solving the taxi problem using Q learningSARSA
Solving the taxi problem using SARSA
The difference between Q learning and SARSA
Summary
Questions
Further reading
Chapter 6: Multi-Armed Bandit Problem
The MAB problem
The epsilon-greedy policy
The softmax exploration algorithm
The upper confidence bound algorithm
The Thompson sampling algorithm
Applications of MAB
Identifying the right advertisement banner using MAB
Contextual bandits
Summary
Questions
Further reading
Chapter 7: Deep Learning Fundamentals
Artificial neurons
ANNs
Input layer
Hidden layer
Output layer.




نظرات کاربران