برای ارتباط با ما می توانید از طریق شماره موبایل زیر از طریق تماس و پیامک با ما در ارتباط باشید

09117307688
09117179751

در صورت عدم پاسخ گویی از طریق پیامک با پشتیبان در ارتباط باشید

دسترسی نامحدود

برای کاربرانی که ثبت نام کرده اند

ضمانت بازگشت وجه

درصورت عدم همخوانی توضیحات با کتاب

پشتیبانی

از ساعت 7 صبح تا 10 شب

دانلود کتاب Practical Reinforcement Learning

دانلود کتاب یادگیری تقویتی عملی

مشخصات کتاب

Practical Reinforcement Learning

ویرایش:  
نویسندگان: Farrukh Akhtar  
سری:  
ISBN (شابک) : 9781787127401, 1787127400 
ناشر: Packt Publishing 
سال نشر: 2017 
تعداد صفحات: 270 
زبان: English 
فرمت فایل : PDF (درصورت درخواست کاربر به PDF، EPUB یا AZW3 تبدیل می شود) 
حجم فایل: 7 مگابایت

قیمت کتاب (تومان) : 42,000

در صورت ایرانی بودن نویسنده امکان دانلود وجود ندارد و مبلغ عودت داده خواهد شد

میانگین امتیاز به این کتاب :
تعداد امتیاز دهندگان : 17

در صورت تبدیل فایل کتاب Practical Reinforcement Learning به فرمت های PDF، EPUB، AZW3، MOBI و یا DJVU می توانید به پشتیبان اطلاع دهید تا فایل مورد نظر را تبدیل نمایند.

توجه داشته باشید کتاب یادگیری تقویتی عملی نسخه زبان اصلی می باشد و کتاب ترجمه شده به فارسی نمی باشد. وبسایت اینترنشنال لایبرری ارائه دهنده کتاب های زبان اصلی می باشد و هیچ گونه کتاب ترجمه شده یا نوشته شده به فارسی را ارائه نمی دهد.

توضیحاتی درمورد کتاب به خارجی

فهرست مطالب

\"\"Cover \"\"
 \"\"Copyright\"\"
 \"\"Credits\"\"
 \"\"About the Author\"\"
 \"\"About the Reviewers\"\"
 \"\"www.PacktPub.com\"\"
 \"\"Customer Feedback\"\"
 \"\"Table of Contents\"\"
 \"\"Preface\"\"
 \"\"Chapter 1: Reinforcement Learning \"\"
 \"\"Overview of machine learning\"\"
 \"\"What is machine learning?\"\"
 \"\"Speech conversion from one language to another\"\"
 \"\"Suspicious activity detection from CCTVs\"\"
 \"\"Medical diagnostics for detecting diseases\"\"
 \"\"Supervised learning\"\"
 \"\"Unsupervised learning\"\"
 \"\"Reinforcement learning\"\"
 \"\"Introduction to reinforcement learning\"\"
 \"\"Positive reinforcement learning\"\" \"\"Negative reinforcement learning\"\"\"\"Applications of reinforcement learning\"\"
 \"\"Self-driving cars\"\"
 \"\"Drone autonomous aerial taxi\"\"
 \"\"Aerobatics autonomous helicopter\"\"
 \"\"TD-Gammon â#x80
#x93
 computer game\"\"
 \"\"AlphaGo\"\"
 \"\"The agent environment setup\"\"
 \"\"Exploration versus exploitation\"\"
 \"\"Neural network and reinforcement learning\"\"
 \"\"Reinforcement learning frameworks/toolkits\"\"
 \"\"OpenAI Gym\"\"
 \"\"Getting Started with OpenAI Gym\"\"
 \"\"Docker\"\"
 \"\"Docker installation on Windows environment\"\"
 \"\"Docker installation on a Linux environment\"\"
 \"\"Running an environment\"\" \"\"Brown-UMBC Reinforcement Learning and Planning\"\"\"\"Walkthrough with Hello GridWorld\"\"
 \"\"Hello GridWorld project\"\"
 \"\"Summary\"\"
 \"\"Chapter 2: Markov Decision Process \"\"
 \"\"Introduction to MDP\"\"
 \"\"State\"\"
 \"\"Action\"\"
 \"\"Model\"\"
 \"\"Reward\"\"
 \"\"Policy\"\"
 \"\"MDP --
more about rewards\"\"
 \"\"Optimal policy\"\"
 \"\"More about policy\"\"
 \"\"Bellman equation\"\"
 \"\"A practical example of building an MDP domain\"\"
 \"\"GridWorld\"\"
 \"\"Terminal states\"\"
 \"\"Java interfaces for MDP definitions\"\"
 \"\"Single-agent domain\"\"
 \"\"State\"\"
 \"\"Action\"\"
 \"\"Action type\"\"
 \"\"SampleModel\"\"
 \"\"Environment\"\"
 \"\"EnvironmentOutcome\"\" \"\"TransitionProb\"\"\"\"Defining a GridWorld state\"\"
 \"\"Defining a GridWorld model\"\"
 \"\"Creating the state visualizer\"\"
 \"\"Testing it out\"\"
 \"\"Markov chain\"\"
 \"\"Building an object-oriented MDP domain\"\"
 \"\"Summary\"\"
 \"\"Chapter 3: Dynamic Programming \"\"
 \"\"Learning and planning\"\"
 \"\"Evaluating a policy\"\"
 \"\"Value iteration\"\"
 \"\"Value iteration implementation using BURLAP\"\"
 \"\"Output of the value iteration\"\"
 \"\"Policy iteration\"\"
 \"\"Bellman equations\"\"
 \"\"The relationship between Bellman equations\"\"
 \"\"Summary\"\"
 \"\"Chapter 4: Temporal Difference Learning \"\"
 \"\"Introducing TD learning\"\" \"\"TD lambda\"\"\"\"Estimating from data\"\"
 \"\"Learning rate\"\"
 \"\"Properties of learning rate\"\"
 \"\"Overview of TD(1)\"\"
 \"\"An example of TD(1)\"\"
 \"\"Why TD(1) is wrong\"\"
 \"\"Overview of TD(0)\"\"
 \"\"TD lambda rule\"\"
 \"\"K-step estimator\"\"
 \"\"Relationship between k-step estimators and TD lambda\"\"
 \"\"Summary\"\"
 \"\"Chapter 5: Monte Carlo Methods \"\"
 \"\"Monte Carlo methods\"\"
 \"\"First visit Monte Carlo\"\"
 \"\"Example â#x80
#x93
 Blackjack\"\"
 \"\"Objective of the game\"\"
 \"\"Card scoring/values\"\"
 \"\"The deal\"\"
 \"\"Naturals\"\"
 \"\"The gameplay\"\"
 \"\"Applying the Monte Carlo approach\"\"
 \"\"Blackjack game implementation\"\"

اینترنشنال لایبرری

ساخت حساب کاربری

دسترسی نامحدود

ضمانت بازگشت وجه

پشتیبانی

دانلود کتاب Practical Reinforcement Learning

دانلود کتاب یادگیری تقویتی عملی

مشخصات کتاب

Practical Reinforcement Learning

توضیحاتی درمورد کتاب به خارجی

فهرست مطالب

نظرات کاربران

کتاب های تصادفی

دانلود کتاب Professional WordPress: Design and Development

دانلود کتاب Visual Vitriol: The Street Art and Subcultures of the Punk and Hardcore Generation

دانلود کتاب Data Center Networks: Topologies, Architectures and Fault-Tolerance Characteristics

دانلود کتاب The People and the Dao: New Studies in Chinese Religions in Honour of Daniel L. Overmyer

دانلود کتاب Основы техники и методики обучения теннису. Учебное пособие

ورود به حساب

ساخت حساب کاربری

دسترسی نامحدود

ضمانت بازگشت وجه

پشتیبانی

دانلود کتاب Practical Reinforcement Learning

دانلود کتاب ﻿﻿یادگیری تقویتی عملی

مشخصات کتاب

Practical Reinforcement Learning

توضیحاتی درمورد کتاب به خارجی

فهرست مطالب

نظرات کاربران

کتاب های تصادفی

دانلود کتاب Professional WordPress: Design and Development

دانلود کتاب Visual Vitriol: The Street Art and Subcultures of the Punk and Hardcore Generation

دانلود کتاب Data Center Networks: Topologies, Architectures and Fault-Tolerance Characteristics

دانلود کتاب The People and the Dao: New Studies in Chinese Religions in Honour of Daniel L. Overmyer

دانلود کتاب Основы техники и методики обучения теннису. Учебное пособие

دانلود کتاب یادگیری تقویتی عملی