دسترسی نامحدود
برای کاربرانی که ثبت نام کرده اند
برای ارتباط با ما می توانید از طریق شماره موبایل زیر از طریق تماس و پیامک با ما در ارتباط باشید
در صورت عدم پاسخ گویی از طریق پیامک با پشتیبان در ارتباط باشید
برای کاربرانی که ثبت نام کرده اند
درصورت عدم همخوانی توضیحات با کتاب
از ساعت 7 صبح تا 10 شب
ویرایش: [1 ed.] نویسندگان: Richard S. Sutton (auth.), Richard S. Sutton (eds.) سری: The Springer International Series in Engineering and Computer Science 173 ISBN (شابک) : 9781461366089, 9781461536185 ناشر: Springer US سال نشر: 1992 تعداد صفحات: 172 زبان: English فرمت فایل : PDF (درصورت درخواست کاربر به PDF، EPUB یا AZW3 تبدیل می شود) حجم فایل: 11 Mb
در صورت تبدیل فایل کتاب Reinforcement Learning به فرمت های PDF، EPUB، AZW3، MOBI و یا DJVU می توانید به پشتیبان اطلاع دهید تا فایل مورد نظر را تبدیل نمایند.
توجه داشته باشید کتاب آموزش تقویت نسخه زبان اصلی می باشد و کتاب ترجمه شده به فارسی نمی باشد. وبسایت اینترنشنال لایبرری ارائه دهنده کتاب های زبان اصلی می باشد و هیچ گونه کتاب ترجمه شده یا نوشته شده به فارسی را ارائه نمی دهد.
یادگیری تقویتی، یادگیری نقشه برداری از موقعیت ها به اقدامات
به منظور به حداکثر رساندن پاداش اسکالر یا سیگنال تقویتی است.
به یادگیرنده گفته نمیشود که چه اقدامی را انجام دهد، مانند
بسیاری از اشکال یادگیری ماشینی، اما در عوض باید کشف کند که
کدام اقدامات با امتحان کردن، بالاترین پاداش را به همراه دارد.
در جالبترین و چالشبرانگیزترین موارد، اقدامات ممکن است نه
تنها بر پاداش فوری، بلکه بر موقعیت بعدی و از طریق آن بر تمام
پاداشهای بعدی نیز تأثیر بگذارد. این دو ویژگی - جستجوی آزمون
و خطا و پاداش تاخیری - مهمترین ویژگی های متمایزکننده یادگیری
تقویتی هستند.
یادگیری تقویتی یک موضوع جدید و بسیار قدیمی در هوش مصنوعی است.
به نظر می رسد این اصطلاح توسط مینسک (1961) و به طور مستقل در
نظریه کنترل توسط والز و فو (1965) ابداع شده باشد. اولین تحقیق
یادگیری ماشینی که اکنون مستقیماً مرتبط به نظر می رسد، بازیکن
چکر ساموئل (1959) بود که از یادگیری تفاوت زمانی برای مدیریت
پاداش تأخیر مانند امروز استفاده می کرد. البته یادگیری و تقویت
تقریباً یک قرن است که در روانشناسی مورد مطالعه قرار گرفته است
و این کار تأثیر بسیار قوی بر کار هوش مصنوعی / مهندسی داشته
است. در واقع می توان تمام یادگیری های تقویتی را صرفاً مهندسی
معکوس فرآیندهای یادگیری روانشناختی خاص (مانند شرطی سازی عامل
و تقویت ثانویه) دانست.
یادگیری تقویتی یک جلد ویرایش شده از تحقیقات اصلی است
که شامل هفت مشارکت دعوت شده توسط محققان برجسته است.
Reinforcement learning is the learning of a mapping from
situations to actions so as to maximize a scalar reward or
reinforcement signal. The learner is not told which action to
take, as in most forms of machine learning, but instead must
discover which actions yield the highest reward by trying
them. In the most interesting and challenging cases, actions
may affect not only the immediate reward, but also the next
situation, and through that all subsequent rewards. These two
characteristics -- trial-and-error search and delayed reward
-- are the most important distinguishing features of
reinforcement learning.
Reinforcement learning is both a new and a very old topic in
AI. The term appears to have been coined by Minsk (1961), and
independently in control theory by Walz and Fu (1965). The
earliest machine learning research now viewed as directly
relevant was Samuel's (1959) checker player, which used
temporal-difference learning to manage delayed reward much as
it is used today. Of course learning and reinforcement have
been studied in psychology for almost a century, and that
work has had a very strong impact on the AI/engineering work.
One could in fact consider all of reinforcement learning to
be simply the reverse engineering of certain psychological
learning processes (e.g. operant conditioning and secondary
reinforcement).
Reinforcement Learning is an edited volume of
original research, comprising seven invited contributions by
leading researchers.