دسترسی نامحدود
برای کاربرانی که ثبت نام کرده اند
برای ارتباط با ما می توانید از طریق شماره موبایل زیر از طریق تماس و پیامک با ما در ارتباط باشید
در صورت عدم پاسخ گویی از طریق پیامک با پشتیبان در ارتباط باشید
برای کاربرانی که ثبت نام کرده اند
درصورت عدم همخوانی توضیحات با کتاب
از ساعت 7 صبح تا 10 شب
ویرایش:
نویسندگان: Frans Oliehoek
سری:
ISBN (شابک) : 9056296108, 9789056296100
ناشر: Vossiuspers UvA
سال نشر: 2010
تعداد صفحات: 222
زبان: English
فرمت فایل : PDF (درصورت درخواست کاربر به PDF، EPUB یا AZW3 تبدیل می شود)
حجم فایل: 1 مگابایت
در صورت تبدیل فایل کتاب Value-based Planning for Teams of Agents in Stochastic Partially Observable Environments (UvA Proefschriften) به فرمت های PDF، EPUB، AZW3، MOBI و یا DJVU می توانید به پشتیبان اطلاع دهید تا فایل مورد نظر را تبدیل نمایند.
توجه داشته باشید کتاب برنامه ریزی مبتنی بر ارزش برای تیم های نمایندگان در محیط های قابل مشاهده به طور تصادفی (UVA Proefschriften) نسخه زبان اصلی می باشد و کتاب ترجمه شده به فارسی نمی باشد. وبسایت اینترنشنال لایبرری ارائه دهنده کتاب های زبان اصلی می باشد و هیچ گونه کتاب ترجمه شده یا نوشته شده به فارسی را ارائه نمی دهد.
یکی از نیازهای کلیدی سیستم های پشتیبانی تصمیم، توانایی استدلال در مورد عدم قطعیت است. این یک مشکل پیچیده است، به خصوص زمانی که تصمیم گیرندگان متعددی درگیر هستند. به عنوان مثال، تیمی از عوامل آتش نشانی را در نظر بگیرید که هدف آنها خاموش کردن آتش بزرگ در یک منطقه مسکونی تنها با استفاده از مشاهدات محلی است. در این مورد، محیط تصادفی است، زیرا ممکن است عوامل در رابطه با موارد زیر نامطمئن باشند: 1) اثر اعمال خود، 2) وضعیت واقعی محیط، و 3) اقداماتی که سایر عوامل انجام می دهند. این عدم قطعیت ها مشکل را از نظر محاسباتی غیرقابل حل می کند. در این پایان نامه چنین مسائل تصمیم گیری با استفاده از یک مدل زمان گسسته تصادفی به نام فرآیند تصمیم گیری مارکوف جزئی قابل مشاهده غیرمتمرکز (Dec-POMDP) رسمیت می یابد. بخش اول این پایان نامه یک رویکرد مبتنی بر ارزش (به عنوان مثال بر اساس توابع ارزش) برای Dec-POMDP ها، با استفاده از بازی های بیزی توصیف می کند. در بخش دوم، اشکال مختلف ساختار در این رویکرد شناسایی و برای تحقق رفتار مقیاسبندی بهتر مورد بهرهبرداری قرار میگیرد.
A key requirement of decision support systems is the ability to reason about uncertainty. This is a complex problem, especially when multiple decision makers are involved. For instance, consider a team of fire fighting agents whose goal is to extinguish a large fire in a residential area using only local observations. In this case, the environment is stochastic because the agents may be uncertain with respect to: 1) the effect of their actions, 2) the true state of the environment, and 3) the actions the other agents take. These uncertainties render the problem computationally intractable. In this thesis such decision-making problems are formalized using a stochastic discrete-time model called decentralized partially observable Markov decision process (Dec-POMDP). The first part of this thesis describes a value-based (i. e. based on value functions) approach for Dec-POMDPs, making use of Bayesian games. In the second part, different forms of structure in this approach are identified and exploited to realize better scaling behavior.
Introduction......Page 10
Decision-Theoretic Planning for Teams of Agents......Page 24
Optimal Value Functions for Dec-POMDPs......Page 54
Approximate Value Functions & Heuristic Policy Search......Page 76
Factored Dec-POMDPs: Exploiting Locality of Interaction......Page 92
Lossless Clustering of Histories......Page 146
Conclusions and Discussion......Page 164
Summary......Page 174
Samenvatting......Page 176
Problem Specifications......Page 178
Immediate Reward Value Function Formulations......Page 180
Formalization of Regression to Factored Q-Value Functions......Page 186
Proofs......Page 194
Bibliography......Page 204
Acknowledgments......Page 222