کنترل بهینه توزیع شده بازی های گرافی دیفرانسیلی غیر خطی به صورت برخط با استفاده از یادگیری تقویتی

تاتاری, فرزانه; نقیبی سیستانی, محمد باقر

دوره 8، شماره 4 - ( مجله کنترل، جلد 8، شماره 4، زمستان 1393 ) جلد 8 شماره 4,1393 صفحات 30-15 | برگشت به فهرست نسخه ها

‎ 20.1001.1.20088345.1393.8.4.1.3

Mendeley

Zotero

RefWorks

Tatari F, Naghibi-S M. Distributed Optimal Control of Nonlinear Differential Graphical Games based on Reinforcement Learning. JoC 2015; 8 (4) :15-30
URL: http://joc.kntu.ac.ir/article-1-176-fa.html

تاتاری فرزانه، نقیبی سیستانی محمد باقر. کنترل بهینه توزیع شده بازی های گرافی دیفرانسیلی غیر خطی به صورت برخط با استفاده از یادگیری تقویتی. مجله کنترل. 1393; 8 (4) :15-30

URL: http://joc.kntu.ac.ir/article-1-176-fa.html

کنترل بهینه توزیع شده بازی های گرافی دیفرانسیلی غیر خطی به صورت برخط با استفاده از یادگیری تقویتی

فرزانه تاتاری^*¹

، محمد باقر نقیبی سیستانی¹

1- دانشگاه فردوسی مشهد

چکیده: (14154 مشاهده)

این مقاله به معرفی بازی های گرافی دیفرانسیلی برای سیستم های چند عاملی غیر خطی زمان پیوسته می پردازد و یک روش بهینه توزیع شده برخط برای حل آنها پیشنهاد می کند. در بازی های گرافی دیفرانسیلی، دینامیک خطا و اندیس عملکرد هر بازیکن تنها بستگی به اطلاعات همسایگان محلی آن عامل دارد. الگوریتم تکرار سیاست توزیع شده پیشنهاد شده، حل تقریبی معادلات همیلتون-جاکوبی کوپل شده همکارانه متعلق به عامل های غیر خطی را به صورت برخط انجام می دهد. در این الگوریتم که بر مبنای یادگیری تقویتی طراحی شده، هر یک از بازیکنان از ساختار شبکه عصبی نقاد-کنترلر استفاده می کند و تنظیم وزن های شبکه های عصبی نقاد و کنترلر به صورت همزمان انجام می شود. در حالی که تمام شبکه های عصبی نقاد-کنترلر در حال یادگیری هستند، پایداری حلقه بسته و همگرایی به قوانین کنترل بهینه تضمین می گردد. در انتها، نتایج به دست آمده از شبیه سازی، عملکرد و صحت الگوریتم پیشنهادی را نشان می دهد.

واژه‌های کلیدی: بازی های گرافی دیفرانسیلی غیرخطی، شبکه های عصبی، کنترل بهینه، یادگیری تقویتی

متن کامل [PDF 950 kb] (4819 دریافت)

نوع مطالعه: پژوهشي | موضوع مقاله: تخصصي
دریافت: 1393/8/25 | پذیرش: 1394/1/15 | انتشار: 1394/1/19

ارسال پیام به نویسنده مسئول

بازنشر اطلاعات
	این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.

کلیه حقوق این وب سایت متعلق به مجله کنترل می باشد.

طراحی و برنامه نویسی : یکتاوب افزار شرق

Designed & Developed by : Yektaweb

پایگاه های مرتبط

کلمات کلیدی