[صفحه اصلی ]   [Archive] [ English ]  
:: صفحه اصلي :: درباره نشريه :: آخرين شماره :: تمام شماره‌ها :: جستجو :: ثبت نام :: ارسال مقاله :: تماس با ما ::
:: دوره 8، شماره 4 - ( مجله کنترل، جلد 8، شماره 4، زمستان 1393 ) ::
جلد 8 شماره 4,1393 صفحات 15-30 برگشت به فهرست نسخه ها
کنترل بهینه توزیع شده بازی های گرافی دیفرانسیلی غیر خطی به صورت برخط با استفاده از یادگیری تقویتی
خانم فرزانه تاتاری* 1، دکتر محمد باقر نقیبی سیستانی2
1- دانشجو دکتری دانشگاه فردوسی مشهد
2- استاديار دانشگاه فردوسی مشهد
چکیده:   (3265 مشاهده)
این مقاله به معرفی بازی های گرافی دیفرانسیلی برای سیستم های چند عاملی غیر خطی زمان پیوسته می پردازد و یک روش بهینه توزیع شده برخط برای حل آنها پیشنهاد می کند. در بازی های گرافی دیفرانسیلی، دینامیک خطا و اندیس عملکرد هر بازیکن تنها بستگی به اطلاعات همسایگان محلی آن عامل دارد. الگوریتم تکرار سیاست توزیع شده پیشنهاد شده، حل تقریبی معادلات همیلتون-جاکوبی کوپل شده همکارانه متعلق به عامل های غیر خطی را به صورت برخط انجام می دهد. در این الگوریتم که بر مبنای یادگیری تقویتی طراحی شده، هر یک از بازیکنان از ساختار شبکه عصبی نقاد-کنترلر استفاده می کند و تنظیم وزن های شبکه های عصبی نقاد و کنترلر به صورت همزمان انجام می شود. در حالی که تمام شبکه های عصبی نقاد-کنترلر در حال یادگیری هستند، پایداری حلقه بسته و همگرایی به قوانین کنترل بهینه تضمین می گردد. در انتها، نتایج به دست آمده از شبیه سازی، عملکرد و صحت الگوریتم پیشنهادی را نشان می دهد.
واژه‌های کلیدی: بازی های گرافی دیفرانسیلی غیرخطی، شبکه های عصبی، کنترل بهینه، یادگیری تقویتی
متن کامل [PDF 950 kb]   (879 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: تخصصي
دریافت: ۱۳۹۳/۸/۲۵ | پذیرش: ۱۳۹۴/۱/۱۵ | انتشار: ۱۳۹۴/۱/۱۹
ارسال پیام به نویسنده مسئول

ارسال نظر درباره این مقاله
نام کاربری یا پست الکترونیک شما:

CAPTCHA code


XML   English Abstract   Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Tatari F, Naghibi-S M. Distributed Optimal Control of Nonlinear Differential Graphical Games based on Reinforcement Learning. JoC. 2015; 8 (4) :15-30
URL: http://joc.kntu.ac.ir/article-1-176-fa.html

تاتاری فرزانه، نقیبی سیستانی محمد باقر. کنترل بهینه توزیع شده بازی های گرافی دیفرانسیلی غیر خطی به صورت برخط با استفاده از یادگیری تقویتی. مجله کنترل. 1393; 8 (4) :15-30

URL: http://joc.kntu.ac.ir/article-1-176-fa.html



دوره 8، شماره 4 - ( مجله کنترل، جلد 8، شماره 4، زمستان 1393 ) برگشت به فهرست نسخه ها
مجله کنترل Journal of Control
Persian site map - English site map - Created in 0.1 seconds with 31 queries by YEKTAWEB 3752