یک الگوریتم تکراری برای حل مسایل کنترل بهینه تصادفی با استفاده از زنجیر مارکوف

کفاش, بهزاد; نیکویی نژاد, زهرا; دلاورخلفی, علی

دوره 10، شماره 2 - ( مجله کنترل، جلد 10، شماره 2، تابستان 1395 ) جلد 10 شماره 2,1395 صفحات 43-35 | برگشت به فهرست نسخه ها

‎ 20.1001.1.20088345.1395.10.2.2.4

یک الگوریتم تکراری برای حل مسایل کنترل بهینه تصادفی با استفاده از زنجیر مارکوف

بهزاد کفاش^*¹

، زهرا نیکویی نژاد²

، علی دلاورخلفی²

1- دانشگاه اردکان
2- دانشگاه یزد

چکیده: (10692 مشاهده)

در این مقاله، یک روش عددی برای حل مساله کنترل بهینه تصادفی با استفاده از زنجیرهای مارکوف ارائه شدهاست. بدین ترتیب که، ابتدا فرایند پخش کنترلی وضعیت سیستم با استفاده از یک زنجیر مارکوف کنترلی روی یک فضای وضعیت متناهی تقریب زده میشود. سپس تقریبی از تابع هزینه اولیه با استفاده از این زنجیر مارکوف تقریبی، بهدست میآید. برای اثبات همگرایی روش و یافتن یک زنجیر مارکوف تقریبی مناسب برای فرایند پخش، باید دو معیار مورد بررسی قرار گیرد. به عبارتی باید امید ریاضی و کوواریانس شرطی تغییرات وضعیت زنجیر مارکوف با میانگین و کوواریانس موضعی فرایند پخش اولیه متناسب باشند. با استفاده از تقریبات تفاضلات متناهی میتوان احتمالات انتقال و بازههای زمانی تغییر وضعیت زنجیر مارکوف را به گونهای تعیین کرد که زنجیر مارکوف در دو ویژگی سازگاری موضعی فوق صدق کند. در ادامه معادله برنامهریزی پویا با زنجیر مارکوفی که بدین ترتیب بهدست آمده و دارای این ویژگیهای میباشد، تقریب زده میشود. نهایتاً، با میل دادن پارامتر گسسته سازی زنجیر مارکوف به صفر، مشاهده میشود که جواب مسئله کنترل تصادفی تقریبی زنجیر مارکوف، به جواب مسئله کنترل بهینه تصادفی اولیه همگرا میباشد. در پایان یک الگوریتم تکراری برای حل مساله کنترل بهینه تصادفی پیشنهاد شده و از آن برای حل یک مثال استفاده شده است.

واژه‌های کلیدی: مساله کنترل بهینه تصادفی، زنجیر مارکوف، روش عددی، الگوریتم تکراری.

متن کامل [PDF 1541 kb] (5775 دریافت)

نوع مطالعه: پژوهشي | موضوع مقاله: تخصصي
دریافت: 1394/6/29 | پذیرش: 1395/9/24 | انتشار: 1395/9/24

بازنشر اطلاعات
	این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.