روشی نوین برای یادگیری تقویتی فازیِ باناظر برای ناوبری ربات

فتحی نژاد, فاطمه; درهمی, ولی

دوره 6، شماره 3 - ( مجله کنترل، جلد 6، شماره 3، پاییز 1391 ) جلد 6 شماره 3,1391 صفحات 10-1 | برگشت به فهرست نسخه ها

‎ 20.1001.1.20088345.1391.6.3.1.7

Mendeley

Zotero

RefWorks

Fathinezhad F, Derhami V. A Novel Supervised Fuzzy Reinforcement Learning for Robot Navigation . JoC 2012; 6 (3) :1-10
URL: http://joc.kntu.ac.ir/article-1-49-fa.html

فتحی نژاد فاطمه، درهمی ولی. روشی نوین برای یادگیری تقویتی فازیِ باناظر برای ناوبری ربات. مجله کنترل. 1391; 6 (3) :1-10

URL: http://joc.kntu.ac.ir/article-1-49-fa.html

روشی نوین برای یادگیری تقویتی فازیِ باناظر برای ناوبری ربات

فاطمه فتحی نژاد^*¹

، ولی درهمی¹

1- دانشگاه یزد

چکیده: (30685 مشاهده)

: استفاده از یادگیری باناظر در ناوبری ربات های متحرک، با چالش های جدی از قبیل ناسازگاری و اختلال در داده ها، مشکل جمع آوری نمودن داده آموزش و خطای زیاد در داده های آموزشی مواجه می باشد. قابلیت های یادگیری تقویتی همچون عدم نیاز به داده آموزشی و آموزش تنها با استفاده از یک معیار اسکالر راندمان باعث کاربرد آن در ناوبری ربات شده است. از طرفی یادگیری تقویتی زمانبر بوده و دارای نرخ شکست های بالا در مرحله آموزش می باشد. در این مقاله، یک ایده جدید برای استفاده مؤثّر از هر دو الگوریتم یادگیری فوق ارائه می‌شود. یک کنترلگر فازی سوگنو مرتبه صفر با تعدادی عمل کاندید برای هر قاعده جهت تولید فرمان های کنترل ربات در نظر گرفته شده است. هدف از آموزش تعیین عمل مناسب برای هر قاعده است. روش ترکیبی پیشنهاد شده دو مرحله دارد. در مرحله اول، داده آموزشی با حرکت ربات توسط ناظر در محیط جمع آوری می شود. سپس با بهره گیری از روش جدید ارائه شده، پارامترهای ارزشِ هر عمل کاندید در قواعد فازی با کمک داده‌های آموزشی مقدار دهی اولیه می‌شوند. در مرحله دوم از الگوریتم سارسای فازی برای تنظیم دقیق‌تر پارامترهای تالی کنترلگر بصورت برخط استفاده می شود. نتایج شبیه سازی در شبیه‌ساز KiKS برای ربات خپرا حاکی از بهبود قابل توجه در زمان یادگیری، تعداد شکست ها، و کیفیت حرکت ربات می‌باشد.

واژه‌های کلیدی: ناوبری ربات، یادگیری باناظر، یادگیری تقویتی، کنترلگر فازی.

متن کامل [PDF 487 kb] (7883 دریافت)

نوع مطالعه: پژوهشي | موضوع مقاله: تخصصي
دریافت: 1393/3/22 | پذیرش: 1393/3/22 | انتشار: 1393/3/22

ارسال پیام به نویسنده مسئول

بازنشر اطلاعات
	این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.

کلیه حقوق این وب سایت متعلق به مجله کنترل می باشد.

طراحی و برنامه نویسی : یکتاوب افزار شرق

Designed & Developed by : Yektaweb

پایگاه های مرتبط

کلمات کلیدی