1- دانشگاه یزد
چکیده: (30134 مشاهده)
: استفاده از یادگیری باناظر در ناوبری ربات های متحرک، با چالش های جدی از قبیل ناسازگاری و اختلال در داده ها، مشکل جمع آوری نمودن داده آموزش و خطای زیاد در داده های آموزشی مواجه می باشد. قابلیت های یادگیری تقویتی همچون عدم نیاز به داده آموزشی و آموزش تنها با استفاده از یک معیار اسکالر راندمان باعث کاربرد آن در ناوبری ربات شده است. از طرفی یادگیری تقویتی زمانبر بوده و دارای نرخ شکست های بالا در مرحله آموزش می باشد. در این مقاله، یک ایده جدید برای استفاده مؤثّر از هر دو الگوریتم یادگیری فوق ارائه میشود. یک کنترلگر فازی سوگنو مرتبه صفر با تعدادی عمل کاندید برای هر قاعده جهت تولید فرمان های کنترل ربات در نظر گرفته شده است. هدف از آموزش تعیین عمل مناسب برای هر قاعده است. روش ترکیبی پیشنهاد شده دو مرحله دارد. در مرحله اول، داده آموزشی با حرکت ربات توسط ناظر در محیط جمع آوری می شود. سپس با بهره گیری از روش جدید ارائه شده، پارامترهای ارزشِ هر عمل کاندید در قواعد فازی با کمک دادههای آموزشی مقدار دهی اولیه میشوند. در مرحله دوم از الگوریتم سارسای فازی برای تنظیم دقیقتر پارامترهای تالی کنترلگر بصورت برخط استفاده می شود. نتایج شبیه سازی در شبیهساز KiKS برای ربات خپرا حاکی از بهبود قابل توجه در زمان یادگیری، تعداد شکست ها، و کیفیت حرکت ربات میباشد.
نوع مطالعه:
پژوهشي |
موضوع مقاله:
تخصصي دریافت: 1393/3/22 | پذیرش: 1393/3/22 | انتشار: 1393/3/22