مقالات پذیرفته شده                   برگشت به فهرست مقالات | برگشت به فهرست نسخه ها

XML English Abstract Print


1- دانشگاه صنعتی خواجه نصیرالدین طوسی
2- دانشگاه شهید بهشتی
چکیده:   (168 مشاهده)
امروزه، برای حل بسیاری از مسائل، از سیستم­های چندعاملی مشارکتی استفاده می­شود که در آن گروهی از عامل­ها برای رسیدن به یک هدف مشترک همکاری می‌کنند. همکاری میان عامل­ها، فوایدی همچون کاهش هزینه­های عملیاتی، مقیاس­پذیری بالا و سازگاری قابل‌توجه را به ارمغان خواهد آورد. برای آموزش این عامل­ها در رسیدن به یک سیاست بهینه، از یادگیری تقویتی بهره می­جویند. یادگیری در محیط­های چندعاملی مشارکتی پویا، غیرقطعی و با اندازه فضای حالت بزرگ به یک چالش بسیار مهم در برنامه­های کاربردی تبدیل‌شده است. ازجمله این چالش­ها می‌توان به تأثیر اندازه فضای حالت بر مدت زمان یادگیری و همچنین همکاری ناکارآمد میان عامل­ها و عدم وجود هماهنگی مناسب در تصمیم‌گیری عامل­ها اشاره کرد. همچنین هنگام استفاده از الگوریتم­های یادگیری تقویتی نیز با چالش­هایی نظیر دشواری تعیین هدف یادگیری مناسب و زمان طولانی همگرایی ناشی از یادگیری مبتنی بر آزمایش و خطا مواجه خواهیم بود. در این مقاله، با معرفی یک چارچوب ارتباطی برای سیستم­های چندعاملی مشارکتی، تلاش شده چالش­های فوق تا حدی برطرف شود. در راستای حل مشکلات مربوط به همگرایی، انتقال دانش به کار برده شده است که می‌تواند به شکل قابل‌توجهی در افزایش کارایی الگوریتم‌های یادگیری تقویتی موثر واقع شود. همکاری میان عامل‌ها با استفاده از عامل سرگروه و هماهنگی میان آنان توسط یک عامل هماهنگ‌کننده صورت می‌پذیرد. چارچوب پیشنهادی برای حل مسأله گله‌داری به کار رفته است و نتایج تجربی افزایش کارایی عامل‌ها را نشان می‌دهند.
     
نوع مطالعه: پژوهشي | موضوع مقاله: تخصصي
دریافت: ۱۳۹۷/۱۰/۳۰ | پذیرش: ۱۳۹۸/۱۰/۵

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA

ارسال پیام به نویسنده مسئول


کلیه حقوق این وب سایت متعلق به مجله کنترل می باشد.

طراحی و برنامه نویسی : یکتاوب افزار شرق

© 2020 All Rights Reserved | Journal of Control

Designed & Developed by : Yektaweb