<?xml version="1.0" encoding="utf-8"?>
<journal>
<title>Journal of Control</title>
<title_fa>مجله کنترل</title_fa>
<short_title>JoC</short_title>
<subject>Engineering &amp; Technology</subject>
<web_url>http://joc.kntu.ac.ir</web_url>
<journal_hbi_system_id>1</journal_hbi_system_id>
<journal_hbi_system_user>admin</journal_hbi_system_user>
<journal_id_issn>2008-8345</journal_id_issn>
<journal_id_issn_online>2538-3752</journal_id_issn_online>
<journal_id_pii></journal_id_pii>
<journal_id_doi>10.61186/joc</journal_id_doi>
<journal_id_iranmedex></journal_id_iranmedex>
<journal_id_magiran></journal_id_magiran>
<journal_id_sid></journal_id_sid>
<journal_id_nlai></journal_id_nlai>
<journal_id_science></journal_id_science>
<language>fa</language>
<pubdate>
	<type>jalali</type>
	<year>1397</year>
	<month>9</month>
	<day>1</day>
</pubdate>
<pubdate>
	<type>gregorian</type>
	<year>2018</year>
	<month>12</month>
	<day>1</day>
</pubdate>
<volume>12</volume>
<number>3</number>
<publish_type>online</publish_type>
<publish_edition>1</publish_edition>
<article_type>fulltext</article_type>
<articleset>
	<article>


	<language>fa</language>
	<article_id_doi></article_id_doi>
	<title_fa>همزمانسازی بهینه برخط سیستم های چندعاملی غیر خطی با دینامیک های نامعلوم </title_fa>
	<title>Online Optimal Synchronization of Nonlinear Multi-agent Systems under Unknown Dynamics</title>
	<subject_fa>تخصصي</subject_fa>
	<subject>Special</subject>
	<content_type_fa>پژوهشي</content_type_fa>
	<content_type>Research paper</content_type>
	<abstract_fa>&lt;p dir=&quot;RTL&quot; style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family:b zar;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;در این مقاله، الگوریتم بهینه توزیع شده تطبیقی برخط برای همزمانسازی عامل های غیرخطی یک سیستم چندعاملی با دینامیک های نامعلوم به عامل رهبر&amp;nbsp; بر اساس تکنیک های برنامه ریزی پویای تقریبی و شناساگرهای شبکه های عصبی ارایه شده&amp;rlm; است. الگوریتم پیشنهاد شده به یادگیری حل برخط معادلات همیلتون-جاکوبی تزویج شده&lt;a href=&quot;#_ftn1&quot; name=&quot;_ftnref1&quot; title=&quot;&quot;&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-family:calibri,sans-serif;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;[1]&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/a&gt;&lt;/span&gt;&lt;/span&gt; &lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;(CHJ)&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-family:b zar;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt; تحت دینامیک های نامعلوم پرداخته است. هر عامل جهت یادگیری سیاست بهینه محلی از ساختار عملگر-نقاد بهره برده و دینامیک نامعلوم هر عامل نیز با به کارگیری یک تقریبگر شبکه عصبی، تقریب زده شده است. شناسایی دینامیک های نامعلوم با استفاده از قانون تکرار تجربیات انجام شده است به طوری که از اطلاعات ثبت شده به همراه داده های لحظه ای برای انطباق وزن های شبکه عصبی شناساگر دینامیک عامل ها، استفاده شده است. در حالی که وزن های تقریبگرهای دینامیک و شبکه های عملگر-نقاد به صورت همزمان در حال انطباق هستند، کرانداری تمامی سیگنال های حلقه بسته توسط تئوری لیاپانوف تضمین شده است.&amp;nbsp; در انتها صحت الگوریتم پیشنهاد شده با ذکر نتایج شبیه سازی، نشان داده شده است&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-family:b zar;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;.&lt;/span&gt;&lt;/span&gt;&lt;span style=&quot;font-family:b zar;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;&lt;/span&gt;&lt;/span&gt;&lt;/p&gt;

&lt;div&gt;&amp;nbsp;
&lt;hr align=&quot;left&quot; size=&quot;1&quot; width=&quot;33%&quot; &gt;
&lt;div id=&quot;ftn1&quot; style=&quot;text-align: justify;&quot;&gt;&lt;a href=&quot;#_ftnref1&quot; name=&quot;_ftn1&quot; title=&quot;&quot;&gt;&lt;span style=&quot;font-family:times new roman,serif;&quot;&gt;&lt;span style=&quot;font-size:8.0pt;&quot;&gt;[1]&lt;/span&gt;&lt;/span&gt;&lt;/a&gt; Coupled Hamilton-Jacobi&lt;/div&gt;
&lt;/div&gt;
</abstract_fa>
	<abstract>&lt;p&gt;In this paper an online optimal distributed algorithm is introduced for multi-agent systems synchronization under unknown dynamics based on approximate dynamic programming and neural networks. Every agent has employed an actor-critic structure to learn its distributed optimal policy and the unknown dynamics of every agent is identified by employing a neural network approximator. The unknown dynamics are identified based on the experience replay technique where the recorded data and current data are used to adopt the approximators weights. The introduced algorithm learns the solution of coupled Hamilton-Jacobi equations under unknown dynamics in an online fashion. While the weights of the identifiers and actor-critic approximators are being tuned, the boundedness of the closed loop system signals are assured using Lyapunov theory. The effectiveness of the proposed algorithm is shown through the simulation results.&lt;/p&gt;
</abstract>
	<keyword_fa>برنامه ریزی پویای تقریبی, تقریبگرهای عملگر-نقاد, سیستم های چندعاملی, کنترل بهینه توزیع شده, همزمانسازی.</keyword_fa>
	<keyword>Actor-Critic Approximators, Approximate Dynamic Programming, Multi-Agent Systems, Optimal Distributed Control, Synchronization.</keyword>
	<start_page>13</start_page>
	<end_page>28</end_page>
	<web_url>http://joc.kntu.ac.ir/browse.php?a_code=A-10-178-2&amp;slc_lang=fa&amp;sid=1</web_url>


<author_list>
	<author>
	<first_name>Farzaneh</first_name>
	<middle_name></middle_name>
	<last_name>Tatari</last_name>
	<suffix></suffix>
	<first_name_fa>فرزانه</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>تاتاری</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>ftatari@semnan.ac.ir</email>
	<code>10031947532846005716</code>
	<orcid>10031947532846005716</orcid>
	<coreauthor>Yes
</coreauthor>
	<affiliation>Electrical engineering department, Electrical and Computer engineering faculty, Semnan university, Semnan, Iran</affiliation>
	<affiliation_fa>سمنان، دانشگاه سمنان، دانشکده مهندسی برق و کامپیوتر، گروه مهندسی برق</affiliation_fa>
	 </author>


	<author>
	<first_name>Mohammad-B.</first_name>
	<middle_name></middle_name>
	<last_name>Naghibi-S.</last_name>
	<suffix></suffix>
	<first_name_fa>محمدباقر</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>نقیبی سیستانی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>mb-naghibi@um.ac.ir</email>
	<code>10031947532846005717</code>
	<orcid>10031947532846005717</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Electrical Engineering Department, Ferdowsi University of Mashhad, Mashhad, Iran</affiliation>
	<affiliation_fa>مشهد، دانشگاه فردوسی مشهد، دانشکده مهندسی، گروه مهندسی برق</affiliation_fa>
	 </author>


</author_list>


	</article>
</articleset>
</journal>
