<?xml version="1.0" encoding="utf-8"?>
<journal>
<title>Journal of Control</title>
<title_fa>مجله کنترل</title_fa>
<short_title>JoC</short_title>
<subject>Engineering &amp; Technology</subject>
<web_url>http://joc.kntu.ac.ir</web_url>
<journal_hbi_system_id>1</journal_hbi_system_id>
<journal_hbi_system_user>admin</journal_hbi_system_user>
<journal_id_issn>2008-8345</journal_id_issn>
<journal_id_issn_online>2538-3752</journal_id_issn_online>
<journal_id_pii></journal_id_pii>
<journal_id_doi>10.61186/joc</journal_id_doi>
<journal_id_iranmedex></journal_id_iranmedex>
<journal_id_magiran></journal_id_magiran>
<journal_id_sid></journal_id_sid>
<journal_id_nlai></journal_id_nlai>
<journal_id_science></journal_id_science>
<language>fa</language>
<pubdate>
	<type>jalali</type>
	<year>1402</year>
	<month>10</month>
	<day>1</day>
</pubdate>
<pubdate>
	<type>gregorian</type>
	<year>2024</year>
	<month>1</month>
	<day>1</day>
</pubdate>
<volume>17</volume>
<number>4</number>
<publish_type>online</publish_type>
<publish_edition>1</publish_edition>
<article_type>fulltext</article_type>
<articleset>
	<article>


	<language>fa</language>
	<article_id_doi></article_id_doi>
	<title_fa>کنترل بهینه تطبیقی برخط سیستم‌های دوخطی زمان پیوسته با دینامیک ناشناخته</title_fa>
	<title>An online policy iteration for adaptive optimal control of unknown bilinear systems</title>
	<subject_fa>تخصصي</subject_fa>
	<subject>Special</subject>
	<content_type_fa>پژوهشي</content_type_fa>
	<content_type>Research paper</content_type>
	<abstract_fa>&lt;div style=&quot;text-align: justify;&quot;&gt;طراحی کنترل&#8204;کننده&#8204;ی بهینه برای سیستم&#8204;های دوخطی زمان پیوسته با معلوم بودن دینامیک سیستم طبق اصل بهینگی بلمن پیچیدگی محاسباتی بالایی دارد و عموماً از روش&#8204;های تقریبی وابسته به دانستن دینامیک سیستم برای طراحی کنترل&#8204;کننده استفاده می شود.&#8204; هنگامی&#8204;که دینامیک سیستم نامعلوم است این مسئله بسیار پیچیده&#8204;تر می&#8204;شود. اولین چیزی که برای حل این مشکل به&amp;nbsp; نظر می&#8204;رسد شناسایی سیستم دوخطی به کمک روش&#8204;های شناسایی سیستم است. همان&#8204;طور که می&#8204;دانیم روش&#8204;های شناسایی مدلی خطی شده بر اساس داده&#8204;های ورودی&amp;nbsp; و خروجی سیستم در اختیار طراح قرار می&#8204;دهد تا به سراغ طراحی کنترل&#8204;کننده برود. در این مقاله &amp;nbsp;با استفاده از رویه&#8204;ای برخط و تطبیقی، یک روش تکراری جدید به&#8204;منظور طراحی کنترل&#8204;کننده بهینه برای یک سیستم دوخطی که دینامیک آن نامعلوم است پیشنهاد می&#8204;گردد. در روش تکرای پیشنهادی و به صورتی تطبیقی، به&#8204;جای دانستن دینامیک سیستم دوخطی با استفاده از اطلاعات برخط ورودی و اندازه&#8204;گیری حالت&#8204;ها، کنترل&#8204;کننده&#8204;ی بهینه طراحی می&#8204;گردد. همچنین با اعمال نویز به&#8204;منزله ورودی به سیستم در یک بازه&#8204;ی زمانی خاص، نیاز به&#8204; اندازه&#8204;گیری مجدد حالت&#8204;ها برای تکرارهای بعدی برطرف می&#8204;گردد. همگرایی روش تکراری تطبیقی به کنترل&#8204;کننده بهینه به&#8204;صورت قضیه ارائه و اثبات شده است. &amp;nbsp;&lt;/div&gt;</abstract_fa>
	<abstract>&lt;div style=&quot;text-align: justify;&quot;&gt;Bellman&amp;#39;s optimality principle states that designing an optimal controller for continuous-time bilinear systems with known system dynamics has a high computational complexity. As a result, controller design typically uses approximation techniques that depend on system dynamics knowledge. This problem will become more challenging when the system dynamics are unknown. Identifying the bilinear system dynamics through identification techniques is the first step toward overcoming this. It is well known that the identification methods give the designer a linear model to use in the controller design, based on the input and output data of the system. This paper proposes a new iterative method to design an optimal controller for a bilinear system whose dynamics are unknown, using an online adaptive policy iteration. In the proposed iterative method, instead of knowing the dynamics of the bilinear system, the optimal controller is designed by using the online input information and measurement of states. Also, by applying noise as an input for the system in a certain time interval, the need to measure the states for the next iterations is eliminated. The convergence of the adaptive iterative process to the optimal controller has been presented and proved in a theorem.&lt;/div&gt;</abstract>
	<keyword_fa>کنترل بهینه, سیستم‌های دوخطی, دینامیک ناشناخته, تطبیقی, سیاست تکرار.</keyword_fa>
	<keyword>Optimal control, Bilinear systems, Unknown dynamics, Adaptive policy iteration (PI)</keyword>
	<start_page>75</start_page>
	<end_page>87</end_page>
	<web_url>http://joc.kntu.ac.ir/browse.php?a_code=A-10-72-8&amp;slc_lang=fa&amp;sid=1</web_url>


<author_list>
	<author>
	<first_name>Seyyede Nafiseh</first_name>
	<middle_name></middle_name>
	<last_name>Manoochehri Rahbar</last_name>
	<suffix></suffix>
	<first_name_fa>سیده نفیسه</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>منوچهری رهبر</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>sn.manoochehri@gmail.com</email>
	<code>10031947532846009638</code>
	<orcid>10031947532846009638</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Department of Mathematics, Payame Noor University(PNU),P.O.Box19395-4697</affiliation>
	<affiliation_fa>گروه ریاضی ، دانشگاه پیام نور، ص.پ. 19395-4697، تهران ، ایران.</affiliation_fa>
	 </author>


	<author>
	<first_name>Naser</first_name>
	<middle_name></middle_name>
	<last_name>Pariz</last_name>
	<suffix></suffix>
	<first_name_fa>ناصر</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>پریز</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>n-pariz@um.ac.ir</email>
	<code>10031947532846009639</code>
	<orcid>10031947532846009639</orcid>
	<coreauthor>Yes
</coreauthor>
	<affiliation>professor Ferdowsi University of Mashhad</affiliation>
	<affiliation_fa>گروه مهندسی برق، دانشکده فنی و مهندسی، دانشگاه فردوسی مشهد،مشهد، ایران</affiliation_fa>
	 </author>


	<author>
	<first_name>Mohammad Reza</first_name>
	<middle_name></middle_name>
	<last_name>Ramezani-al</last_name>
	<suffix></suffix>
	<first_name_fa>محمد رضا</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>رمضانی آل</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>m-ramezani@qiet.ac.ir</email>
	<code>10031947532846009640</code>
	<orcid>10031947532846009640</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Department of Electrical Engineering, Quchan University of Technology</affiliation>
	<affiliation_fa>گروه مهندسی برق، دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی قوچان،قوچان، ایران</affiliation_fa>
	 </author>


	<author>
	<first_name>Aghileh</first_name>
	<middle_name></middle_name>
	<last_name>Heydari</last_name>
	<suffix></suffix>
	<first_name_fa>عقیله</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>حیدری</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>A_heidari@pnu.ac.ir</email>
	<code>10031947532846009641</code>
	<orcid>10031947532846009641</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Department of Mathematics, Payame Noor University(PNU),P.O.Box19395-4697</affiliation>
	<affiliation_fa>گروه ریاضی ، دانشگاه پیام نور، ص.پ. 19395-4697، تهران ، ایران.</affiliation_fa>
	 </author>


</author_list>


	</article>
</articleset>
</journal>
