<?xml version="1.0" encoding="utf-8"?>
<journal>
<title>Journal of Control</title>
<title_fa>مجله کنترل</title_fa>
<short_title>JoC</short_title>
<subject>Engineering &amp; Technology</subject>
<web_url>http://joc.kntu.ac.ir</web_url>
<journal_hbi_system_id>1</journal_hbi_system_id>
<journal_hbi_system_user>admin</journal_hbi_system_user>
<journal_id_issn>2008-8345</journal_id_issn>
<journal_id_issn_online>2538-3752</journal_id_issn_online>
<journal_id_pii></journal_id_pii>
<journal_id_doi>10.61186/joc</journal_id_doi>
<journal_id_iranmedex></journal_id_iranmedex>
<journal_id_magiran></journal_id_magiran>
<journal_id_sid></journal_id_sid>
<journal_id_nlai></journal_id_nlai>
<journal_id_science></journal_id_science>
<language>fa</language>
<pubdate>
	<type>jalali</type>
	<year>1402</year>
	<month>5</month>
	<day>1</day>
</pubdate>
<pubdate>
	<type>gregorian</type>
	<year>2023</year>
	<month>8</month>
	<day>1</day>
</pubdate>
<volume>0</volume>
<number>مقالات پذیرفته شده</number>
<publish_type>online</publish_type>
<publish_edition>1</publish_edition>
<article_type>fulltext</article_type>
<articleset>
	<article>


	<language>fa</language>
	<article_id_doi></article_id_doi>
	<title_fa>طراحی تنظیم‌گر خطی درجه دومِ پس‌خور خروجی برای سیستم‌های زمان گسسته‌ی دینامیک نامعلوم بر اساس بازسازی حالت‌ها و برنامه‌ریزی نیمه معین</title_fa>
	<title>Model-Free Synthesis of Output Feedback Linear Quadratic Regulators for Discrete-Time Systems with Unknown Dynamics via State Reconstruction and Semidefinite Programming</title>
	<subject_fa>عمومى</subject_fa>
	<subject>General</subject>
	<content_type_fa>پژوهشي</content_type_fa>
	<content_type>Research paper</content_type>
	<abstract_fa>&lt;span style=&quot;font-size:11pt&quot;&gt;&lt;span style=&quot;direction:rtl&quot;&gt;&lt;span style=&quot;unicode-bidi:embed&quot;&gt;&lt;span style=&quot;line-height:107%&quot;&gt;&lt;span style=&quot;font-family:Calibri,sans-serif&quot;&gt;&lt;span arial=&quot;&quot; lang=&quot;AR-SA&quot; style=&quot;font-family:&quot;&gt;در این مقاله یک روش جدید مستقل از مدل، غیر تکراری و تطبیقی برای طراحی برخط تنظیم&#8204;گر خطی درجه دوم زمان گسسته با پس&#8204;خور خروجی ارائه می&#8204;شود. پیش&#8204;تر، در ادبیات تحقیق، از روش&#8204;های یادگیری تقویتی برای حل این مسأله استفاده شده است. این روش&#8204;های تکراری نیازمند نمونه&#8204;برداری از تعداد نسبتاً زیادی داده&#8204;های ورودی و خروجی سیستم هستند که این امر هزینه&#8204;ی طراحی را نیز افزایش می&#8204;دهد. در این مقاله صرفاً با یک بار نمونه برداری از داده&#8204;های ورودی و خروجی در یک بازه&amp;not;ی زمانی بسیار کوتاه و با بازسازی حالت&#8204;ها به روش مستقل از مدل، روشی برای بازنویسی مسأله&#8204;ی تنظیم&#8204;گر خطی درجه دوم به صورت یک مسأله&#8204;ی برنامه&#8204;ریزی نیمه معین با قیود ناتساوی ماتریسی خطی، معرفی می&#8204;شود. همچنین در الگوریتم پیشنهادی با بهره&#8204;گیری از معادله&#8204;ی بلمن امکان باز طراحی کنترل کننده، برای تطبیق با تغییرات احتمالی در دینامیک سیستم فراهم می&#8204;گردد. در نهایت، شبیه&#8204;سازی&#8204;ها نشان می&#8204;دهند که الگوریتم پیشنهادی، در مقایسه با الگوریتم&#8204;های یادگیری &lt;/span&gt;Q&lt;span arial=&quot;&quot; lang=&quot;AR-SA&quot; style=&quot;font-family:&quot;&gt;، با تعداد داده بسیار کمتر و هزینه طراحی بسیار پایین&lt;/span&gt;&lt;span arial=&quot;&quot; dir=&quot;LTR&quot; lang=&quot;AR-SA&quot; style=&quot;font-family:&quot;&gt;&amp;lrm;&lt;/span&gt;&lt;span arial=&quot;&quot; lang=&quot;AR-SA&quot; style=&quot;font-family:&quot;&gt;تری قادر به حل مسأله است. همچنین، اجرای این الگوریتم برای یک سیستم با دو ورودی و از مرتبه چهار، کاربرد آن را در طراحی کنترل کننده برای سیستم&lt;/span&gt;&#8204;&lt;span arial=&quot;&quot; lang=&quot;AR-SA&quot; style=&quot;font-family:&quot;&gt;های پیچیده&lt;/span&gt;&#8204;&lt;span arial=&quot;&quot; lang=&quot;AR-SA&quot; style=&quot;font-family:&quot;&gt;تر نشان می&lt;/span&gt;&#8204;&lt;span arial=&quot;&quot; lang=&quot;AR-SA&quot; style=&quot;font-family:&quot;&gt;دهد.&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;br&gt;
&amp;nbsp;</abstract_fa>
	<abstract>&lt;span style=&quot;font-size:10pt&quot;&gt;&lt;span style=&quot;line-height:200%&quot;&gt;&lt;span new=&quot;&quot; roman=&quot;&quot; style=&quot;font-family:&quot; times=&quot;&quot;&gt;In this paper, we present a novel model-free, non-iterative, and adaptive approach for online design of a discrete-time linear quadratic regulator (LQR) with output feedback. Previously, reinforcement learning methods have been used to solve this problem. These iterative methods require sampling a relatively large number of input and output data from the system, which increases the design cost. In this paper, we introduce a method that reformulates the LQR problem as a semidefinite programming problem with linear matrix inequality constraints by sampling input and output data only once over a very short time interval and reconstructing the states using a model-free approach. Moreover, by utilizing the Bellman equation in the proposed algorithm, we enable the redesign of the controller to adapt to possible changes in system dynamics. Finally, through simulations, we demonstrate that our proposed algorithm can solve the problem with significantly fewer data samples and lower design costs compared to Q-learning algorithms. Additionally, by implementing this algorithm on a fourth-order two-input system, we illustrate its applicability to more complex systems.&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;br&gt;
&amp;nbsp;</abstract>
	<keyword_fa>تنظیم‌گر خطی درجه دوم, برنامه‌ریزی نیمه معین, کنترل کننده‌ی پس‌خور خروجی, یادگیری Q</keyword_fa>
	<keyword>Linear quadratic regulator, semidefinite programming, output feedback, Q-learning</keyword>
	<start_page>0</start_page>
	<end_page>0</end_page>
	<web_url>http://joc.kntu.ac.ir/browse.php?a_code=A-10-997-2&amp;slc_lang=fa&amp;sid=1</web_url>


<author_list>
	<author>
	<first_name>Ahmad</first_name>
	<middle_name></middle_name>
	<last_name>Akbari</last_name>
	<suffix></suffix>
	<first_name_fa>احمد</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>اکبری</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>a.akbari@sut.ac.ir</email>
	<code>100319475328460010074</code>
	<orcid>100319475328460010074</orcid>
	<coreauthor>Yes
</coreauthor>
	<affiliation>Sahand University of Technology</affiliation>
	<affiliation_fa>دانشگاه صنعتی تبریز (سهند)</affiliation_fa>
	 </author>


	<author>
	<first_name>Ahmad</first_name>
	<middle_name></middle_name>
	<last_name>Pishro Asl</last_name>
	<suffix></suffix>
	<first_name_fa>احمد</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>پیشرو اصل</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>a_pishro@sut.ac.ir</email>
	<code>100319475328460010075</code>
	<orcid>100319475328460010075</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Sahand University of Technology</affiliation>
	<affiliation_fa>دانشگاه صنعتی تبریز (سهند)،</affiliation_fa>
	 </author>


</author_list>


	</article>
</articleset>
</journal>
