<?xml version="1.0" encoding="utf-8"?>
<journal>
<title>Journal of Control</title>
<title_fa>مجله کنترل</title_fa>
<short_title>JoC</short_title>
<subject>Engineering &amp; Technology</subject>
<web_url>http://joc.kntu.ac.ir</web_url>
<journal_hbi_system_id>1</journal_hbi_system_id>
<journal_hbi_system_user>admin</journal_hbi_system_user>
<journal_id_issn>2008-8345</journal_id_issn>
<journal_id_issn_online>2538-3752</journal_id_issn_online>
<journal_id_pii></journal_id_pii>
<journal_id_doi>10.61186/joc</journal_id_doi>
<journal_id_iranmedex></journal_id_iranmedex>
<journal_id_magiran></journal_id_magiran>
<journal_id_sid></journal_id_sid>
<journal_id_nlai></journal_id_nlai>
<journal_id_science></journal_id_science>
<language>fa</language>
<pubdate>
	<type>jalali</type>
	<year>1396</year>
	<month>6</month>
	<day>1</day>
</pubdate>
<pubdate>
	<type>gregorian</type>
	<year>2017</year>
	<month>9</month>
	<day>1</day>
</pubdate>
<volume>11</volume>
<number>2</number>
<publish_type>online</publish_type>
<publish_edition>1</publish_edition>
<article_type>fulltext</article_type>
<articleset>
	<article>


	<language>fa</language>
	<article_id_doi></article_id_doi>
	<title_fa>توسعه کنترلر هوشمند چراغ‌های راهنمایی بر پایه یادگیری تقویتی حالت پیوسته در محیط ترافیکی میکروسکوپیک</title_fa>
	<title>Developing Adaptive Traffic Signal Controller based on Continuous Reinforcment Learning in a Microscopic Traffic Environment</title>
	<subject_fa>تخصصي</subject_fa>
	<subject>Special</subject>
	<content_type_fa>پژوهشي</content_type_fa>
	<content_type>Research paper</content_type>
	<abstract_fa>&lt;div style=&quot;text-align: justify;&quot;&gt;افزایش روزافزون تعداد خودروها و در پی آن ترافیک&#8204;های سنگین شهری چالش بزرگی را برای کنترل بهینه ترافیک شهری برای مهندسین ایجاد کرده است. روش مناسب برای کنترل بهینه ترافیک هرچه باشد یقیناً باید وفق پذیر بوده تا بتواند ترافیک شهری را که دارای طبیعت پویا، پیچیده و تغییرپذیر است را به&#8204;خوبی مدیریت نماید. در این راستا تمرکز اصلی تحقیق حاضر کنترل هوشمند و توزیع یافته چراغ&#8204;های راهنمایی بر پایه یادگیری تقویتی است. کنترل هوشمند چراغ&#8204;های راهنمایی بر پایه یادگیری تقویتی نیاز به یادگیری و تصمیم&#8204;گیری در فضای حالت بزرگ (پیوسته) را دارد. همین امر باعث می&#8204;شود که روش&#8204;های رایج یادگیری تقویتی (حالت گسسته) برای چنین مسائلی (با فضای حالت بزرگ) به&#8204;خوبی قابل بسط نباشند. هدف تحقیق حاضر حل این چالش در مسئله کنترل ترافیک میکروسکوپیک است. در همین راستا نوآوری تحقیق حاضر را می&#8204;توان توسعه کنترلر هوشمند چراغ&#8204;های راهنمایی بر پایه یادگیری تقویتی حالت پیوسته برای حل چالش بزرگ بودن فضای حالت برشمرد. یادگیری تقویتی حالت پیوسته از شباهت سنجی حالات برای تخمین ارزش آن&#8204;ها استفاده می&#8204;کند. در این تحقیق به&#8204;منظور اعتبار سنجی، دو روش یادگیری Q و عملگر-نقاد حالت گسسته نیز پیاده&#8204;سازی و عملکرد آن&#8204;ها با روش پیشنهادی مقایسه شدند. نتایج نشان می&#8204;دهند که روش پیشنهادی منجر به کاهش 16% و 13% زمان سفر در مقایسه با دو روش عملگر-نقاد و یادگیری Q می&#8204;شود.&lt;/div&gt;
</abstract_fa>
	<abstract>&lt;div style=&quot;text-align: justify;&quot;&gt;The daily increase of a number of vehicles in big cities poses a serious challenge to efficient traffic control. The suitable approach for optimum traffic control should be adaptive in order to successfully content with the urban traffic that has the dynamic and complex nature. Within such a context, the major focus of this research is developing a method for adaptive and distributed traffic signal control based on reinforcement learning (RL). RL as a promising approach for generating, evaluating, and improving traffic signal decision-making solutions is beneficial and synergetic. RL-embedded traffic signal controller has the capability to learn through experience by dynamically interacting with the traffic environment in order to reach its goals. Traffic signal control often requires dealing with continuous state defined by means of continuous variables. Conventional RL methods do not scale well to problems with continuous state space or very large state space because they require storing distinct estimations of each state value in lookup tables. The contribution of the present research is developing adaptive traffic signal controllers based on continuous state RL for handling the big state space challenge arises in traffic control. The performance of the proposed method is compared with Q-learning and actor-critic and the results reveal that the proposed method outperforms others.&lt;/div&gt;
</abstract>
	<keyword_fa>: یادگیری تقویتی پیوسته, یادگیری Q, عملگر-نقاد, ناحیه بندی فضا و کنترل میکروسکوپیک ترافیک</keyword_fa>
	<keyword>Continuous State Reinforcement Learning, Q-Learning, Actor-Critic, Microscopic Traffic Control</keyword>
	<start_page>9</start_page>
	<end_page>21</end_page>
	<web_url>http://joc.kntu.ac.ir/browse.php?a_code=A-10-328-2&amp;slc_lang=fa&amp;sid=1</web_url>


<author_list>
	<author>
	<first_name>Mohammad</first_name>
	<middle_name></middle_name>
	<last_name>Aslani</last_name>
	<suffix></suffix>
	<first_name_fa>محمد</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>اصلانی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>maslani@mail.kntu.ac.ir</email>
	<code>10031947532846004054</code>
	<orcid>10031947532846004054</orcid>
	<coreauthor>Yes
</coreauthor>
	<affiliation>Faculty of Geodesy and Geomatics Eng. K.N.Toosi University of Technology</affiliation>
	<affiliation_fa>دانشگاه صنعتی خواجه نصیرالدین طوسی</affiliation_fa>
	 </author>


	<author>
	<first_name>Mohammad Saadi</first_name>
	<middle_name></middle_name>
	<last_name>Mesgari</last_name>
	<suffix></suffix>
	<first_name_fa>محمد سعدی</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>مسگری</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>mesgarii@kntu.ac.ir</email>
	<code>10031947532846004055</code>
	<orcid>10031947532846004055</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Faculty of Geodesy and Geomatics Eng. K.N.Toosi University of Technology</affiliation>
	<affiliation_fa>دانشگاه صنعتی خواجه نصیرالدین طوسی</affiliation_fa>
	 </author>


</author_list>


	</article>
</articleset>
</journal>
