Please use this identifier to cite or link to this item:
http://hdl.handle.net/11452/12249
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.author | Bartın, Bekir Oğuz | - |
dc.date.accessioned | 2020-08-17T05:24:08Z | - |
dc.date.available | 2020-08-17T05:24:08Z | - |
dc.date.issued | 2017-08-01 | - |
dc.identifier.citation | Bartın, B. O. (2017). "Simulation of vehicles’ gap acceptance decisions using reinforcement learning". Uludağ Üniversitesi Mühendislik Fakültesi Dergisi, 22(2), 161-178. | tr_TR |
dc.identifier.issn | 2148-4147 | - |
dc.identifier.issn | 2148-4155 | - |
dc.identifier.uri | https://dergipark.org.tr/tr/download/article-file/343226 | - |
dc.identifier.uri | http://hdl.handle.net/11452/12249 | - |
dc.description.abstract | This paper presents the use of reinforcement learning approach for modeling vehicles' gap acceptance decisions at a stop-controlled intersection. The proposed formulation translates a simple gap acceptance decision into a reinforcement learning problem, assuming that drivers' ultimate objective in a traffic network is to optimize wait-time and safety. Using an off-the-shelf simulation tool, drivers are simulated without any notion of the outcome of their decisions. From multiple episodes of gap acceptance decisions, they learn from the outcome of their actions, i.e., wait-time and safety. A real-world traffic circle simulation network developed in Paramics simulation software is used to conduct experimental analyses. The results show that drivers' gap acceptance behavior in microscopic traffic simulation models can easily be validated with a high level of accuracy using Q-learning reinforcement-learning algorithm. | en_US |
dc.description.abstract | Bu çalışma pekiştirmeli öğrenme yöntemini kullanarak araçların kritik aralık kabul kararlarının basit bir T-kavşakta modellemesini sunmaktadır. Önerilen yaklaşım araçların ulaşım ağlarındaki nihai amaçlarının bekleme sürelerini ve risklerini optimize edeceklerini varsayarak basit bir kritik aralık kabul kararını pekiştirmeli öğrenme problemine çevirmektedir. Trafik simülasyon yazılımında sürücüler kararlarının yol açacağı sonuçları bilmeyerek hareket eder, fakat bir çok simülasyon episodu sonrasında eylemlerinin sonuçlarını bekleme süresi ve risk şeklinde öğrenmeye başlarlar. Gerçek bir dönel kavşağın Paramics trafik simülasyon modeli deneysel analizler için kullanılmıştır. Elde edilen sonuçlara göre kullanılan bu simülasyon modeli “Q-learning” öğrenme yöntemi kullanılınca sürücülerin kritik aralık kabul kararlarının doğrulaması kolaylıkla yapılabilmektedir. | tr_TR |
dc.language.iso | en | en |
dc.publisher | Uludağ Üniversitesi | tr_TR |
dc.rights | info:eu-repo/semantics/openAccess | en_US |
dc.rights | Atıf 4.0 Uluslararası | tr_TR |
dc.rights.uri | http://creativecommons.org/licenses/by/4.0/ | * |
dc.subject | Reinforcement learning | en_US |
dc.subject | Traffic simulation | en_US |
dc.subject | Gap acceptance | en_US |
dc.subject | Paramics | en_US |
dc.subject | Traffic circle | en_US |
dc.subject | Pekiştirmeli öğrenme | tr_TR |
dc.subject | Mikroskobik trafik simülasyonu | tr_TR |
dc.subject | Kritik aralık kabulu | tr_TR |
dc.subject | Paramics | en_US |
dc.subject | Dönel kavşak | tr_TR |
dc.title | Simulation of vehicles’ gap acceptance decisions using reinforcement learning | en_US |
dc.title.alternative | Araçların kritik aralık kabul kararlarının pekiştirmeli öğrenmeyle simülasyonu | tr_TR |
dc.type | Article | en_US |
dc.relation.publicationcategory | Makale - Uluslararası Hakemli Dergi | tr_TR |
dc.identifier.startpage | 161 | tr_TR |
dc.identifier.endpage | 178 | tr_TR |
dc.identifier.volume | 22 | tr_TR |
dc.identifier.issue | 2 | tr_TR |
dc.relation.journal | Uludağ Üniversitesi Mühendislik Dergisi / Uludağ University Journal of The Faculty of Engineering | tr_TR |
Appears in Collections: | 2017 Cilt 22 Sayı 2 |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
22_2_15.pdf | 1.13 MB | Adobe PDF | View/Open |
This item is licensed under a Creative Commons License