<
Détail article

APPRENDRE À CHERCHER LE STATIONNEMENT COMME UN HUMAIN : UNE APPROCHE PROFONDE DE L’APPRENTISSAGE PAR RENFORCEMENT INVERSE

LEARNING TO SEARCH FOR PARKING LIKE A HUMAN : A DEEP INVERSE REINFORCEMENT LEARNING APPROACH

07-11-2024

Wang Shiyu+A0030

La prévalence des recherches de stationnement dans les rues des centres-villes urbains a entraîné d’importantes externalités telles que la congestion, la pollution et les collisions. La compréhension des subtilités du comportement de recherche de stationnement est cruciale pour élaborer des stratégies de gestion efficaces afin d’atténuer ces problèmes. La recherche de stationnement est intrinsèquement un processus décisionnel complexe et séquentiel, influencé par les diverses préférences des conducteurs et les environnements urbains dynamiques. Cette étude présente une approche profonde d’apprentissage par renforcement inverse (DIRL) pour modéliser le comportement de recherche de stationnement des conducteurs. Nous avons d’abord construit une plateforme de simulation de stationnement haute fidélité en utilisant Unity3D pour reproduire un réseau routier urbain, permettant la collecte de 987 trajectoires valides. Nous avons modélisé le processus de recherche de stationnement comme un processus de décision de Markov (MDP), avec des paires d’états-actions méticuleusement conçues pour une représentation précise. Ensuite, un modèle DIRL basé sur l’entropie maximale a été développé pour apprendre la fonction de récompense et les politiques de recherche de stationnement des conducteurs. Les résultats expérimentaux démontrent que le modèle DIRL à entropie maximale surpasse de manière significative le modèle traditionnel d’apprentissage par renforcement inverse à entropie maximale, Amélioration de 19,0 % dans la saisie précise des états finaux du stationnement et amélioration de 13,5 % dans la caractérisation des distributions globales de trajectoire. Enfin, nous avons intégré ces modèles formés dans des systèmes traditionnels de simulation de la circulation pour observer efficacement l’évolution de l’état du trafic avec différents comportements de recherche de stationnement, fournissant ainsi des informations précieuses pour optimiser les stratégies de gestion de la circulation urbaine.
Shiyu WANG

 
Document joint : Présentation Wang Shiyu    54 Mio