A0072 - RENFORCEMENT DE L’APPRENTISSAGE SÉCURITAIRE DE LA PRISE DE DÉCISION DE CHANGEMENT DE VOIE AVEC CONTRAINTE FONDÉE SUR LE RISQUE
SAFE REINFORCEMENT LEARNING OF LANE CHANGE DECISION MAKING WITH RISK-FUSED CONSTRAINT
22-11-2023
Zhuoren Li a obtenu son baccalauréat en génie aérospatial et mécanique appliquée à l’Université de Tongji, Shanghai, Chine, en 2019.
Le deep reinforcement learning (DRL) est devenu une méthode puissante pour la conduite autonome tout en manquant souvent de garanties de sécurité. Dans cet article, nous proposons un apprentissage de renforcement profond par contrainte à risque (RCDRL) avec réseau D3QN pour une prise de décision sûre lors des manœuvres de changement de voie. Le problème est formulé sous la forme d’un MDP (SCMDP), qui intègre un module de contrainte basé sur des règles et intégrant les risques. Nous faisons correspondre l’action de décision à la couche de trajectoire au moyen d’un planificateur de trajectoire basé sur une courbe polynomiale, qui est combiné avec les trajectoires prédites des véhicules environnants pour évaluer le risque futur et corriger l’action dangereuse. Pour étudier la pertinence de la décision, la politique du RCDRL est testée et validée sous différentes densités de trafic. En particulier, nous mettons en œuvre des tests de véhicules réels pour valider l’efficacité de la méthode proposée. Des essais de simulation et de véhicules réels ont démontré que la méthode RCDRL proposée permet d’obtenir de meilleures performances, en particulier dans les décisions sécuritaires. En outre, le cadre peut être étendu à d’autres réseaux DRL avancés.
Zhuoren Li
Prise de décisions, apprentissage par le renforcement, conduite sécuritaire et conduite autonome