Apprentissage Multi-Agent et Coordination avec le Clustered Deep Q-Network - Naver Labs Europe
preloder

Abstract

Ce travail présente une nouvelle approche multi-agent et multi-niveaux, nommée Clustered Deep Q-Network (CDQN), avec pour objectif de répondre aux problèmes de passage à l’échelle et de non-stationnarité dans un contexte d’apprentissage décentralisé.
Notre approche repose sur :
1) une gestion de chaque agent dans des clusters dynamiques avec une action jointe contrainte pour réduire la non-stationnarité;
2) l’attribution d’un score de confiance joint pour évaluer la contribution individuelle de chaque agent
et 3) la coordination d’agents indépendants exploitant l’apprentissage par renforcement profond multi-agent et la réutilisation d’expériences. L’approche est illustrée sur une politique urbaine de tarification des places de parking, dans la ville de Los Angeles.