Train autonome : SystemX, SNCF, Alstom et Systra publient le premier jeu de données open source de référence
Ces images illustrent 6 types de feux de circulation ferroviaires français et leurs combinaisons de couleurs possibles (13 états), ainsi que les informations pertinentes concernant leur acquisition telles que la date, l’heure, les paramètres des capteurs et les cadres de délimitation. Issues de nombreuses sessions de roulage effectuées sur une même voie pendant deux ans, elles ont toutes été annotées manuellement.
« Dans le domaine du transport autonome, il existe de nombreuses initiatives de jeux de données open source relatifs aux voitures autonomes, mais beaucoup moins sur les modes de transport alternatifs tels que les trains. Avec ce dataset open source unique, la communauté scientifique bénéficie d’une source nouvelle et différenciante de données terrain pour tester ses algorithmes de deep learning, dédiés notamment à la classification d’images ou à la détection d’objets dans les images », explique Loïc Cantat, Responsable de l’équipe « IA, Datascience, Traitement du signal et de l’image » de l’IRT SystemX.
Ce dataset massif a été réalisé dans le cadre du projet TAS (Transport terrestre Autonome en Sécurité dans son environnement) dont l’enjeu était de définir l’état de l’art de l’automatisation des fontions d’observation d’un conducteur de matériel roulant. Ce projet de 2 ans qui s’est inscrit dans le programme Train Autonome de SNCF, voit ses travaux se poursuivre dans le cadre du projet DOS (Détection d’Obstacles et lecture de la Signalisation latérale) dont l’objectif est de proposer, d’ici à 3 ans, un prototype de système de détection des obstacles et de lecture de la signalisation latérale répondant aux exigences du train autonome, à la fois en termes de performance et de sécurité.
Le dataset FRsign (images et notebook) est accessible sur frsign.irt-systemx.fr