XXII veut appliquer la vision par ordinateur à tous les domaines

Nos articles Tech

Quand on pense au marché du "Computer Vision" (ou vision par ordinateur, c'est-à-dire toutes les technologies qui permettent à la machine d'analyser des images), les acteurs qui viennent immédiatement à l'esprit sont des mastodontes américains. Google, Microsoft, Intel, Texas Instruments ou encore Nvidia... autant d'entreprises qui ne laissent pas beaucoup de place aux challengers français. Pourtant, ils existent.

Créée en 2015 à Suresnes, XXII est une entreprise de conseil qui développe des solutions ad-hoc s'appuyant sur les technologies de Computer Vision. Avec un parti pris clair : rester transversal, ne pas se restreindre à un domaine d'application particulier. Retour avec William Eldin, co-fondateur et CEO, et Charlotte Moullin-Traffort, COO de XXII sur l'aventure de la Deep Tech qu'ils ont créée, des débuts en 2015 au premier cas d'usage pour la ville de demain, en passant par les convictions profondes qui animent cette équipe de 60 passionnés.

En 2020, l'expression "computer vision" figure en plein milieu de la courbe de Gartner sur l'IA. 

Le principe du "Cycle de la Hype" établi chaque année par l'entreprise de conseil américaine est simple : essayer de se figurer la maturité des technologies, leur degré de popularité (ou de "hype"), les attentes que l'industrie projette sur elles et l'horizon de temps auquel elles trouveront des applications.

A l'origine de XXII, une rupture cognitive

La manière dont William Eldin a saisi l'importance que les technologies de Computer Vision seraient amenées à avoir dans les prochaines années est nettement moins académique qu'une courbe dessinée par un grand cabinet de consulting. Nous sommes en 2015, et à l'époque, William Eldin est managing partner chez Coyote, l'entreprise qui aide les conducteurs à détecter les radars automobiles.

Au cours d'un projet, l'entrepreneur est amené à travailler sur la reconnaissance des panneaux de limitation de vitesse. "Il n'existait alors aucune base de données recensant ces panneaux", témoigne William Eldin. Aussi, la seule manière de capturer l'information était-elle de prendre ces panneaux en photo, et d'avoir ensuite recours à la vision par ordinateur. "La vision est le capteur majeur de l'être humain", avance William Eldin. Pressentant que la machine pourrait être capable de voir et d'analyser les images au même titre que l'être humain, le futur CEO de XXII est alors en proie à ce qu'il décrit comme une "rupture cognitive" majeure, comparable à ses yeux à la révolution que constituait la micro-informatique à la fin du XXème siècle.

Face à ce constat, et dans un contexte où Coyote avait des sujets légaux et par conséquent des difficultés à se développer rapidement, William Eldin revend ses parts en 2015 pour fonder avec ses associés l'entreprise XXII - du nom de son ancien groupe de musique. Les trois premières années sont itératives : l'équipe derrière XXII met au point la technologie et teste son marché. Le postulat qui guide les recherches est le suivant : la vision par ordinateur doit imiter le développement de l'intelligence humaine, pour être capable de s'adapter à une multiplicité de cas d'usage, avec un niveau de performance élevé. "Nous avons pris le temps nécessaire pour nous interroger sur ce que nous voulions faire de cette technologie", confie le CEO de XXII. En s'aidant du Professeur Berthoz, reconnu pour ses travaux sur le cerveau et les neurones, les équipes de XXII identifient les trois grands axes de développement de la perception chez l'enfant : la perception du statique, la perception du mouvement avec les émotions qui l'accompagnent, et la perception en 3D. L'organisation de XXII se structure ensuite selon ce modèle, avec une équipe dédiée à l'apprentissage des produits statiques, une autre à l'apprentissage des mouvements et à la reconnaissance de l'humain (via des gestes comme les caresses ou le sourire), et enfin une équipe qui travaille sur un réseau multi-caméra - afin que les algorithmes de XXII arrivent à prendre en compte plusieurs angles de vue en même temps.

Pour constituer l'équipe de chercheurs spécialisés dans leur domaine, XXII a fait appel dès l'origine à de jeunes docteurs financés à 100% par l'Etat. "A ma connaissance, il n'existe pas d'autre pays qui permette de pouvoir financer, via le CIR, autant de R&D", témoigne Charlotte Moullin-Traffort. "C'est grâce à des acteurs comme Neftys que la France peut faire progresser l'état de l'art de la recherche mondiale". Pour le CEO de XXII, la solution de préfinancement du CIR permet de "dégager du temps et de l'énergie", indispensables pour monter un projet entrepreneurial d'envergure.

Le parti pris de la transversalité

Une fois ces technologies mises au point, le champ d'application du Computer Vision est vaste. Si William Eldin et son équipe choisissent d'embrasser la transversalité dans leur sélection de projets, c'est d'abord parce que la technologie permet de le faire. "Prenez le cas d'usage du bagage abandonné en gare ; du point de vue technologique, la détection d'un bagage suspect est très proche du suivi d'une ligne d'assemblage dans une usine", explique William Eldin. La seconde raison a davantage trait à l'ADN de XXII : "Nous aimons la diversité, et trouvons passionnant de passer d'un projet à un autre", confie le CEO de XXII.

 

 

Les années 2018-2019 marquent le temps des premiers POCs (ou "preuves de concept"), dans trois domaines identifiés comme prioritaires par l'équipe : la sécurité, le retail et l'industrie. XXII travaille avec toutes les entreprises du CAC 40, et a développé son réseau bien au-delà de celui dont jouissait William chez Coyote. Le tout premier use case de XXII concerne la ville. "L'application urbaine à laquelle on pense souvent lorsqu'on évoque le Computer Vision, c'est la vidéo-surveillance - avec toutes les peurs et les fantasmes qu'elle suscite", reconnaît William Eldin. Pourtant, les applications sont en réalité plus nombreuses : comptage de voiture, sécurité routière (le CEO de XXII évoque notamment le cas de figure où un camion de livraison s'arrête sur la piste cyclable), ou encore contrôle du niveau de remplissage des poubelles et dimensionnement des dépôts destinés aux encombrants. La vision par ordinateur peut également servir à fluidifier et décongestionner le trafic - l'une des technologies d'IA développées par XXII aide à piloter le feu rouge intelligent, qui passe au vert lorsque la caméra intégrée au dispositif détecte le SAMU ou les pompiers.

La diversité des applications balaie jusqu'à la consommation d'énergie, avec un projet consistant à connecter les luminaires urbains pour les allumer en fonction de la présence ou non d'individus. "La vision par ordinateur peut faire des millards de choses", insiste William Eldin, qui cite comme exemples le fait de faire remonter des alertes en temps réels, d'identifier les malaises, les altercations entre individus ou encore les enfants perdus. "Loin des imaginaires liés à la surveillance des masses par la technologie, nous aspirons à faire en sorte que le centre de sécurité urbain (CSU) devienne un centre de supervision au service des citoyens". De ce point de vue, 2020 marque pour XXII le tournant du passage à l'échelle, avec la mise sur le marché d'un package d'algorithmes à destination des municipalités, pour que ces dernières puissent analyser ce qui se passe dans la ville.

La formation pour démystifier la vision par ordinateur


Impossible d'aborder les technologies de Computer Vision sans penser aux films futuristes qui en dépeignent les abus - à l'image de Minority Report, cité par William Eldin lui-même. Ce dernier nous met en garde : "Au lieu de diaboliser ces technologies, il faut plutôt les faire connaître au plus grand nombre pour mieux les apprivoiser". Partant de ce principe, le CEO de XXII a établi un volet de formation sur le sujet : outre la plateforme XXII learning qui dispense des formations spécialisées en technologies de vision, William Eldin donne des cours à Sciences Po. Il cite également la mise en place fin 2019 par le Comité national d'éthique (CCNE) d'un comité pilote d'éthique du numérique incluant le préfet, le délégué interministériel à l'IA, des philosophes et des spécialistes de l'IA, dont le but est d'arbitrer sur tous les sujets liés à l'Intelligence Artificielle. "Il ne faut pas oublier que le législateur fournit un cadre pour protéger les citoyens, que ce soit par le biais de la CNIL ou du RGPD", nous rassure William Eldin. En outre, il est pour le moment interdit de faire de la reconnaissance faciale ou biométrique en France. Selon le CEO, la vision par ordinateur n'est qu'un outil d'aide à la décision, mais c'est toujours l'être humain qui décide in fine de ce qu'il veut faire de ces technologies. "Le meilleur moyen de guider les technologies, c'est encore de les construire", déclare résolument William Eldin.