L’IA au service du renseignement : le cas d’Earthcube

Votre société travaille à l’apex entre l’intelligence artificielle et le géospatial, un domaine en pleine expansion qui impose le traitement d’énormes volumes de données. Vos solutions sont-­elles déjà fonctionnelles ? Concrètement, que parvenez-­vous à faire et avec quel degré de confiance ?

Arnaud Guérin et Renaud Allioux : Cent vingt milliards d’euros par an : c’est le montant des dépenses mondiales pour l’acquisition de systèmes C4ISR (Communication, command & control, computers, intelligence, surveillance, reconnaissance) visant à apporter aux armées la supériorité informationnelle. La très vaste majorité de ce budget est destinée aux moyens matériels d’acquisition de données brutes pour le renseignement dans les domaines spatial, aérien, terrestre ou naval. En France, plusieurs programmes sont venus révolutionner les capacités C4ISR des forces et de la communauté du renseignement ou sont sur le point d’être mis en service : composante spatiale optique pour le ROIM (Renseignement d’origine image) spatial, Rafale Reco NG et avion léger de surveillance et de reconnaissance pour le ROIM aérien, Reaper et Patroller pour les drones, ou encore CERES et EPICURE pour le ROEM (Renseignement d’origine électromagnétique). On dispose aujourd’hui de 100 fois plus de données qu’il y a encore quelques années.

Auditionné en 2018 à l’Assemblée nationale, le général Ferlet, directeur du renseignement militaire, parlait d’un «  tsunami de données ». Il ajoutait : «  Nous sommes submergés par des données dont la masse croît de manière exponentielle. Il ne saurait être question d’y faire face en se contentant de demander des moyens supplémentaires en exploitants ou en analystes. Nous devons au contraire trouver des solutions plus innovantes, à base d’outils d’intelligence artificielle.  »

C’est dans ce contexte qu’Earthcube a développé depuis 2016 une solution logicielle permettant aux exploitants de valoriser 100 % des données collectées. Cette solution est en effet capable d’orienter les analystes en identifiant automatiquement les quelques pour cent de données nécessitant leur attention, car un évènement d’intérêt a été détecté. Pour cela, Earthcube s’appuie sur des standards OTAN tels que le STANAG 3596 pour le ROIM satellitaire et combine les forces de l’analyste qui définit les « patterns of life » qui l’intéressent et de l’intelligence artificielle qui va traiter massivement la donnée brute à la recherche de ces patterns. L’exploitant peut ainsi focaliser son attention sur l’analyse fine au lieu de perdre son temps à chercher l’aiguille dans la botte de foin.

Notre intelligence artificielle traite en effet 100 % du flux de données pour détecter les principaux objets d’intérêt défense (véhicules, blindés, avions, hélicoptères, navires, systèmes SAM/SSM…), identifier finement le modèle détecté et générer une alerte lorsqu’un pattern est identifié. Chaque image est donc analysée en quelques minutes au lieu de quelques heures ou jours. Il devient possible d’accroître considérablement la fréquence de surveillance. De plus, l’information extraite est capitalisée et l’exploitant dispose ainsi d’un contexte historique et régional sans précédent pour comprendre la situation observée.

Lauréat du défi organisé par la Direction du renseignement militaire en 2017 sur l’analyse massive de données satellites, Earthcube a depuis acquis plusieurs références prestigieuses à l’international, notamment à l’OTAN et plus récemment dans le cadre du programme européen PEONEER (Persistent earth observation for actionable intelligence surveillance and reconnaissance). Si nos clients restent très discrets, le commandant d’un centre de renseignement de l’OTAN où notre solution est déployée témoignait en janvier 2020, lors de la conférence Defense and GeoIntelligence à Londres, que son organisation était désormais capable de traiter 11 fois plus de données et que ses analystes étaient «  plus heureux et performants, car concentrés sur les tâches à haute valeur ajoutée  ». Développer une solution capable de gagner la confiance des opérationnels a nécessité de longues années de travail. Elle s’appuie à la fois sur une équipe de chercheurs à la pointe en Europe dans le domaine de l’intelligence artificielle et sur une compréhension fine des enjeux de nos clients pour répondre aux cas les plus complexes : ombres, occultations partielles, voile nuageux, neige…

Vous évoquez notamment la surveillance de sites, mais une des difficultés, en particulier depuis les années 1990, est l’utilisation de leurres de plus en plus sophistiqués par les acteurs. En quoi l’intelligence artificielle peut-elle aider à faire le tri entre leurres et systèmes d’intérêt et jusqu’à quel point peut-elle le faire ?

Les solutions d’intelligence artificielle ne peuvent inventer de l’information. Si un leurre peut tromper l’analyste, alors il trompera les meilleurs algorithmes. En revanche, les nouvelles générations de capteurs permettent de combiner différents signaux en complément de l’optique visible que notre œil est habitué à analyser. On peut notamment penser à des signaux réagissant aux caractéristiques physiques des objets tels que l’infrarouge, le radar, voire l’hyperspectral. Cette fusion, impossible à réaliser à l’œil nu, devient accessible pour les algorithmes. La fusion de signaux « multicapteurs » est au cœur de travaux que nous réalisons depuis fin 2019 dans le cadre du plan d’étude amont Man-Machine Teaming en amont du programme SCAF (Système de combat aérien du futur).

Au-delà du problème des leurres, les cas d’usage d’intelligence artificielle pour la défense sont parmi les plus complexes que l’on puisse imaginer. Tout d’abord, la frugalité : les algorithmes doivent en effet atteindre des niveaux particulièrement élevés de performance alors même que très peu d’exemples sont généralement mis à disposition des industriels compte tenu des enjeux de confidentialité. Ensuite, l’autonomie : les algorithmes doivent fonctionner au sein des installations des clients. Il est impossible de déployer des ressources pour corriger les éventuelles erreurs. Enfin, l’explicabilité : les exploitants peuvent accepter des erreurs si l’on sait précisément expliquer les limites du domaine d’application pour circonscrire l’utilisation du logiciel à des cas d’usage où la performance est garantie.

Si l’on entend de plus en plus souvent que les algorithmes deviennent une commodité et que la différence se fait sur les données d’entraînement, ce principe ne s’applique pas sur nos cas d’usage. Le domaine d’application dont les contraintes se rapprochent le plus de celles de la défense est probablement celui de l’imagerie médicale. Aucune solution sur étagère des GAFAM ou autre ne répond à des exigences aussi poussées. Il nous a donc fallu développer des algorithmes propriétaires qui trouvent peu d’équivalents aujourd’hui dans le monde.

En matière de machine learning, la qualité des données permettant de « nourrir » et d’« éduquer » le système est fondamentale : « garbage in, garbage out ». Comment vous positionnez-vous sur le recueil et le traitement de ces données ?

Le développement d’un algorithme d’intelligence artificielle doit être vu comme une chaîne d’opérations, de la production de la base d’apprentissage à l’algorithme lui-­même (conception de l’architecture, entraînement, validation, déploiement en production). La fiabilité de la chaîne n’est assurée que si chaque étape est parfaitement maîtrisée. La production d’une base d’apprentissage est elle-­même constituée de trois étapes.

La première consiste à sélectionner les zones d’intérêt et les images à faire annoter. Cette étape est critique pour assurer la capacité du logiciel à être performant dans n’importe quel contexte alors même que nos clients ne vont pas nous communiquer les régions ou sites qui les intéressent. Il faut pouvoir fonctionner quel que soit le contexte. Pour ce faire, si l’on prend l’exemple de notre détecteur d’avions, nous avons construit une base de données propriétaire de dizaines de milliers d’aéroports civils et de milliers d’aéroports militaires. Pour chaque aéroport, nous documentons son ordre de bataille (c’est-à‑dire les types de modèles présents) ainsi que les caractéristiques physiques du terrain (bitume, terre, herbe, neige…). Cela nous permet de construire une base à la fois générique, pour reconnaître tous les modèles dans tous les contextes, et équilibrée, pour ne pas introduire de biais qui pourrait venir d’une surreprésentation de certains types de modèles. Pour la deuxième étape, l’annotation proprement dite, de nombreux prestataires existent. Earthcube a choisi de travailler avec l’un des leaders du secteur, qui collabore avec de nombreuses start-up françaises et est reconnu pour sa qualité. Toutefois, le mode de travail a été adapté à nos enjeux bien spécifiques. Une équipe spécifique est formée par nos soins et nous faisons passer un examen à chacun de ses membres avant de l’autoriser à travailler. De plus, les opérateurs travaillent intégralement avec des outils web propriétaires développés par Earthcube. À aucun moment ils ne peuvent accéder aux informations des sites annotés ou à la donnée brute, ni exporter la donnée d’apprentissage. Impossible donc de copier notre propriété intellectuelle pour la communiquer à d’autres.

Enfin, troisième et dernière étape, toutes ces données d’apprentissage sont méthodiquement vérifiées. Des tests automatiques vont rechercher d’éventuelles incohérences (par exemple un avion américain sur un site russe) et une équipe d’experts au sein d’Earthcube réalise des tests par sondage pour s’assurer de la qualité des données produites. Aujourd’hui, moins de 1 % des données produites sont ainsi renvoyées pour défaut de qualité.

L’imagerie spatiale commerciale est en pleine expansion et de plus en plus d’États se dotent ainsi de capacités de renseignement qu’ils n’avaient, jusque-là, pas. Y rencontrez-vous un succès commercial ? Plus largement, vu la sensibilité de vos technologies, quelle est votre politique d’exportation ?

L’essor de l’imagerie spatiale commerciale profite à tous les pays. Même ceux dotés de moyens souverains tirent parti de la complémentarité avec les moyens commerciaux pour disposer de moyens de surveillance performants de manière compétitive. Aux États-Unis, le National Reconnaissance Office est par exemple sur le point d’étendre le programme d’acquisition d’images EnhancedView avec l’arrivée de la constellation Legion de Maxar ou encore les offres de Planet et Blacksky. De nombreux pays, dont la France, pourraient être tentés de faire de même avec le lancement en 2021 de la constellation Pleiades NEO d’Airbus. Ces satellites commerciaux ont une résolution moindre que les satellites souverains, mais suffisante pour de nombreux cas d’usage. Ils offrent donc une solution très économique et permettent d’augmenter significativement la fréquence de surveillance en multipliant les sources de données.

Dans notre boutique

ut Praesent Sed Lorem risus. neque. id Donec diam
Votre panier