Le renseignement d’origine sources ouvertes (ROSO) suscite de plus en plus d'intérêt. La raison en est qu’un volume considérable de données numériques est généré quotidiennement, que ce soit par les appareils informatiques, les capteurs de l'Internet des objets (IdO) ou les interactions des utilisateurs sur les plateformes sociales. Étant donné que la pratique du ROSO est financièrement rentable et peut apporter des renseignements d’une valeur précieuse, les agences gouvernementales et les organisations commerciales se sont empressées de l’adopter pour collecter et analyser des données publiques.
Cependant, comme pour toute technologie, le ROSO présente certains inconvénients et sa pratique soulève des difficultés. Les deux problèmes les plus évidents sont le volume prodigieux de données numériques accessibles et les ressources nécessaires (par exemple en temps et en savoir-faire) pour analyser les données recueillies. Heureusement, l’apparition de l'intelligence artificielle (IA) a permis de résoudre ces problèmes, et c'est sur ce point que nous allons nous concentrer dans cet article.
Comment la technologie de l'IA peut-elle être exploitée pour seconder la pratique du ROSO ?
L'IA peut considérablement renforcer les capacités des enquêteurs pratiquant le ROSO. En effet, les outils basés sur l’IA sont en mesure d’automatiser certaines tâches et d’analyser des volumes importants de données numériques — contenant à la fois des parties structurées et non structurées —. Ces outils peuvent découvrir des informations susceptibles d’échapper à des analystes humains. Voici les principaux apports que l'IA peut fournir aux enquêteurs pratiquant le ROSO :
Collecte de données
Pour mener à bien un projet de ROSO, la première tâche des enquêteurs consiste à collecter des données provenant de sources consultables par le public. Pour ce faire, ils suivent un plan préétabli. Nous n’allons pas discuter dans cet article des plans les plus suivis, mais la collecte des données exige un temps considérable pour les enquêteurs pratiquant le ROSO : ces professionnels doivent souvent couvrir de nombreuses ressources en ligne, selon leur projet d'enquête. La technologie de l'IA peut leur venir en aide grâce aux extracteurs intelligents de données en ligne : ces outils tirent parti de l'apprentissage automatique pour rechercher et sélectionner judicieusement des données en fonction des demandes saisies. Par exemple, les extracteurs de données en lignes alimentés par l'IA peuvent réaliser les tâches suivantes :
- Ils peuvent gérer le contenu dynamique aisément et sans intervention humaine. Par exemple, de nombreux sites Web utilisent JavaScript pour produire dynamiquement du contenu lorsque des utilisateurs se livrent à certaines actions. Les extracteurs de données alimentés par l'IA sont en mesure d’accéder à ce type de contenu et de le recueillir. Ils y parviennent en imitant le comportement de navigation des internautes humains.
- Ils peuvent contourner les mesures anti-extraction employées par certains sites Web. Dans cet objectif, ils recourent à des schémas de comportements adaptatifs et à des signatures de réseau changeantes.
- Ils peuvent corréler automatiquement des données provenant de sources multiples et établir des liens entre des informations apparemment sans rapport entre elles.
- Ils peuvent recueillir des données non structurées — comme du texte libre, des fichiers TXT ou du texte contenu dans des documents PDF — et, en fonction des demandes de leurs utilisateurs, ils peuvent insérer ces données dans des fichiers de certains formats, comme des tableurs Microsoft Excel.
- Ils peuvent extraire des données en suivant un calendrier préétabli et les actualiser quand les sources publient de nouvelles informations.
- Ils peuvent recourir à la technologie du traitement automatique du langage naturel (TALN) pour analyser le sentiment et le contexte qui sous-tendent les données recueillies, et ils peuvent classifier ces données en conséquence.
Traitement automatique du langage naturel (NLP)
Le TALN est une sous-branche de la technologie de l’IA. Il permet de comprendre des textes d’origine humaine. Les enquêteurs pratiquant le ROSO peuvent tirer parti du TALN pour mener à bien les actions suivantes :
- Analyser des textes pour en extraire les éléments clés, comme les noms de personnes, de lieux, de villes et de pays, les dates…
- Cartographier les relations entre les éléments désignés par leur nom dans les données recueillies, afin de montrer les liens qui existent entre les personnes, les organisations et les lieux mentionnés.
- Traduire du contenu d’une langue dans une autre, comme de l'arabe au chinois ou à l'anglais, pour permettre aux enquêteurs pratiquant le ROSO de prendre en compte des textes en langue étrangère dans leurs recherches.
- Résumer succinctement des textes volumineux, afin de fournir aux enquêteurs les informations les plus importantes.
La facilitation des analyses d’images et de vidéos
Au cours de leurs recherches, les enquêteurs pratiquant le ROSO doivent fréquemment analyser des fichiers multimédia, comme des images et des vidéos. Les outils basés sur l'IA peuvent faciliter et rationaliser ces analyses grâce aux capacités suivantes :
- Ils peuvent identifier automatiquement les objets présents dans les images et les vidéos. Les outils alimentés par l’IA sont en mesure de reconnaître des éléments comme les visages humains, les animaux, les bâtiments et d'autres. Il peuvent automatiquement extraire ces éléments des images et des vidéos qu’ils analysent.
- Ils peuvent extraire du texte présent dans des supports visuels complexes, y compris des documents manuscrits et des images de faible résolution, grâce aux capacités évoluées de reconnaissance optique de caractères (OCR) dont ils disposent.
- Ils peuvent procéder à des analyses exhaustives de métadonnées. Cette capacité leur permet d’extraire des informations dissimulées en rapport aux images qu’ils recueillent, au sujet notamment de la création de ces images, de leurs dates de modification et des coordonnées GPS qui y sont associées — dans la mesure où ces informations sont publiques.
- Lorsqu’il s’agit d’outils de reconnaissance faciale, les outils alimentés par l'IA peuvent analyser un grand nombre d'images et de vidéos pour en extraire le visage d'une personne déterminée.
- Ils peuvent vérifier les images et les vidéos qu’ils recueillent pour, entre autres, y détecter divers types de manipulation, sans se limiter à l’« hypertrucage ».
Le recueil de renseignements sur les médias sociaux
Les outils alimentés par l'IA sont en mesure de collecter et d’analyser de gros volumes de publications provenant des réseaux sociaux. Ils peuvent faciliter la pratique du ROSO en procédant aux tâches suivantes :
- La détection de profils comportementaux complexes couvrant de multiples plateformes sociales, afin de mettre en évidence des activités coordonnées.
- L’élaboration de cartes détaillées des relations qui se manifestent sur les réseaux, afin de comprendre les flux d'informations et de discerner les principaux influenceurs dans les communautés en ligne, comme les groupes Facebook et les sous-reddits.
- Détection et analyse des comptes de bots
- La détermination des tendances qui se dégagent des sujets discutés, des mots-dièse publiés et des conversations tenues, en couvrant un grand nombre de plateformes sociales.
Suivi des menaces
Lorsqu’il s’agit d’enquêter sur les menaces informatiques, les outils alimentés par l'IA sont devenus une composante cruciale de l'arsenal de ROSO, renforçant les capacités de cette méthode.
- La technologie de l'IA donne la possibilité d'analyser de vastes quantités de données sur les menaces, ce qui permet de déceler des régularités susceptibles de dénoter de nouveaux vecteurs ou de nouvelles techniques d'attaque.
- Les outils d'IA peuvent extraire automatiquement des indicateurs de compromission d’une diversité de sources, dont des flux sur les menaces, des réseaux sociaux et des forums du web clandestin. Ces indicateurs peuvent comprendre des adresses IP, des noms de domaine et des empreintes de fichiers.
- L'IA peut analyser des données historiques pour anticiper les menaces à venir.
- L'IA peut corréler des données issues de sources multiples pour déterminer la crédibilité et la gravité des menaces décelées. Ces sources peuvent comprendre des flux d’informations ciblées, les plateformes sociales, le web clandestin, les enregistrements d’événements effectués par les dispositifs de sécurité et ceux provenant des périphériques de mise en réseau.
Capacités de recherche améliorées
Lors de la pratique du ROSO, les outils de recherche alimentés par l'IA sont en mesure de comprendre les requêtes de recherche des enquêteurs en tenant compte du contexte de chacune. Grâce à cette capacité, les résultats obtenus sur les moteurs de recherche correspondent plus précisément aux requêtes. De plus, les dispositifs basés sur l'IA sont en mesure de naviguer sur des parties du web d’accès difficile, comme la toile profonde et les sites clandestins, et d’en extraire des données.
Des vérifications simplifiées et assistées, dont celles des faits
Quand des données sont recueillies, il est possible que certaines constituent de la désinformation ou soient erronées. Les enquêteurs pratiquant le ROSO ne peuvent pas incorporer de données à leurs enquêtes sans s’assurer qu’elles sont correctes et fiables. Lors de la phase de vérification des informations, les outils alimentés par l'IA ont leur utilité, notamment pour valider les faits. Par exemple, ces outils sont en mesure de vérifier les sources des données recueillies pour distinguer les sources fiables de celles qui ne le sont pas. Ils peuvent aussi procéder à des recherches en ligne pour comparer les données recueillies à celles publiées par des sources tierces, afin d’évaluer la véracité des informations récoltées.
Les analyses géospatiales
Parmi les avantages des outils alimentés par l'IA, l’un des plus importants concerne le traitement des fichiers de type image ou vidéo. Certains outils d’IA peuvent analyser ces documents en prenant en compte leurs métadonnées, ce qui permet de déterminer l’origine géographique du contenu. Par exemple, l’IA peut analyser des données géolocalisées couvrant plusieurs plateformes sociales, l’objectif pouvant être de faciliter le suivi de mouvements ou de déterminer dans quels endroits certaines activités sont concentrées. Les images prises par des satellites peuvent être automatiquement analysées pour détecter des changements — dans les terrains, l’infrastructure ou d'autres éléments.
Rapports automatisés
Pour les enquêteurs pratiquant le ROSO, les tâches de recueil de données se terminent toujours par la production d’un rapport. En faisant appel à la technologie de l'IA, il est possible de préparer et de produire de meilleurs rapports d’enquête lors des projets de ROSO, avec les principales découvertes intégrées à ces documents selon une structure. Par exemple, l'IA peut aider à élaborer des rapports bien articulés et complets pour présenter les données recueillies, en n’omettant ni les illustrations visuelles, ni les résumés.
La technologie de l'IA est en train de révolutionner la pratique du ROSO, car elle permet d’aplanir les plus grandes difficultés éprouvées au cours des enquêtes lors des phases de recherche et d’analyse, notamment quand des volumes considérables de données numériques sont à prendre en compte. Grâce à ses capacités de collecte intelligente de données, de traitement évolué du langage naturel et d’analyse automatisée de fichiers multimédia, l’IA apporte un potentiel étendu au ROSO. Les outils alimentés par l'IA sont très performants lorsqu’il s’agit de traiter du contenu prélevé sur des réseaux sociaux, de déceler des menaces présentes ou de réaliser des analyses géospatiales précises. Ces outils peuvent détecter des régularités complexes. Ils peuvent également extraire des informations essentielles de sources diverses et, de plus, ils sont en mesure de vérifier les données qu’ils recueillent en les comparant à des informations de référence. Pour finir, l’IA simplifie les processus d'enquête, d’une part en automatisant les tâches de production de rapports et, d’autre part, en améliorant l’efficacité des recherches en ligne — ces recherches pouvant couvrir la surface du web, la toile profonde et les sites clandestins. Les enquêteurs pratiquant le ROSO disposent donc d’une intégration technologique qui leur permet d’automatiser les processus manuels chronophages pour se concentrer sur les travaux d’analyse les plus productifs.

Rapport 2025 sur les ransomwares
Principales conclusions concernant l’expérience et l’impact des ransomwares sur les organisations du monde entier
S’abonner au blog de Barracuda.
Inscrivez-vous pour recevoir des informations sur les menaces, des commentaires sur le secteur et bien plus encore.

Sécurité des vulnérabilités gérée : correction plus rapide, risques réduits, conformité simplifiée
Découvrez à quel point il peut être facile de trouver les vulnérabilités que les cybercriminels cherchent à exploiter