Du Big Data à l’Intérieur et à la Défense

Les policiers ne viendront plus chez vous par hasard. Avec le Big Data prédictif, les États-Unis expérimentent depuis quelques années de nouvelles méthodes de lutte contre la criminalité. En France, ces données massives de diverses sources permettent d’intégrer les informations en temps réel. Le Big Data ouvre une nouvelle ère pour les professionnels de la sécurité-défense.

Comme dans tous les domaines liés à la technologie, la fiction rattrape toujours la réalité. Dans la célèbre nouvelle Minority Report, de Philip K. Dick, des êtres humains mutants, baptisés les « précogs », prédisent les crimes à venir. Dans le monde réel, les hommes ont laissé aux logiciels, aux bases de données massives et aux algorithmes le soin d’anticiper le futur. L’approche prédictive, même si elle n’est pas encore généralisée, peut se révéler très utile pour les services de police ou l’armée, dans le domaine de la sécurité.

Dans le film Minority Report,de Steven Spielberg, l’adaptation cinématographique de la nouvelle de Philip K. Dick, des êtres humains mutants, les précogs, parviennent à prédire les crimes à venir grâce à leur don de prescience, c’est à dire, la connaissance anticipée des évènements à venir.

Dans le film Minority Report,de Steven Spielberg, l’adaptation cinématographique de la nouvelle de Philip K. Dick, des êtres humains mutants, les précogs, prédisent les crimes à venir grâce à leur « don de prescience », c’est à dire, la connaissance anticipée des évènements à venir.

Dans ce contexte, l’arrivée du Big Data ne chamboule pas du tout au tout ces avancées mais plutôt, les accélèrent, l’open data aidant à multiplier les sources. « Le Big Data tout comme le cloud, sont des techniques qui permettent d’approcher les données de façon parfois nouvelle », explique l’officier de gendarmerie Éric Freyssinet, spécialisé dans les nouvelles technologies et chef de la lutte contre la cybercriminalité au Pôle judiciaire de Rosny-sous-Bois. Puis, se voulant rassurant, il ajoute que « derrière le Big Data il ne faut pas voir la « collecte massive d’informations » ».

Des logiciels à la place des indics

POLICE-1-articleLargeBien réel, PredPol (pour « Predictive policing ») est un logiciel précurseur en la matière. Conçu aux États-Unis par un mathématicien, un anthropologue et un criminologue, son algorithme utilise les bases de données des infractions pénales, les données démographiques et d’autres types d’information afin de prédire quand et où les prochains crimes et délits ont la plus forte probabilité de se produire. Ainsi, les autorités peuvent disposer leurs hommes à intervenir dans ces zones géographiques, à un instant T, afin d’anticiper les crimes.

Du seul fait de leur présence, les autorités peuvent ainsi couper l’herbe sous le pied d’éventuels criminels ou délinquants.

1101111128_400Les premiers tests du logiciel PredPol ont été réalisés dès 2011, par la police de Santa Cruz, en Californie. La technologie est la même que celle utilisée pour prédire les séismes. Le système recense les données des infractions passées et les utilise grâce à un algorithme pour prédire l’avenir. Et cette formule mathématique, l’entreprise PredPol compte bien la garder secrète. En 2011, PredPol était classée dans le Top 50 des inventions de l’année, par le magazine Time. Il est depuis utilisé dans d’autres villes des États-Unis : Los Angeles, Memphis (Tennessee), Charleston (Caroline du Sud) et New York.

Sur son site, PredPol souligne les améliorations observées dans les services qui l’utilisent. Par exemple, au sein de l’une des divisions de la police de Los Angeles, le logiciel a été utilisé entre novembre 2011 et mai 2012 : les crimes ont alors baissé de 13 % dans les quatre mois qui ont suivi le déploiement du logiciel. Pour comparer, dans le reste de l’État qui n’a pas profité de cette technologie, les crimes ont augmenté de 0,4 %. « Au cours de cette période, cette division a été la chef de file dans la réduction des taux de criminalité parmi les autres divisions de Los Angeles. Des réductions similaires ont été observées dans d’autres villes ayant mis en place le même outil », explique l’entreprise qui développe ce service sur son site Internet.

Les cartes de l’avenir

En France, des discussions au sein du ministère de l’Intérieur sont en cours depuis quelques années, pour appliquer le Big Data prédictif à la criminalité. Des expérimentations se sont déroulées dans quatre grandes villes de France : Paris, Lille, Lyon et Marseille. Ces expériences ont abouti à un appel d’offres, publié prochainement, autour des technologies SIG (système d’information géographique). Cet appel d’offres laisse la porte ouverte au Big Data prédictif.

Cette approche va au-delà de la simple analyse statistique qui s’appuie sur des faits constatés, pas toujours exhaustifs, et qui ne permet pas forcément aux forces de police d’anticiper. La société Esri, inventeur et premier éditeur mondial de solutions SIG, a fait un constat simple : c’est toujours sur une carte que les responsables de la sécurité intérieure analysent et interprètent les évènements. Les professionnels de la sécurité (militaires, policiers, enquêteurs, publics ou privés) ont besoin de se représenter le « théâtre des opérations » en deux dimensions.

PredPol est un système développé aux Etats-Unis, basé sur des algorithmes. Sa mission est de prédire les crimes. Ce programme se présente sous la forme d’une carte, actualisée en permanence, qui existe en version mobile, pour smartphone et tablette. Les policiers se rendent alors sur les scènes de crimes… avant qu’ils ne soient commis.

Le programme PredPol se présente sous la forme d’une carte, actualisée en permanence, qui existe en version mobile, pour smartphone et tablette. Les policiers se rendent alors sur les scènes de crimes… avant qu’ils ne soient commis.

« Nos clients utilisent nos logiciels pour produire des cartes avec leurs données métier (équipements publics, voirie…) pour la défense : placer des unités, organiser la logistique, utiliser la cartographie embarquée, etc. » commence David Jonglez, responsable du Business Development chez Esri France, et ancien Directeur du Centre d’Excellence SIG de Capgemini. « Avec le Big Data prédictif, nous réfléchissons aux paramètres qui favorisent des typologies de crime », continue le responsable d’Esri France. Pour le vol à l’arrachée, par exemple, il faut identifier l’ensemble des paramètres qui identifient le crime : le lieu, l’heure… « Dans un deuxième temps, nous nous sourçons en données pour nourrir ces paramètres, soit grâce à l’open data (l’ouverture des données publiques), soit grâce aux données de la SNCF, pour avoir les flux urbains, par exemple. Là, nous sommes déjà dans le Big Data. »

Ces informations ainsi réunies sont ensuite rapprochées avec la géographie (comme les lieux publics) et des phénomènes passés. L’étape suivante, le « mashing learning » consiste à donner à manger à des algorithmes qui vont ensuite établir des modèles, qu’il sera possible de reparamétrer manuellement en fonction des besoins.

Ces modèles sont alors complétés avec les données en temps réel comme les mains courantes ou encore le trafic des lieux publics ou l’analyse sémantique des réseaux sociaux.

C’est par l’imbrication de ces analyses de données du passé et des informations opérationnelles en temps réel que les utilisateurs peuvent ainsi prédire les crimes et délits. Spécialiste des SIG, Esri y ajoute alors la brique géospatiale, pour aller encore plus loin. David Jonglez souligne toutefois l’un des effets pervers de ce type d’approche : « La délinquance diminue de x % mais elle ne fait que se déplacer d’un lieu physique à un autre, ou d’une typologie à une autre. » Ou comment diminuer les vols à un endroit peut augmenter les braquages ailleurs…

Cold Case

Eric Freyssinet

Eric Freyssinet

Au-delà de cette approche de «terrain», les outils permettant de stocker et de traiter des grandes quantités de données sont aussi utiles au niveau des enquêtes judiciaires : « Avant, avec les données d’une enquête, nous pouvions en extraire quelques champs d’information (lieu, personne, date, âge, type d’événement) mais c’était très précis, donc assez contraignant. Aujourd’hui, on peut imaginer intégrer l’intégralité d’un témoignage d’une personne, par exemple. Nos données sont plus exhaustives et nous avons une plus grande rapidité d’accès à ces informations », explique Éric Freysinnet. Le Big Data permet alors de croiser ces informations avec d’autres sources, comme de l’open data, par exemple : trafic, cadastre, planification d’un événement… « Nous pourrions reprendre d’anciennes enquêtes criminelles et utiliser ces nouvelles technologies  pour les résoudre ou les rapprocher entre elles », précise l’officier de gendarmerie.

Ces nouveaux outils techniques posent évidemment des questions financières, car il s’agit de mettre en place la solution la plus économique, et des questions sur le cadre juridique qui protège ces données : peut-on, par exemple, utiliser des données anonymisées ? Un projet baptisé Request, financé par le grand emprunt dans le cadre des Investissements d’Avenir, vise à encadrer les chercheurs qui développeront ces nouveaux outils et des plateformes d’expérimentation. Thalès est l’un des acteurs clés de Request, qui a été lancé en février dernier et s’étalera sur trois ans. Stocker, traiter mais aussi visualiser : en voulant traiter un grand nombre d’informations, sur un écran d’ordinateur, il faut aussi pouvoir les représenter de manière simplifiée. La visualisation, grâce au Big Data, sera l’un des enjeux de demain.

request2

La communauté informatique de l’Intérieur

Eric Pommereau

Eric Pommereau

L’idée de départ de la CIMI (Communauté Informatique au sein du Ministère de l’Intérieur) était de fédérer une communauté de personnes travaillant dans l’informatique, au sein du ministère de l’Intérieur. Éric Pommereau, ingénieur des SIC (Système d’information et de communication) à la Sécurité Intérieure et ancien policier, est l’un des cofondateurs de la CIMI : « Nous souhaitions permettre à toutes les personnes qui font de l’informatique de se sentir appartenir à un groupe, nous voulions fédérer cette communauté. Dans le quotidien, l’ingénieur de la préfecture ne rencontrerait jamais le responsable de la police. » La communauté a mis en place un « Wiki de la CIMI », un outil collaboratif permettant à tous les invités de publier de l’information, ainsi qu’un forum intranet. Elle organise aussi des « Midi Tech » : une réunion de deux heures sur une thématique précise. « Nous échangeons sur l’actualité du ministère ou sur des problèmes techniques, sur les outils. Au lieu de garder les sources pour soi, nous les mettons à disposition de tout le monde », finit Éric Pommereau.

Margaux Duquesne

Une enquête réalisée pour l’Informaticien du mois de juin 2014.

 

 

2 réflexions sur “Du Big Data à l’Intérieur et à la Défense

  1. Pingback: Le Big Data au service de la lutte contre la criminalité | bigdatafrance

  2. Pingback: Une communauté : la CIMI | Le blog d'Eric Pommereau

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s