Nos équipes ont transmis leur expertise en analyse du mouvement humain afin de créer un système capable d’interpréter la dynamique corporelle sans recourir à l’identification des individus. L’IA devient ainsi un outil d’aide à la décision permettant d’anticiper les situations à risque avant leur escalade.
La plateforme Avertix constitue l’un des aboutissements majeurs de ces travaux menés sur plus de quatre années. Elle a pour mission de détecter en temps réel les comportements violents dans les stades et grands événements publics, tout en respectant strictement le cadre réglementaire européen. En s’appuyant exclusivement sur l’analyse du mouvement et non sur la reconnaissance faciale ou les données biométriques Avertix garantit une conformité RGPD par conception.
Notre approche repose sur la combinaison de techniques avancées de Deep Learning et de l’Analyse du Mouvement de Laban (LMA), un cadre théorique permettant de modéliser les qualités expressives du mouvement humain telles que la force, la directionnalité, le rythme et l’intention spatiale. Cette innovation méthodologique permet notamment de distinguer des comportements violents de situations visuellement similaires comme les célébrations sportives, là où les systèmes classiques atteignent leurs limites.
Ci-dessous, voici une synthèse de nos travaux développés en collaboration avec nos partenaires académiques et valorisés dans le cadre du programme d’héritage technologique des Jeux Olympiques de Paris 2024, pour lequel Avertix a été sélectionnée parmi les 12 lauréats BPI France.
1. Problématique et approche
Les grands événements publics nécessitent des dispositifs de sécurité capables d’identifier les signaux faibles précédant une escalade de violence. Or, les solutions actuelles de vidéosurveillance algorithmique présentent trois limites majeures : un taux élevé de faux positifs, une détection souvent trop tardive pour permettre une intervention préventive, et une incompatibilité fréquente avec le cadre réglementaire européen en raison de l’utilisation de données biométriques.
Avertix répond à ces contraintes en abandonnant totalement l’identification au profit d’une lecture comportementale centrée sur le mouvement. L’objectif n’est pas de reconnaître une personne, mais d’analyser des dynamiques d’interaction : accélérations brusques, changements de direction, augmentation de la force gestuelle, ou encore intrusion dans l’espace interpersonnel.
2. Pipeline algorithmique
L’algorithme Avertix repose sur une architecture innovante structurée autour de trois modules complémentaires permettant une analyse progressive des séquences vidéo.
Le premier module transforme les flux vidéo en représentations squelettiques préservant la vie privée par conception. Il extrait uniquement les points clés corporels sans aucun traitement facial. Les coordonnées sont ensuite normalisées afin de supprimer les effets d’échelle, d’orientation et de distance caméra, tout en stabilisant la représentation temporelle des mouvements.
Le second module est dédié à l’extraction de descripteurs comportementaux fondés sur l’Analyse du Mouvement de Laban. Il modélise les caractéristiques discriminantes du mouvement selon quatre dimensions :
Corps : patterns de coordination révélant une escalade gestuelle agressive ;
Effort : intensité, impulsivité et directionnalité associées aux comportements hostiles ;
Forme : expansion corporelle et postures de confrontation traduisant une intention territoriale ;
Espace : proximités conflictuelles et invasions de l’espace personnel constituant des indicateurs précoces de violence.
Le troisième module repose sur une architecture de Deep Learning de type MAE-Video (Masked Autoencoder for Video), spécialisée dans l’analyse temporelle du mouvement humain. Le réseau apprend à reconstruire le mouvement partiellement observé afin d’inférer le contexte comportemental et de distinguer violence réelle, mouvements de foule et comportements festifs.
L’ensemble est intégré dans un système de décision fonctionnant par fenêtre temporelle glissante, garantissant une surveillance continue et une mise à jour dynamique du niveau de risque.
3. Performances et déploiement
Les expérimentations démontrent la maturité opérationnelle de la solution, avec une précision de 92 % et un score F1 de 86 %, traduisant un équilibre robuste entre sensibilité et spécificité. La capacité d’inférence temps réel — inférieure à 100 millisecondes par séquence — permet le déclenchement d’alertes à faible latence compatibles avec une intervention préventive.
La plateforme Avertix se déploie sous forme d’application web cloud sécurisée, interopérable avec les infrastructures de vidéosurveillance existantes. L’interface opérateur permet une supervision multi-caméras en temps réel, l’affichage dynamique des probabilités de violence, des seuils d’alerte paramétrables ainsi que la conservation automatique des segments critiques pour l’analyse post-incident.