News Release 16-Jun-2026

Une équipe de recherche de l’Université Concordia met au point un système fondé sur l’IA permettant de mieux détecter les contenus toxiques en ligne

Le modèle a été conçu pour aider les personnes chargées de la modération à repérer et à supprimer plus rapidement les contenus préjudiciables qui circulent dans les médias sociaux

Peer-Reviewed Publication

Concordia University

Une équipe de recherche de l’Université Concordia a conçu une nouvelle méthode de détection des contenus toxiques en ligne fondée sur l’intelligence artificielle, qui est plus rapide et plus précise que les outils employés jusqu’ici. Le système vise à permettre aux plateformes de réseaux sociaux de bloquer efficacement les contenus jugés préjudiciables générés par les personnes utilisatrices.

Compte tenu du volume de contenu produit chaque seconde au cours d’une même journée, le repérage des éléments toxiques est une tâche qui nécessite d’importantes ressources informatiques et exige beaucoup de temps.

Baptisé « Proximal Policy Optimization-based Cascaded Inference System » (PPO-CIS), ce modèle réalise ses tâches d’analyse sur plusieurs niveaux. Un système de modération initial effectue une analyse rapide d’énormes quantités de contenu entrant afin de détecter le matériel préjudiciable. La plupart des messages filtrés sont jugés non toxiques, tandis que tout ce qui est considéré comme potentiellement préjudiciable est transféré vers un autre classificateur et fait l’objet d’une évaluation plus longue et plus précise. Tout contenu « douteux » restant est ensuite transmis à une modératrice ou un modérateur.

PPO-CIS intègre également plusieurs modèles de modération, ce qui permet d’optimiser leurs atouts respectifs tout en palliant leurs faiblesses. Selon Arezo Bodaghi, il s’agit du premier système de détection de la toxicité à appliquer cette méthode de cette manière.

Plus efficace que les autres méthodes

L’équipe de recherche a testé le système à l’aide de deux vastes ensembles de données de détection de la toxicité : leur propre ensemble « AugmenToxic » et l’ensemble « ToxiGen », largement utilisé. Comparativement à plusieurs autres méthodes de modération, PPO-CIS a repéré les contenus toxiques avec une précision supérieure de 2,1 %, et a nettement surpassé les méthodes comparables en termes de débit, traitant 384 échantillons par seconde contre environ 43 échantillons par seconde pour les modèles existants.

PPO-CIS a également surpassé CETRA, un système plus ancien d’apprentissage par renforcement initialement conçu pour la détection des logiciels malveillants.

Les membres de l’équipe estiment que la rapidité et la précision du système pourraient s’avérer particulièrement utiles pour les plateformes offertes dans des pays où les délais alloués pour la suppression des contenus préjudiciables sont très stricts.

L’étude a été publiée dans la revue Knowledge-Based Systems. Ont collaboré à sa rédaction Ketra Schmitt, professeure agrégée au Centre Génie et société de l’École de génie et d’informatique Gina-Cody, et Benjamin Fung de l’Université McGill.

L’étude a été subventionnée par le Conseil de recherches en sciences naturelles et en génie du Canada.

Lisez l’article cité : « PPO-CIS: A deep reinforcement learning framework for real-time toxicity detection in social media »

Journal

Knowledge-Based Systems

DOI

10.1016/j.knosys.2026.115704

Method of Research

Computational simulation/modeling

Subject of Research

People

Article Title

PPO-CIS : A deep reinforcement learning framework for real-time toxicity detection in social media

Article Publication Date

18-Mar-2026

COI Statement

We declare that we have no known competing financial interests or personal relationships that could have appeared to influence the work reported in this paper.

Disclaimer: AAAS and EurekAlert! are not responsible for the accuracy of news releases posted to EurekAlert! by contributing institutions or for the use of any information through the EurekAlert system.