Comment les universités d’aujourd’hui détectent les textes générés par l’IA ?
Avec la démocratisation de ChatGPT, Gemini, Claude ou encore Copilot, les établissements d’enseignement supérieur ont dû adapter leurs méthodes d’évaluation. Aujourd’hui, les universités ne se reposent plus uniquement sur leur expérience pédagogique : elles combinent des logiciels spécialisés, des analyses linguistiques et le regard critique des enseignants afin d’identifier les travaux susceptibles d’avoir été rédigés par une intelligence artificielle.
Contrairement à une idée largement répandue, aucun logiciel n’est capable d’affirmer avec une certitude absolue qu’un texte provient d’une IA. Les résultats correspondent à une probabilité, qui doit ensuite être interprétée par un enseignant. C’est précisément cette combinaison entre technologie et expertise humaine qui constitue aujourd’hui la méthode la plus fiable.
Les détecteurs d’IA : le premier niveau de vérification
La première étape consiste généralement à analyser les devoirs à l’aide d’un détecteur d’IA. De nombreuses universités utilisent aujourd’hui des plateformes intégrées à leur environnement pédagogique, capables d’examiner automatiquement des centaines, voire des milliers de copies en quelques minutes.
Ces outils ne recherchent pas seulement du plagiat. Ils tentent également d’estimer si le texte présente les caractéristiques habituelles d’une rédaction générée par une intelligence artificielle.
Parmi les solutions les plus répandues figurent :
- Turnitin AI Detection ;
- Compilatio Magister+ ;
- Copyleaks AI Detector ;
- GPTZero ;
- Winston AI (dans certains établissements) ;
- Originality.ai pour certaines formations privées.
Le fonctionnement repose sur des modèles statistiques capables d’étudier chaque phrase individuellement.
Les algorithmes analysent notamment :
- la structure grammaticale ;
- la longueur moyenne des phrases ;
- la diversité du vocabulaire ;
- la répétition de certaines tournures ;
- la cohérence globale du document ;
- les probabilités de succession des mots.
À l’issue de l’analyse, le logiciel attribue généralement un score ou un pourcentage indiquant la probabilité qu’une partie du document ait été produite par une intelligence artificielle.
📊 Que signifie réellement ce pourcentage ?
Contrairement à une idée reçue, un score élevé ne constitue pas une preuve définitive.
Voici comment ces résultats sont généralement interprétés.
| Résultat affiché | Interprétation habituelle |
| 0 à 20 % | Peu d’indices laissant penser à une rédaction assistée par IA |
| 20 à 50 % | Analyse complémentaire souvent nécessaire |
| 50 à 80 % | Plusieurs caractéristiques typiques d’un texte généré automatiquement |
| Plus de 80 % | Forte probabilité, nécessitant une vérification humaine approfondie |
Les établissements rappellent d’ailleurs que ces scores ne suffisent jamais à eux seuls pour sanctionner un étudiant.
A lire aussi: Un agent IA, c’est quoi ? Et pourquoi sa conception est plus complexe qu’on ne le pense
L’analyse linguistique : l’empreinte statistique laissée par les IA
Les détecteurs modernes vont beaucoup plus loin qu’une simple recherche de mots-clés.
Ils réalisent une véritable étude linguistique du document.
L’objectif consiste à déterminer si le texte possède les caractéristiques habituellement observées chez un auteur humain ou s’il présente une régularité excessive, souvent associée aux modèles d’intelligence artificielle.
Parmi les nombreux critères examinés figurent :
- la richesse lexicale ;
- la variété des constructions grammaticales ;
- le rythme des phrases ;
- la fréquence de certains connecteurs logiques ;
- la répétition de structures identiques ;
- la cohérence stylistique.
Deux indicateurs sont particulièrement utilisés.
🔹 La perplexité
La perplexité mesure le degré de prévisibilité d’un texte.
Un auteur humain alterne naturellement les formulations, introduit parfois des ruptures de style, des nuances ou des expressions inattendues.
À l’inverse, une IA tend souvent à produire des formulations très prévisibles et particulièrement régulières.
Plus la perplexité est faible, plus le texte paraît statistiquement « prévisible ».
🔹 Le burstiness
Le burstiness analyse les variations dans la longueur et la complexité des phrases.
Un étudiant alterne généralement :
- des phrases courtes ;
- des phrases longues ;
- des formulations plus spontanées ;
- quelques imperfections naturelles.
Les modèles d’IA produisent souvent un rythme beaucoup plus homogène.
Cette régularité constitue l’un des nombreux indices exploités par les logiciels.
Les références bibliographiques sont systématiquement vérifiées
L’un des moyens les plus efficaces de repérer un texte généré par une IA consiste à examiner les sources citées.
Les enseignants savent que certains modèles d’intelligence artificielle peuvent produire des références inexistantes, mélanger plusieurs ouvrages ou attribuer un article au mauvais auteur.
Ces erreurs sont appelées des « hallucinations ».
Pour cette raison, les correcteurs vérifient fréquemment :
- l’existence réelle des livres ;
- les DOI des articles scientifiques ;
- les noms des auteurs ;
- les dates de publication ;
- les numéros de revue ;
- les pages citées.
Une bibliographie contenant plusieurs références introuvables constitue un signal d’alerte particulièrement fort.
📋 Les anomalies les plus fréquemment rencontrées
| Vérification | Pourquoi est-elle importante ? |
| Auteur inexistant | Certaines IA inventent des chercheurs |
| Livre introuvable | Le titre n’a jamais été publié |
| DOI invalide | L’article scientifique n’existe pas |
| Citation erronée | Le contenu cité ne correspond pas à la source |
| Date incohérente | L’ouvrage n’était pas encore publié |
Les enseignants consultent désormais régulièrement des bases documentaires universitaires afin de contrôler rapidement ces éléments.
L’expérience des enseignants reste irremplaçable
Même avec les progrès des logiciels, le jugement pédagogique demeure indispensable.
Un enseignant connaît généralement :
- le niveau habituel de ses étudiants ;
- leur manière d’écrire ;
- leurs erreurs récurrentes ;
- leur vocabulaire ;
- leur façon d’argumenter.
Une évolution brutale du style peut rapidement attirer son attention.
Par exemple, un étudiant qui produit habituellement des textes simples mais remet soudain un devoir parfaitement structuré, très fluide et utilisant un vocabulaire particulièrement soutenu pourra susciter des vérifications complémentaires.
Les enseignants observent également plusieurs éléments.
Ils recherchent notamment :
- des formulations très génériques ;
- des transitions excessivement fluides ;
- une absence de prise de position personnelle ;
- des arguments très théoriques mais peu illustrés ;
- des exemples vagues ;
- un style étonnamment uniforme du début à la fin.
À l’inverse, un devoir contenant des raisonnements personnels, des analyses originales ou des références précises paraît souvent beaucoup plus authentique.
A voir également: Notre avis sur Saal Digital : qualité premium et finitions irréprochables
Les logiciels anti-plagiat complètent la détection de l’IA
Les universités continuent également d’utiliser les outils classiques de détection du plagiat.
Même lorsqu’un texte est rédigé avec une IA, certaines parties peuvent reprendre des formulations très proches de contenus déjà publiés.
Les plateformes spécialisées comparent alors le document avec :
- des millions de pages web ;
- des articles scientifiques ;
- des livres numérisés ;
- des mémoires universitaires ;
- des travaux remis par d’autres étudiants.
Cette double vérification permet de distinguer deux situations différentes :
- un texte généré automatiquement ;
- un texte directement copié depuis une source existante.
Les deux analyses sont souvent réalisées simultanément.
Pourquoi les détecteurs d’IA ne sont-ils pas fiables à 100 % ?
Malgré leurs progrès, les détecteurs d’intelligence artificielle restent imparfaits.
Ils peuvent produire :
- des faux positifs, en identifiant comme artificiel un texte entièrement rédigé par un humain ;
- des faux négatifs, en ne détectant pas un contenu pourtant généré par une IA puis largement retravaillé.
Plusieurs facteurs compliquent leur travail.
Par exemple :
- une forte reformulation du texte ;
- l’ajout d’exemples personnels ;
- des modifications importantes du vocabulaire ;
- plusieurs passages réécrits manuellement.
C’est pourquoi les établissements refusent généralement de fonder une décision disciplinaire uniquement sur un score fourni par un logiciel.
Une approche qui combine plusieurs méthodes
Aujourd’hui, les universités privilégient une démarche globale plutôt qu’un outil unique.
La procédure repose généralement sur plusieurs étapes successives.
| Étape | Objectif |
| Analyse IA | Repérer les caractéristiques statistiques d’un texte artificiel |
| Contrôle anti-plagiat | Détecter les ressemblances avec des contenus existants |
| Vérification des sources | Confirmer l’existence des références citées |
| Analyse du style | Comparer avec les productions habituelles de l’étudiant |
| Évaluation pédagogique | Interpréter l’ensemble des indices avant toute décision |
Cette approche permet de réduire les risques d’erreur tout en préservant l’équité entre les étudiants.
🎓 Pourquoi les universités ne se fient jamais à un seul détecteur ?
L’intelligence artificielle évolue extrêmement rapidement, tout comme les outils destinés à l’identifier. Un détecteur performant aujourd’hui pourra devenir moins efficace face aux prochaines générations de modèles de langage. C’est pourquoi les établissements d’enseignement supérieur privilégient une combinaison de technologies, de vérifications documentaires et d’analyses humaines.
En pratique, un logiciel peut signaler un texte comme potentiellement généré par une IA, mais ce résultat constitue seulement un indice parmi d’autres. La qualité des références bibliographiques, la cohérence de l’argumentation, les connaissances démontrées pendant les échanges avec l’enseignant et la comparaison avec les travaux précédents de l’étudiant restent des éléments essentiels. Cette approche croisée permet de limiter les erreurs d’interprétation tout en garantissant une évaluation plus juste de l’authenticité des travaux remis.