Turnitin, entreprise américaine de renom spécialisée dans la détection de plagiat et proposant à ce titre un des meilleurs outils de détection du plagiat, propose depuis 2018 un outil intitulé « Authorship investigate » qui vise à s’assurer que l’auteur d’un écrit en est bien l’auteur, et ce grâce à un algorithme censé comparer l’écrit rendu par l’étudiant avec une base de donnée constituée d’écrits précédemment rendus par le même étudiant. Pour ce faire, l’outil va comparer le style rédactionnel en se focalisant sur la ponctuation, la grammaire pour vérifier si l’auteur est bien celui qui revendique l’être.
Pourquoi l’authorship investigate de Turnitin est une farce?
Si l’initiative commerciale répond avant tout à un besoin de certaines universités, il convient de relever plusieurs éléments qui confirment l’inutilité totale de cet outil.
Si l’outil de détection du plagiat, s’appuyant sur les sources internet et la base de données interne du logiciel fonctionne parfaitement et constitue un outil redoutable pour détecter le plagiat, il en est autrement pour le ce nouvel outil, et ce pour les raisons suivantes :
- Il est possible d’avoir faire relire, corriger son mémoire et d’avoir modifié la ponctuation habituellement utilisé, enrichi le vocabulaire employé en ayant travaillé sur des sources différentes, ou simplement parce que l’étudiant a été en meilleure forme ou plus inspiré pour rédigé son écrit parce qu’il avait plus de temps, ce qui serait susceptible de changer son style rédactionnel, la question qu’il convient de se poser serait donc de savoir quelle serait alors la pertinence d’un pourcentage de similitude mis en exergue par le logiciel ? la réponse est simple, aucune.
- Il est possible d’utiliser des outils en ligne de relecture, d’amélioration du contenu issu de l’intelligence artificielle, un simple correcteur accessible en ligne, que ce soit Word d’Office ou Antidote biaisera le résultat fourni par la technologie, quelle serait donc la valeur d’un pourcentage ou d’une probabilité fourni par l’outil ? Elle ne permettra pas de définir de manière dichotomique comme cela peut être pour le plagiat où le résultat pouvait être sans équivoque si l’auteur du manuscrit en est bien l’auteur.
Si l’étudiant affirme avoir fait relire son mémoire par une société spécialisée, avoir été en meilleure forme et simplement passionné par le sujet, ou bien parce que sa connaissance du sujet a été meilleure, plus technique, quelle preuve « l’authorship investigate » pourra t-elle apporter que l’étudiant n’a pas rédigé lui-même son mémoire ?
Tout simplement aucune, cela ne permettra pas de connaître l’auteur de l’écrit car de nombreuses variables ne sont pas intégrée par la technologie, et ses résultats auront donc une portée limitée.
Pour conclure, cette nouveauté contient de très nombreuses limites qui posent des doutes relativement importants quant à la fiabilité, la pertinence des résultats et des interprétations qui pourraient en être faites. Une conclusion est certaine, c’est qu’un algorithme ne pourra jamais prouver qui a rédigé quoi et dans quelle proportion, elle donnera tout au plus un indice qui ne constituera pas une preuve et ne permettra pas au jury de prendre une décision ou de s’y appuyer de manière fiable. Une simple relecture réalisée par une tierce personne, paradoxalement recommandée par les directeurs de mémoires, suffira à biaiser complètement le résultat fourni par la technologie de Turnitin.
L’avancée technologique majeure actuelle donne libre accès à l’information. Ainsi pour avoir accéder à un sujet donné, nul besoin de chercher loin : un ordinateur connecté au réseau, un moteur de recherche et un mot clé suffisent à suggérer plus de pages et de références que le lecteur lui-même ne peut visiter. On peut donc avoir n appréciations d’un même sujet, d’un même thème. L’accès à toutes ces sources étant facilité, cela donne libre cours au plagiat, à la triche et aux fraudes en tout genre. Tricher est devenue monnaie courante.
Consciente de ce fait, des spécialistes ont élaboré une technique « révolutionnaire » appelée Autorship investigate par Turnitin, un logiciel permettant de détecter le plagiat et la triche via le net. Cet outil est largement utilisé par les universités pour repérer les plagiats et les copie de travaux.
Pour analyser l’existence d’un plagiat : Authorship Investigate met l’accent sur 4 paramètres fondamentaux à savoir la lisibilité, la ponctuation, le vocabulaire et les changements de mise en page. Pour trouver les analogies de paramètre entre deux documents par exemple, Autorship Investigate utilise des algorithmes spécifiques. Ces algorithmes élaborés avec l’aide de linguistes et d’expert ne demeure toutefois pas infaillible.
Pour mesurer la lisibilité Authorship Investigate essaie de détecter la complexité des phrases d’un document. Si un document utilisant des phrases simples est comparé avec un document utilisant des phrases complexes, le plagiat ne pourra être décelé. Etant donné que Authorship Investigate analyse en même temps les données du genre date d’écriture : un texte de niveau Phd (élaboré en mois de décembre) ne peut selon les algorithmes être qualifié de plagiat d’un article de niveau école paru en janvier de la même année. Ce qui est un point en moins pour le logiciel.
Pour analyser la ponctuation, Authorship Investigate, essaie de déterminer la fréquence d’utilisation et le style de ponctuation utilisés dans les documents et essaie de déceler les analogies. Selon les concepteurs, la ponctuation est propre à chacun. Ce qui est faux, la ponctuation respecte les règles grammaticales utilisées dans une langue donnée. A chaque langue, sa ponctuation, son utilisation. Certes certains signent leur style en adoptant une ponctuation particulière, mais permettre et tolérer une utilisation personnelle des ponctuations tant bien même que cette utilisation ne respecte pas les règles préétablies est une insulte à la culture et à l’intellect même.
La vérification de vocabulaire est destinée à comprendre le style d’écriture d’un certain auteur. Selon les algorithmes, un auteur utilisera très probablement les mêmes mots pour chacun de ses écrits et l’utilisation de mots différents sera signaler comme tentative de plagiat et manipulation de documents d’autrui.
Vous ne pouvez pas prouver la paternité d’un texte en utilisant seulement 4 paramètres spécifiques. Moins il y a de paramètres à mettre en évidence, moins les résultats d’analyses sont précis. De plus, ces 4 paramètres ne sont pas non plus capables de prouver ou de réfuter la paternité du texte. Authorship Investigate et ses fonctionnalités n’arrêteront pas de tricher, mais accentueront la tendance à essayer de contrer les barrières.
Prenons exemple sur les universités
La majorité des « tricheurs» qui refusent de faire leurs papiers par eux-mêmes changent rarement leurs sources par souci d’authenticité . En d’autres termes, lorsqu’ils ces dits tricheurs font rédiger leurs articles par exemple, ils choisissent la même personne qu’ils ont commandés précédemment. Par conséquent, le rapport d’auteur (lisibilité, la ponctuation, le vocabulaire et les changements de mise en page) fournipar l’algorithme de TurnItIn sera inutile pour les personnes utilisant les services du même auteur.