Démarrer le module sur l'IA : 20' à 45'
4. IA et intégrité scientifique
Comment citer une IA ?
À titre d’exemple voici ce qu’en dit la revue Nature :
« Large Language Models (LLMs), such as ChatGPT, do not currently satisfy our authorship criteria. Notably an attribution of authorship carries with it accountability for the work, which cannot be effectively applied to LLMs. Use of an LLM should be properly documented in the Methods section (and if a Methods section is not available, in a suitable alternative part) of the manuscript. The use of an LLM (or other AI-tool) for “AI assisted copy editing” purposes does not need to be declared. In this context, we define the term "AI assisted copy editing" as AI-assisted improvements to human-generated texts for readability and style, and to ensure that the texts are free of errors in grammar, spelling, punctuation and tone. These AI-assisted improvements may include wording and formatting changes to the texts, but do not include generative editorial work and autonomous content creation. In all cases, there must be human accountability for the final version of the text and agreement from the authors that the edits reflect their original work. »
Artificial Intelligence (AI) | Nature Portfolio. [consulté le 6 mars 2025].
Une étude de 2023, s'appuyant sur le référentiel CrediT (Contributor Roles Taxonomy) a montré que l'IA ne pouvait répondre qu'à 3 des 14 fonctions de rédaction d'un article scientifique.
| CRediT function | ChatGPT |
|---|---|
| Conceptualization | Maybe |
| Data curation | Maybe |
| Formal analysis | Unable |
| Funding acquisition | Unable |
| Investigation | Unable |
| Methodology | Maybe |
| Project administration | Unable |
| Resources | Unable |
| Software | Maybe |
| Supervision | Unable |
| Validation | Unable |
| Visualization | Able |
| Writing—original draft | Able |
| Writing—review and editing | Able |
"We strongly recommend that AI outputs should not be cited as primary sources for backing up specific claims. [...] Authors and reviewers should be reminded to always read and verify the information they cite, as they are the responsible party for the information they present."
Recommandation on the Use of AI in Scholarly Communication. [Consulté le 25 mars 2026]
👉Renseignez-vous auprès de vos enseignants pour savoir si vous êtes autorisés à utiliser l’IA. Afin de faire preuve de transparence, il peut être judicieux de citer son usage, en suivant le même style de norme que celui utilisé pour la bibliographie, soit dans :
- La partie méthodologie
- Le corps de texte
- En note de bas de page
- Les remerciements
Vous pouvez, par exemple, référencer dans un tableau annexé toutes les fois où vous avez eu recours à l’IA, en reprenant la liste de l’ensemble des prompts et en reprécisant les parties du document qui sont concernées. Les IAG ne proposant pas de lien pérenne, vous ferez preuve de davantage de transparence en copiant les résultats des conversations. Par ailleurs, si vous avez utilisé un prompt et que quelqu’un interroge à nouveau une IA avec un prompt identique au vôtre, il trouvera une réponse qui ne sera pas strictement identique. En résumé, les résultats d’un prompt ne sont pas reproductibles car les IAG sont conçues pour générer du contenu inédit.
👉Voici une liste de recommandations pour citer l’usage d’une IA :
- Péron C. Ressources par disciplines et tutoriels: ChatGPT et autres IA: Comment citer les IA ? [consulté le 12 sept 2024].
- Université de Lorraine, Université de Strasbourg, Université de Haute Alsace, Bibliothèque nationale et universitaire de Strasbourg, & GTFU Alsace. (2024). L'intelligence artificielle et le bibliothécaire. Zenodo. [consulté 19 févr 2025].
- UNIGE. 2024. Guide : référencer le recours aux IA génératives dans vos travaux. [consulté le 19 févr 2025].
- APA.org. How to cite ChatGPT. [consulté 12 sept 2024].
- Perkovic I. McMaster LibGuides: How Do I Cite Generative AI?. Chicago. [consulté le 12 sept 2024].
- MLA Style Center. How do I cite generative AI in MLA style?. 2023 [consulté le 7 févr 2025].
IA et plagiat
L’Université Lyon 1 s’est dotée de Compilatio Magister +, logiciel capable de détecter du contenu similaire à d'autres sources mais aussi du contenu généré par l’IA. Voici ce qu'en dit la société qui le développe :
-👉Le détecteur d'IA Compilatio s'adapte-t-il aux avancées des IA ? Oui, le détecteur est régulièrement mis à jour.
-👉Compilatio Magister+ prouve-t-il l’usage d’une IA générative ? Le détecteur met en lumière des passages « suspects », potentiellement écrit à l’intelligence artificielle.
-👉Le détecteur d'IA Compilatio est-il fiable ?
- La précision (=la capacité du détecteur à se tromper) est estimée à 98,5% : sur 100 passages identifiés comme rédigés par une IA, entre 98 et 99 le sont bien, et les restants ont été écrits par des humains.
- Le rappel du détecteur (=sa capacité à n'oublier aucun passage rédigé par IA) est de 99% : sur 100 passages rédigés par IA, seul 1 n'a pas été trouvé).
- Son exactitude (=sa capacité à identifier correctement des passages écrits par des humains ou par IA) est de 99% : sur 100 passages, 99 ont été justement identifiés.
💡 Le saviez-vous ? En l’absence de prise de position unanime des instances nationales, certaines universités françaises ou étrangères ont pris position sur l’usage des IA génératives. C'est le cas de l'université d'👉Orléans, de 👉Bretagne-Occidentale, de 👉Genève ou encore de 👉Sherbrooke.
💡 Le saviez-vous ? L'usage par certains rédacteurs d'outils IA proposant du paraphrasage conduit à produire des textes artificiellement originaux, sans garantir leur fiabilité scientifique.
Cette pratique entraine l'apparition dans les publications scientifiques de ce que Guillaume Cabanac appelle des 👉"phrases torturées". Ce sont des reformulations où des termes scientifiques précis sont remplacés par des synonymes inadaptés ou incohérents (exemple : "péril de la poitrine" au lieu de "cancer du sein").
Évalués à la quantité et poussés par la course à la publication, certains chercheurs achètent même à des 👉paper mills des articles entiers créés ex nihilo par l'IA.
L'outil 👉Problematic Paper Screener (PPS) permet d'identifier ces articles suspects qui viennent polluer la science via des détecteurs d'articles :
- rétractés
- qui citent des articles problématiques
- qui contiennent des "phrases torturées"
- générés par des outils d'IA (SCIgen, Mathgen)
- présentant de fausses lignées cellulaires ou des fausses séquences nucléotiques
Les chercheurs sont ensuite invités à mettre ces articles suspects sur la plateforme de post peer reviewing 👉Pubpeer afin de les commenter, contribuant ainsi au travail de "dépollution" de la littérature scientifique.
IA et données personnelles
Au risque de perdre la main sur sa propriété intellectuelle, il est recommandé de ne pas fournir de données personnelles à l’IA qui va ensuite s’en servir pour s’entraîner. Il est préférable de ne transmettre à l’IA que des données qui relèvent du domaine public. C’est ce que recommande 👉l’Université d’Orléans dans sa charte.
💡 Le saviez-vous ? L’Europe a adopté un texte réglementant l’usage et la circulation des IA. Son nom : 👉l'EU AI Act. Il a commencé à entrer en vigueur en août 2024. Son but est d’« encadrer le développement, la mise sur le marché et l’utilisation de systèmes d’intelligence artificielle, qui peuvent poser des risques pour la santé la sécurité ou les droits fondamentaux », dixit la 👉CNIL. [consulté le 11 mars 2025].
L'AI Act s’applique aux entreprises ayant leur siège social dans l’UE, mais aussi à toute entreprise commercialisant son système dans l’UE.
🏆Participez au jeu AI Act Game, mis en place par Thomas le Goff (maître de conférences en droit et régulation du numérique) et familiarisez-vous avec.
Table des matières du module
-
4. IA et intégrité scientifique (vous êtes ici)