Avec la multiplication des plateformes accessibles permettant de générer rapidement des images – ainsi que d’autres types de contenu –, le personnel enseignant et les élèves se trouvent face à de nouvelles possibilités, qui s’accompagnent toutefois de responsabilités importantes.
Dans ce contexte, plusieurs questions méritent d’être soulevées : quels sont les enjeux associés à la création d’images par l’intelligence artificielle? Quelles pourraient être les retombées pédagogiques positives et la valeur ajoutée dans une perspective d’apprentissage? Et comment considérer les aspects légaux qui déterminent l’acceptabilité d’un tel usage?
L’article propose des pistes de réflexion ainsi que des outils pour accompagner cette démarche. En fin de lecture, un jeu a également été conçu pour aider les lecteurs à se positionner sur le sujet et à alimenter les discussions entre collègues.
Des enjeux bien réels
Si la génération d’une image ou d’une vidéo ne représente pas en soi une tâche complexe, il demeure toutefois bien plus difficile d’en saisir l’ensemble des enjeux sous-jacents. En les identifiant, le personnel enseignant amorce un parcours réflexif menant à la recherche d’une réelle plus-value pédagogique et à la conception d’un scénario d’apprentissage qui permet de la maximiser.
- L’enjeu environnemental
Source : https://huggingface.co/papers/2311.16863
Parmi l’ensemble des tâches pouvant être confiées à l’intelligence artificielle, la génération d’images et de vidéos serait l’une des plus énergivores. Les quantités massives de données requises pour produire ce type de contenu ne sont pas sans conséquences pour l’environnement. Tout usage a un coût, même lorsque celui-ci demeure invisible.
Certains éléments pertinents à considérer en lien avec cet enjeu sont présentés dans l’article Power Hungry Processing: Watts Driving the Cost of AI Deployment? (ALEXANDRA SASHA LUCCIONI and YACINE JERNITE, Hugging Face, Canada/USA EMMA STRUBELL, Carnegie Mellon University, Allen Institute for AI, USA) :
- La génération d’images consommerait en moyenne autant d’énergie que la recharge complète d’un téléphone portable, tandis que des tâches comme la classification de textes ou d’images en utilisent beaucoup moins.
- La résolution des images générées influence considérablement la consommation d’énergie. Les images en haute résolution (comme 4K) nécessitent plus de ressources que celles de basse résolution.
- Les modèles plus petits, tels que Tiny Stable Diffusion, produisent des images avec moins de coûts énergétiques, mais avec une qualité inférieure.
- L’utilisation d’un modèle spécialisé comme DALL·E directement à partir de sa plateforme pourrait réduire l’impact environnemental par rapport à l’utilisation du même modèle intégré à un agent généraliste comme ChatGPT.
- Pour des modèles « du texte à l’image », la longueur et la complexité des descriptions influencent directement les ressources nécessaires pour produire une image.
La capacité à choisir judicieusement un outil et à formuler de manière plus précise une requête de génération pourrait contribuer à réduire l’empreinte énergétique liée à ce type de demande.
- L’enjeu éthique
Les biais algorithmiques présents dans les réponses générées par les différents modèles d’intelligence artificielle devraient susciter une vigilance accrue quant aux fausses représentations qu’ils peuvent véhiculer. En fonction du contexte, certains groupes sociaux peuvent être négligés, surreprésentés ou sous-représentés dans les contenus générés. Par exemple, il n’est pas rare que des images produites par IA associent systématiquement les hommes à des tâches manuelles, tandis que les femmes sont cantonnées à des activités liées à l’entretien domestique.
Un tel biais de représentation contribue à une vision déformée de la réalité sociale, en imposant une lecture stéréotypée et simplifiée du monde. Il a aussi pour effet d’invisibiliser certaines populations, laissant croire qu’une seule réalité serait valable dans le contexte généré. Un exemple illustratif de ce phénomène est présenté ci-dessous.
Source : ChatGPT, images générées le 18 mars 2024. Requête utilisée : génère-moi une personne travaillant dans l’industrie automobile sur une chaîne de montage.
Quatre exemples, quatre représentations distinctes d’un homme travaillant sur une chaîne de montage automobile. Pourtant, il est bien connu que des femmes occupent également ce type de poste. Ces images illustrent ainsi un biais de représentation, où la réalité de la diversité présente dans ce milieu de travail est effacée au profit d’une vision stéréotypée.
Envie de prolonger vous-même cette expérience? Il suffit de demander à un modèle d’intelligence artificielle de générer les images suivantes :
- L’image d’une famille.
- L’image d’un jeune qui écoute de la musique rap.
- L’image d’un scientifique.
Une fois les images obtenues, il est pertinent d’observer les représentations proposées. Reflètent-elles une vision stéréotypée de la réalité? Passent-elles sous silence la diversité qui caractérise nos sociétés?
Les biais véhiculés par l’intelligence artificielle ne constituent pas le seul enjeu éthique à prendre en compte. La question de la censure, qu’elle soit manifeste ou non, représente également un point d’attention majeur. Il est essentiel de se demander si l’intention derrière une requête respecte les conditions d’utilisation de la plateforme utilisée. Dans le cas contraire, une demande pourrait être refusée, révélant ainsi une autre dimension de l’éthique : celle imposée par l’outil, qui peut différer des repères éthiques que l’utilisateur souhaiterait appliquer.
Il faut garder à l’esprit qu’une plateforme peut juger une requête comme étant contraire à ses principes internes, même si celle-ci respecte l’ensemble des cadres juridiques en vigueur dans un territoire donné. Par exemple, une tentative de générer une image représentant l’une des trois grandes religions monothéistes à l’aide de ChatGPT s’est soldée par un refus de l’agent conversationnel.
Ce type de situation soulève une question fondamentale : « Est-ce parce qu’on le peut qu’on doit le faire? » À l’inverse, le modèle d’intelligence artificielle Grok, développé par Elon Musk, illustre une approche différente en matière d’encadrement éthique. Moins contraignant et plus permissif dans la génération de contenus sensibles ou controversés, ce modèle ouvre la voie à des usages qui, bien que techniquement réalisables, posent des enjeux éthiques importants. Il reflète une volonté d’élargir les limites de la génération de contenu, au risque de relâcher certains garde-fous pourtant jugés essentiels.
Pour en savoir plus au sujet de Grok, nous vous recommandons cette vidéo d’ARTE :
La notion de consentement dans le cadre de la génération de contenus ne doit pas être négligée. Il est essentiel de faire preuve d’un minimum d’empathie en se mettant à la place des personnes représentées, afin d’évaluer l’impact que cela pourrait avoir sur elles – y compris lorsqu’il s’agit de personnalités publiques.
Enfin, il est important de conclure cet enjeu éthique en soulignant le risque de détournement des contenus générés à des fins de désinformation. Même si une image ou un texte est produit dans un cadre bienveillant ou pédagogique, rien ne garantit qu’il ne sera pas réutilisé par d’autres – élèves ou utilisateurs – dans un tout autre contexte. Une image générée, sortie de son cadre initial, peut facilement devenir un outil de manipulation ou de diffusion de fausses informations.
La responsabilité de l’utilisateur face aux contenus générés
Lorsqu’un contenu est généré par une intelligence artificielle, il serait trompeur de croire que la responsabilité de l’utilisateur n’est pas engagée. Même si l’outil effectue la production, la demande initiale — la requête — provient bien de l’utilisateur. C’est pourquoi cette dimension mérite une attention particulière.
Certains outils permettent d’intégrer des images ou des vidéos pour initier la génération. Ce processus peut, volontairement ou non, inclure des données personnelles telles que des visages, des noms ou des lieux identifiables. Dans un cadre éducatif, une vigilance accrue est donc nécessaire, notamment pour les enseignants, afin d’éviter l’envoi involontaire d’informations sensibles à la plateforme.
De plus, si l’exercice de génération d’images par les élèves peut représenter une activité pédagogique intéressante, il convient de rappeler qu’une plateforme nécessitant une connexion peut également collecter certaines données des utilisateurs, y compris des mineurs. Cette réalité appelle à une attention particulière dans le choix des outils et dans la manière dont ils sont utilisés.
De la capacité à faire… à la légitimité d’agir
Un autre enjeu légal concerne le respect des droits d’auteur associés à certaines générations de contenus. Si plusieurs plateformes ou modèles d’IA restreignent certains types de génération en fonction de leur politique d’usage, d’autres offrent une plus grande liberté, exposant ainsi les utilisateurs à des zones juridiques moins encadrées.
Par exemple, la dernière mise à jour de ChatGPT permet désormais de générer des images dans un style évoquant celui des studios Ghibli. Or, à ce jour, le style artistique en tant que tel ne bénéficie pas de la même protection légale qu’une œuvre spécifique. Il s’agit donc d’une « zone grise » du droit d’auteur. Sur ce point, cet article de Numerama revient de manière approfondie sur la question.
Cet enjeu juridique soulève également une dimension morale : est-ce parce que l’on en a la capacité technique que l’on doit nécessairement en faire usage? La réflexion sur l’utilisation responsable de ces outils ne peut être dissociée du cadre légal.
Dans l’attente d’une décision de justice claire, il revient à chaque utilisateur ou encadrant d’évaluer les avantages et les risques associés à ces pratiques. Pour les y aider, un outil de positionnement est proposé plus loin dans cet article, afin de mieux cerner la plus-value – ou non – d’une génération d’image dans un contexte donné.
Activités pédagogiques et génération d’images : reculer ou s’engager prudemment?
Face à la diversité des enjeux soulevés, faut-il pour autant renoncer à intégrer une activité incluant la génération d’images ou de vidéos en contexte éducatif? La réponse ne peut être que nuancée. Comme évoqué précédemment, se positionner sur la plus-value réelle d’un tel usage constitue une étape essentielle dans la préparation de toute activité pédagogique impliquant l’intelligence artificielle.
Si cette réflexion s’avère concluante, elle peut ouvrir la voie à des projets innovants, à condition de tenir compte des précautions nécessaires évoquées plus haut. Certaines initiatives témoignent d’un usage réfléchi et porteur. C’est le cas, par exemple, d’un projet récemment mené par Charles Bucher, un enseignant belge en enseignement spécialisé.
Ce dernier a su identifier une réelle plus-value dans l’usage de la génération d’images : éduquer ses élèves aux nouvelles technologies tout en les amenant à questionner leur impact. L’activité permettait aussi de renforcer la communication et la confiance en soi des élèves, tout en ancrant les contenus générés dans une recherche plus large menée en classe. Il s’agissait ainsi de croiser compétences numériques, esprit critique et objectifs pédagogiques concrets.
Les idées d’activités pédagogiques intégrant la génération de contenus sont nombreuses et en constante évolution. Elles dépassent largement le cadre de cet article. Toutefois, pour celles et ceux qui souhaiteraient explorer ces pistes plus concrètement, voici un robot conversationnel qui permet de générer des suggestions d’activités adaptées à différents contextes pédagogiques :
L’objectif de ce robot : Aider les enseignants à créer des activités pédagogiques en intégrant la génération d’images ou de vidéos par IA 🎨🤖
La génération d’images dont vous êtes le héros!
Face à ces divers enjeux, la réflexion menée par l’enseignant en amont du processus de génération constitue un élément incontournable. Cette étape préparatoire vise notamment à mieux évaluer, à la lumière des informations disponibles, s’il est pertinent ou non de recourir à la génération d’une image ou d’une vidéo par intelligence artificielle.
Pour amorcer cette réflexion pédagogique, découvrez ce jeu spécialement conçu à cet effet : La génération d’images (par l’IA) dont vous êtes le héros.
Les objectifs du jeu :
- Permettre aux enseignants d’adapter une démarche réflexive concernant les valeurs ajoutés de la génération d’image avec l’IA.
- Obtenir une évaluation à titre indicatif de la valeur ajoutée de cette génération.
- Donner des pistes d’amélioration de la démarche.
Dans cette histoire interactive, conçue à l’aide de la plateforme Moiki.fr, divers personnages sont présentés, chacun apportant une perspective réflexive sur les enjeux évoqués précédemment. Ces interventions soulèvent une série de questionnements pédagogiques variés, tels que :
- « Ai-je conscience des enjeux environnementaux liés à une telle génération? »
- « Cette génération est-elle en adéquation avec mes objectifs pédagogiques, les compétences visées ou la méthodologie employée? »
- « L’image que je souhaite générer existe-t-elle déjà? Quelle est la motivation derrière cette démarche? »
- « Ai-je conscience des enjeux éthiques que cela suppose? »
- « Ai-je consulté les différents référentiels légaux encadrant l’usage de l’IA en contexte éducatif? »
À travers ces thématiques, chaque utilisateur est invité à vivre une aventure dont il est le protagoniste. Les choix effectués influencent deux variables clés : le niveau de réflexion pédagogique et la pertinence de la génération.
Une fois arrivé à la fin de l’histoire, la personne aura accès à une de ces trois évaluations. Chacune d’elle dépendra du niveau de réflexion et de la pertinence de la génération.
Les différentes fins possibles de l’histoire, en fonction des réponses données.
Vers la recherche d’un équilibre
La génération d’images et de vidéos par un enseignant soulève certaines responsabilités et réflexions, tout en ouvrant la voie à de nouvelles approches méthodologiques permettant de travailler des compétences et des savoirs propres à ses cours. Une fois les divers points d’attention identifiés, le principal défi pourrait résider dans la recherche d’un équilibre entre la valeur ajoutée de ces outils et les considérations nécessaires à leur usage, afin d’en assurer la pertinence et l’efficacité sur le plan pédagogique.
Pour approfondir cette thématique, le CréaCamp intitulé La génération d’image par l’IA : l’équilibre entre enjeux et plus-value propose une exploration détaillée de ces enjeux.
Par ailleurs, ceux qui souhaitent découvrir une tâche en univers social intégrant la génération d’images par intelligence artificielle peuvent voir la rediffusion de la formation CréaCamp Découverte intitulée L’intelligence artificielle : l’image et la pensée critique, animée par le Service national du RÉCIT, domaine de l’univers social.