Innovation Pédagogique et transition
Institut Mines-Telecom

Une initiative de l'Institut Mines-Télécom avec un réseau de partenaires

Des nouvelles du projet Florilège (utiliser l’Intelligence Artificielle pour la curation automatique des Ressources Éducatives Libres)

22 mai 2025 par Colin de la Higuera Coopérer 412 visites 0 commentaire

Un article repris de https://chaireunescorelia.univ-nant...

Le projet Florilège, porté par la Chaire, a beaucoup évolué depuis son lancement en 2021. Mais, avant d’en donner des nouvelles, commençons par revenir sur quelques éléments de contexte.

Ce projet a été conçu à la suite du projet X5-GON, dont l’objectif est d’utiliser l’Intelligence Artificielle pour la curation automatique des Ressources Éducatives Libres (REL). Florilège s’est inscrit dans cette continuité : l’ambition du projet était ainsi de recenser les REL francophones existantes et d’en créer une collection, accessible à toutes et tous et enrichie d’informations diverses (générales, pédagogiques, qualitatives). Ce projet financé par la communauté européenne entre 2018 et 2020 (Programme H2020) a réuni des chercheurs d’Allemagne, Slovénie, Royaume-Uni et de France et a donné lieu à la création d’outils permettant l’ingestion de RELs grâce à l’IA et à l’accès à celles-ci par des moteurs de recherche et de recommandation.

Florilège a été développé au sein de la Chaire RELIA. Il a bénéficié du soutien financier de NExT, au travers du programme Investissements d’Avenir, et du Labex CominLabs. Nous avons pu préparer le projet en collaboration avec :

Le projet s’est construit en même temps que les projets CLARA et PARTAGE, tous deux financée par le Labex CominLabs et dont le but a été de proposer des outils, basés sur l’IA et le web sémantique, permettant d’aider les enseignants à concevoir de nouveaux cours à partir de RELs. Et pour cela, bien entendu, il est essentiel de pouvoir avoir accès à une belle collection de RELs !

Historique

Le projet Florilège a été lancé en juin 2021 et a connu plusieurs évolutions tout au long des années suivantes. Nous vous proposons ci-dessous un historique des étapes les plus marquantes du projet :

 2021

Les réflexions sur le projet ont débuté en juin et se sont poursuivies tout au long du second semestre 2021.

 2022

Début 2022, nous avons commencé les développements liés à la base de données et au site web du projet.

Le 18 juillet a été marqué par l’organisation d’un premier RELathon (en interne), qui constituait un test en conditions réelles d’un système d’annotation utilisant des hashtags. Pour ce faire, nous avons pu compter sur le volontariat de partenaires de Nantes Université et des membres de la Chaire RELIA. Leurs retours d’expérience ont été précieux et nous ont fait envisager un autre système d’annotation, via le recours à une extension web.

 2023

Tout au long de cette année, les développements se sont poursuivis.
Des modifications ont par exemple été apportées au site et nous y avons ajouté une fonctionnalité de suggestion de REL (via un formulaire dédié).
C’est également en 2023 qu’a été développée l’extension de navigateur permettant d’annoter les ressources de la base de données.

Par ailleurs, nous avons réalisé quelques expérimentations avec ChatGPT, notamment liées à la récupération de métadonnées manquantes.

Le 07 juillet, nous avons organisé un RELathon dans le cadre de l’événement “Les Clé(s) de l’éducation – Construire la classe ensemble”, qui se déroulait au lycée Honoré d’Estienne d’Orves de Carquefou (44).
Nous vous en parlions dans l’article suivant : https://chaireunescorelia.univ-nantes.fr/2023/07/17/et-si-vous-aussi-vous-contribuiez-a-un-projet-deducation-ouverte/.

 2024

En 2024 ont eu lieu 5 RELathons, qui différaient par rapport aux précédentes éditions, en termes de contenus, de scénarisation et de modalité de participation (exclusivement à distance).
Lors de ces ateliers participatifs, organisés en février-mars puis de mai à juillet, nous avons abordé des thématiques telles que les REL, les licences Creative Commons, puis proposé aux participant·es de contribuer à l’éducation ouverte par l’annotation collective des ressources. En deuxième partie, une expérimentation de l’utilisation de l’IA pour la recherche de métadonnées leur a été proposée, menant à des échanges intéressants autour de ces enjeux.
Cette expérience a suscité chez les participant·es un vif intérêt pour nos travaux, tout en confirmant la difficulté des tâches d’annotation, notamment pour des contenus exigeant une grande précision.

À partir du mois de juillet, nous avons poursuivi les développements techniques pour prendre en compte certains retours d’expérience des participant·es aux RELathons. Les modifications ont surtout porté sur le moteur de recherche et son fonctionnement : d’une recherche de ressources par sujets / mots-clés à l’ajout d’autres filtres de recherche (hébergeur, licence, etc.).

 

Difficultés rencontrées

Nous terminerons cet article par des points positifs, c’est-à-dire par les enseignements et bénéfices apportés grâce à ce projet. Mais avant cela, il nous semble important de revenir sur les difficultés que nous avons rencontrées.

L’un des obstacles majeurs rencontrés a concerné les difficultés à mobiliser des personnes volontaires pour annoter les ressources, que ce soit lors de sessions collectives ou en autonomie.

Par ailleurs, il n’était pas aisé de trouver des arguments (à l’attention du grand public, mais pas seulement) pour convaincre :

  • de la finalité et de l’utilité de récupérer des métadonnées de ressources ;
  • de réaliser des annotations lors de moments de temps libre ;
  • de l’utilité d’annoter manuellement alors que « les IA peuvent le faire » (sic).

Concernant ce dernier point, Florilège a effectivement été lancé et pensé avant la démocratisation des IA génératives (GenIA), fin 2022. Certaines tâches, qui étaient techniquement complexes voire impossibles avant, le sont donc « théoriquement » devenues.

Enjeux soulevés

Ce projet, grâce à sa nature expérimentale, nous a permis d’explorer, de tester et de découvrir (parfois par hasard), des enjeux ou problématiques que nous n’avions pas forcément anticipés.

Tout d’abord, comme nous le détaillerons en fin d’article, Florilège a constitué une opportunité d’échanger avec plusieurs personnes créatrices de REL, notamment francophones. Leurs témoignages ont été précieux dans la mesure où nous avons découvert certaines préoccupations récurrentes. C’est par exemple le cas des difficultés à trouver des financements pour poursuivre leurs projets. D’autres problématiques concernent la gestion et la maintenance technique des bases de données, qui étaient parfois liées à l’utilisation de plateformes d’hébergement des ressources développées par des prestataires. Malgré les avantages que peuvent présenter ces solutions, pour les personnes porteuses du projet, la conséquence peut être de les empêcher d’accéder facilement à la base de données constituée par leurs soins…
Et ce constat nous a également permis de découvrir que cette situation de dépendance à un prestataire est également répandue, par exemple au sein d’universités françaises.

Ensuite, concernant le moteur de recherche Florilège, nos expérimentations nous ont conforté·es dans le constat qu’il est difficile, des points de vue technique et expérience utilisateur, de « faire le poids » face aux moteurs de recherche populaires. C’est une réalité qu’on ne peut nier, bien que les moyens financiers investis ne soient pas comparables.

Par ailleurs, ce projet a représenté une occasion de prendre conscience de la diversité de formats et de structures des REL, et en quoi elle peut rendre difficile l’automatisation de tâches d’annotation. Les pages web ont constitué des exemples particulièrement riches d’enseignements, car leurs formats et structures variaient tellement qu’il était complexe d’appliquer des procédures génériques de récupération.

Concernant les métadonnées, le projet nous a permis d’évoluer dans notre conscience des enjeux liés aux métadonnées.
De nombreux standards et formats existent (notamment selon les domaines) et s’adapter à un standard existant peut être considéré comme optimal (par exemple pour faciliter l’interopérabilité). Mais la question de savoir le(s)quel(s) choisir est cruciale. Cela dépend de nombreux facteurs tels que le public (personnes qui créent les REL et celles qui les utilisent), de la visée pédagogique des ressources, de leurs contextes et durée d’utilisation prévus, etc. Un autre point important concerne le niveau des détails souhaités et leur(s) finalité(s).
Un enjeu supplémentaire porte sur le choix de la ou des personne(s) chargée(s) de compléter les métadonnées. En effet, il est compliqué de demander aux auteur·es de remplir de nombreux champs de métadonnées (en raison d’un risque de découragement). En même temps, qui peut être mieux placé·e que l’auteur·e pour fournir des métadonnées sur ses ressources ?
D’autres points de vue soutiennent qu’aujourd’hui, en raison des évolutions technologiques, les métadonnées ne sont plus vraiment pertinentes.

Enfin, pour faire le lien avec un élément soulevé précédemment, selon certains points de vue, les GenIA pourraient constituer une solution à ces problématiques de récupération de métadonnées. Pour simplifier, il « suffirait » de créer le prompt idéal et/ou d’utiliser l’un des nombreux outils existants, fonctionnant grâce aux LLM (large language models  ; modèles de langage).
Mais, outre d’autres enjeux majeurs, cette vision des choses pose question pour plusieurs raisons. Nous avons pu explorer cela dans le cadre de Florilège, et vous détaillons quelques questionnements ci-dessous :

  • Quelles sont les influences, pour l’éducation ouverte, de fournir en entrée des GenIA les métadonnées et/ou le contenu de REL ?
    Les contenus étant ensuite réutilisés pour améliorer les performances des GenIA, quelle position adopter à ce sujet ?
    Qu’en est-il du consentement des auteur·es et du respect du droit d’auteur de manière générale ?
    Comment se positionner également en ce qui concerne le respect des données personnelles (cf. par exemple l’intégration du nom des auteur·es aux prompts) ?
    Par ailleurs, qu’en est-il de la pérennité et de l’avenir de l’éducation ouverte, ainsi que du principe des Creative Commons si les contenus se retrouvent mélangés et « désobjectivés » (étant donné qu’on ne sait pas quand, comment, combien de fois, par qui, sous quelle(s) forme(s) ils sont ensuite réutilisés) ?
  • Avoir recours aux GenIA signifie alimenter et contribuer à des solutions (majoritairement) proposées par des entreprises privées. Le « système global » qui les sous-tend questionne sur les influences que ça a et aura sur l’éducation ouverte, ainsi que dans le domaine de l’éducation de manière générale. À titre d’exemples, nous pouvons citer les enjeux liés :
    • à la marchandisation de l’éducation ;
    • aux connaissances qui tendent à être monopolisées par quelques entités, alors que l’un des arguments en faveur des REL est de proposer des alternatives aux savoirs confisqués (par exemple par les éditeurs) ;
    • au fait que ces entreprises investissent beaucoup pour le marketing de l’innovation et pour diffuser le plus largement possible une vision du monde basée sur :
      • le capitalisme (produire plus, plus de productivité, gain de temps, etc.) ;
      • l’idée d’une croissance infinie (innovations perpétuelles, multiplication d’outils et d’alternatives personnalisées à chaque personne / contexte / cas d’usage, etc.) ;
      • la généralisation de l’automatisation des tâches (par effet domino, l’on peut imaginer des conséquences par exemple relatives à une volonté d’ »optimisation des budgets » et/ou de « maximisation de l’efficacité gouvernementale »…) ;
      • l’individualisme (cf. entre autres la personnalisation systématique des contenus au lieu de privilégier la co-construction et la mutualisation de ce qui existe déjà).

 

Enseignements et apports du projet

Malgré les difficultés que nous avons rencontrées dans le cadre de ce projet, il a constitué une opportunité significative d’apprentissages et ce, à plusieurs niveaux.

Tout d’abord, la nature expérimentale de Florilège nous a permis de créer, tester des choses et ainsi d’en tirer des enseignements. Comme détaillé précédemment, ce projet a également permis de soulever des questions et des problématiques auxquelles nous ne nous attendions pas.

Ensuite, Florilège a constitué une opportunité de découvrir plusieurs catalogues de REL francophones et d’initiatives promouvant le partage et la co-construction de connaissances.
Nous avons ainsi échangé avec différentes personnes porteuses de projets, aussi inspirantes les unes que les autres.
Lorsqu’elles étaient intéressées pour collaborer avec nous et acceptaient que leurs ressources fassent partie du catalogue Florilège, nous leur avons proposé de mettre en lumière leur(s) initiative(s), via un article sur le site de la Chaire. Ainsi, nous vous invitons à découvrir ou redécouvrir les entretiens avec :

Le déploiement du projet Florilège a été rendu possible grâce à toutes les personnes, institutions, collectifs ayant donné leur accord pour que les URL et métadonnées de leurs ressources soient ajoutées à la base de données. Ainsi, en plus des 3 contributeurs mentionnés ci-dessus, nous remercions chaleureusement :

Par ailleurs, les RELathons organisés ont représenté des opportunités de médiation scientifique auprès de publics variés. Ils ont permis de multiplier les contextes lors desquels nous avons pu sensibiliser à l’éducation ouverte, aux REL, aux enjeux de droit d’auteur, à l’utilisation des licences Creative Commons, etc. Lors des ateliers les plus récents, nous avons également pu sensibiliser les publics à quelques enjeux liés aux IA génératives.

 

Évolutions envisagées

Concernant les perspectives, après plus de 3 années, nous mettons un terme à ce projet Florilège.

Le site web reste actif : l’accès au moteur de recherche et la consultation des ressources du catalogue demeurent ainsi possibles. Il convient néanmoins de noter que la base de données ne sera plus mise à jour : des métadonnées et URL obsolètes sont donc probables.

L’extension de navigateur (version 1.5) reste également téléchargeable depuis le site (à savoir que des dysfonctionnements avaient été relevés).

Enfin, nous vous invitons à nous contacter pour toute question sur le projet ou idée de collaboration : https://chaireunescorelia.univ-nantes.fr/contact/.

 

Liberté d’expression, indépendance

Les approches et opinions exprimées sur ce site n’engagent que la Chaire RELIA et ne reflètent pas nécessairement celles de Nantes Université et de l’UNESCO.

Licence
Licence Creative Commons

Sauf indication contraire, l’ensemble des contenus de ce site https://chaireunescorelia.univ-nantes.fr/ est mis à disposition selon les termes de la Licence Creative Commons Attribution 4.0 International.

Licence : Pas de licence spécifique (droits par défaut)

Répondre à cet article

Qui êtes-vous ?
[Se connecter]
Ajoutez votre commentaire ici

Ce champ accepte les raccourcis SPIP {{gras}} {italique} -*liste [texte->url] <quote> <code> et le code HTML <q> <del> <ins>. Pour créer des paragraphes, laissez simplement des lignes vides.