Innovation Pédagogique
Institut Mines-Telecom

Une initiative de l'Institut Mines-Télécom avec un réseau de partenaires

Entre l’enseignement et la recherche, quelle place pour les Learning Analytics ?

Un article repris de http://journals.openedition.org/dms/4080

Un article de Daniel Peraya repris de la revue Distances et Médiations des Savoirs, une publication sous licence CC by sa

Dans ce numéro, la rubrique Débat-discussion donne la parole à Anne Boyer (LORIA, Université de Lorraine) et à Vanda Luengo (MOCAH, LIP6, Sorbonne Université), toutes deux informaticiennes (re)connues pour leurs travaux dans le domaine des LA. D’emblée, elles revendiquent leur double posture d’enseignantes et de chercheuses. L’une comme l’autre ont fait des LA leur domaine de recherche, mais en même temps, elles les utilisent afin d’améliorer leurs enseignements ou les projets d’enseignement auxquels elles participent. Anne Boyer s’est impliquée dans plusieurs projets notamment dans l’enseignement supérieur (projets ERASMUS+ D-Transform et PIA DUNE EOLE), dans les collèges (projet PIA e-FRAN METAL) ou encore dans la formation à distance en collaboration avec le CNED. Vanda Luengo, quant à elle, distingue ses travaux de recherche ainsi que ceux de ses doctorants de ce qu’elle nomme la « vraie vie », les situations d’apprentissage en contexte écologique où la recherche-action inscrite dans la durée tient une place privilégiée. Elle fait ainsi le lien entre les deux aspects de son métier et de sa pratique.

Qu’il s’agisse de la nécessité de mettre en œuvre une démarche éthique et transparente dans l’utilisation des LA, de la nécessité d’impliquer tous les acteurs concernés – et ce depuis le début du processus – ou encore de l’importance d’une approche multidisciplinaire, les deux contributrices s’accordent et leurs propos prolongent parfaitement les thématiques abordées dans les deux premiers numéros de cette année. Aussi dans cette brève présentation, je me bornerai à souligner quelques apports originaux, quelques pistes qui n’ont pas encore été évoquées dans les précédentes contributions.

Nature et validité des données

Les données d’apprentissage sont de nature variée : elles sont hétérogènes, multimodales (textes en langage naturel, clics, logs, votes électroniques, etc.), multi-sources et multi-formats (elles possèdent des formats différents en fonction des dispositifs, eux aussi très variés) et bien souvent ambiguës. Voici autant de facteurs qui rendent bien sûr leur exploitation très complexe des points de vue méthodologique, technique et informatique (Boyer, § 5 ; Peraya et Luengo, § 9). Si la validité des données constitue bien évidemment une préoccupation essentielle pour les deux chercheuses, Anne Boyer introduit une caractérisation complémentaire, l’utilité de la donnée en contexte d’apprentissage : « Schématiquement, l’utilité d’une donnée consiste à déterminer ce que la donnée apporte relativement à ce qu’elle coûte, que ce soit en termes monétaires, éthiques, complexité de collecte ou niveau de performances. » (§ 8) Ce critère se révèle d’autant plus important qu’il contribue à donner une réponse éthique à l’usage des données collectées tout en refrénant la tentation du « toujours plus de données » (§ 7). Il est en effet parfois plus important, pour conserver la confiance des usagers, de se passer de certaines données dont l’impact global sur les résultats pourrait s’avérer relativement faible et, parfois, imperceptible pour les usagers.

Vanda Luengo, quant à elle, insiste sur la distinction nécessaire entre Data Mining et Learning Analytics : « Dans le premier cas, il s’agit plus de produire des connaissances sur les méthodes et algorithmes permettant de produire des connaissances à partir des données tandis que dans le second il s’agirait d’une approche plutôt explicative permettant la prise de décision. » (Peraya et Luengo § 6). Pour la chercheuse, le choix d’une approche déductive ou inductive revêt moins d’importance que celui du type de données collectées, car, en SHS, ces deux approches sont de plus en plus considérées comme complémentaires. Quant à la nature des données, Vanda Luengo développe la notion d’« épaisseur » de la donnée. Les données épaisses, contrairement aux données factuelles qui rendent compte de la trace d’un événement saisie automatiquement sans donner aucun élément permettant de qualifier l’événement lui-même, décrivent la « sémantique de l’action » de l’apprenant en contexte d’apprentissage. L’expérience montre que les EIAH constituent des environnements d’apprentissage plus adaptés à la récolte de données épaisses que les Moocs. En effet, il s’agit de dispositifs expérimentaux ou quasi expérimentaux et les nombreux paramètres du contexte peuvent donc être maîtrisés et pris en compte dans la modélisation : ces environnements sont « plus orientés vers l’apprentissage et vers la recherche que vers la diffusion à grande échelle : leur ingénierie est donc différente » (§ 8). Enfin, Vanda Luengo défend l’idée que « plus les données sont massives, plus elles sont factuelles et donc moins elles possèdent d’épaisseur » (§ 17).

Par contre, le nombre des apprenants travaillant dans un EIAH est largement inférieur à celui des participants à un Mooc. Ce point de vue renvoie d’ailleurs à celui d’Anne Boyer qui, dans le cadre du projet e-FRAN METAL d’utilisation des LA au collège, constate que « les effectifs sont réduits et que les traces sont alors parcimonieuses et leur exploitation ne peut se satisfaire d’algorithmes de fouille de données usuels (Brun, 2019). On passe alors du Big Data au Small Data, domaine qui suscite de nombreuses recherches actuellement. » (§ 15)

Afin de pallier le manque de données massives dans les environnements à effectifs réduits, Vanda Luengo préconise d’inscrire les recherches dans la durée, comme cela se fait aux États-Unis et comme elle a pu le faire dans ses travaux plus anciens en faculté de médecine, car seule une perspective longitudinale peut assurer la réplicabilité des analyses, la validité des résultats et la compréhension en profondeur les phénomènes observés (§ 11 et 17). Aussi une approche de type Design Based Research serait une solution acceptable en France aujourd’hui comme sans doute dans nos pays francophones. » (§ 17) Mais cela supposerait un changement de la politique de financement des projets de recherche, organisée aujourd’hui à court terme, sur des périodes de deux ou trois ans.

Vers une algorithmique bienveillante

Anne Boyer et ses collaborateurs de l’équipe Kiwi (LORIA) ont cherché à mettre en place une « algorithmique bienveillante, c’est-à-dire une approche qui valorise les efforts et l’engagement de l’apprenant » (§ 17). En cela, elle répond à de nombreuses critiques portées à l’encontre de l’usage des LA à des fins prédictives et à certaines dérives dans l’usage des tableaux de bord déjà évoquées par Margarida Romero (2019) : les feedbacks que reçoivent les apprenants, notamment lorsqu’il y a un risque décrochage, peuvent les décourager ou même les stigmatiser. Rendre l’algorithme bienveillant consiste à pondérer les scores obtenus par chaque apprenant en fonction de son activité, de la difficulté qu’il rencontre, de son niveau et du « risque » qu’il prend (§ 19). Il s’agit donc bien de configurer l’algorithme d’après une conception a priori de l’apprentissage, de l’accompagnement et du soutien de l’apprenant, mais aussi en accord avec la posture assumée de l’enseignant et de l’équipe technopédagogique. Il n’y a vraisemblablement aucun algorithme « objectif », il n’y a donc pas de biais, mais une posture initiale des concepteurs qui doit être assumée, explicitée, négociée et partagée avec tous les utilisateurs.

Deuxièmement, la bienveillance revendiquée par l’équipe KIWI se marque aussi dans la formulation des rétroactions des informations proposées à l’apprenant dans son tableau de bord ; tout est fait pour que chaque information concoure à l’accompagnement et au soutien positifs de l’apprenant. L’attention des concepteurs aux dimensions formelle et stylistique des rétroactions que reçoit l’apprenant laisse penser que le tableau bord pourrait être conçu explicitement comme un dispositif d’énonciation à part entière – à travers le tableau de bord, ce sont des personnes qui s’adressent à d’autres personnes – et que les retours générés par le dispositif pourraient être élaborés comme des actes de langage tant illocutoires que perlocutoires. L’analyse interactionnelle peut apporter un cadre de réflexion complémentaire et ouvrir des pistes prometteuses comme c’est le cas d’ailleurs pour l’ingénierie de tout dispositif de communication et de formation médiatisées.

Partager, certes, mais quoi ?

Le partage, entre les équipes de recherche, des données, des modèles et des processus d’analyse est une préoccupation majeure de la communauté scientifique pour des raisons tant pratiques – difficultés de recueillir les données, notamment – que scientifiques – favoriser la réplicablité des analyses et la validation des résultats. Cette question est abordée tant par Vanda Luengo que par Anne Boyer qui rappellent les projets de recherches dans lesquels chacune s’est impliquée. Pour la première, il s’agit du projet HUBBLE (HUman oBservatory Based on anaLysis of e-LEarning traces, ANR, 2014), pour la seconde du projet Lola (LORIA, Laboratoire Ouvert en Learning Analytics, 2018). Dans le premier cas, il s’agit principalement de pouvoir évaluer deux contextes afin de voir s’ils sont suffisamment proches pour permettre la réplication d’un protocole d’analyse. Vanda Luengo précise que la mesure de ce qu’elle nomme la « distance intercontextuelle » est une problématique émergente et qu’elle ne peut aujourd’hui faire l’objet d’une modélisation informatique. Le partage des processus d’analyse lui paraît plus important celui des données, dans la mesure où il est des conditions nécessaires à la réplicabilité des recherches. Le projet LOLA quant à lui vise la mutualisation des données, mais aussi des modèles, d’applications (outils de visualisation et de leurs contextes d’utilisation), d’indicateurs pour la réalisation de tableaux de bord et de documents relatifs à l’accompagnement. L’objectif final est « d’avoir à terme une plateforme qui soit un lieu d’échange et de partage pour une communauté française de recherche qui se structure, un lieu d’appropriation et d’accompagnement pour les institutions éducatives qui s’interrogent, un lieu de sensibilisation et d’information pour les enseignants qui expérimentent. » (§ 40)

Voici évoqués très brièvement les apports de ces deux contributions. Je vous en souhaite une bonne lecture.

Référence électronique

Daniel Peraya, « Entre l’enseignement et la recherche, quelle place pour les Learning Analytics ? », Distances et médiations des savoirs [En ligne], 27 | 2019, mis en ligne le 13 octobre 2019, consulté le 26 octobre 2019. URL : http://journals.openedition.org/dms/4080

Licence : CC by-sa

Répondre à cet article

Qui êtes-vous ?
Ajoutez votre commentaire ici

Ce champ accepte les raccourcis SPIP {{gras}} {italique} -*liste [texte->url] <quote> <code> et le code HTML <q> <del> <ins>. Pour créer des paragraphes, laissez simplement des lignes vides.

Suivre les commentaires : RSS 2.0 | Atom