Innovation Pédagogique et transition
Institut Mines-Telecom

Une initiative de l'Institut Mines-Télécom avec un réseau de partenaires

Manifeste pour un catalogue d’analyses (pour les learning analytics)

17 janvier 2017 par Matthieu Cisel Veille 117 visites 0 commentaire

Un article repris de http://numpedago.hypotheses.org/57

 

Aujourd’hui, je souhaiterais suggérer des pistes relatives au travail de vulgarisation des méthodes d’analyse de données éducatives, dont j’ai donné l’esprit au cours des billets précédents. On va notamment parler d’une idée qui me trotte dans la tête depuis longtemps, un catalogue d’analyses pour les traces d’interaction (ou learning analytics), dans lequel un analyste pourrait venir piocher à loisir des idées.


La première pourrait consister à poursuivre le travail de construction de typologies effectuées en subdivisant certaines des catégories proposées jusqu’à présent, et en créant davantage de catégories spécifiques du champ éducatif (pour, bien sûr, les partager via des billets). Certaines thématiques constituent des questions récurrentes, transversales aux différents objets d’étude sur lesquels se penchent les chercheurs s’inscrivant dans le champ de l’EDM. Les quelques manuels (Romero & Ventura, 2007) consultés dans le cadre de la conception de ce document font souvent le grand écart entre des grandes catégories générales d’analyses de données, calquées sur les ouvrages classiques d’analyse de données, non spécifiques au champ de l’éducation, et des cas d’étude qui viennent montrer un exemple type. Le travail de généralisation à partir de ces cas d’études sur des thématiques globales n’est que rarement fait, et l’on trouve souvent, lorsqu’il est ébauché, autant de catégories que d’exemples. Un travail de recension et de catégorisation des thématiques d’analyse reste à faire pour prolonger et affiner les typologies existantes.

Au cours des deux séries de billets qui se concluent aujourd’hui, nous nous sommes intéressés dans un premier temps à une typologie de méthodes mixtes issues de la littérature, pour revenir dans un second temps sur la diversité des types d’analyses quantitatives réalisées dans le champ de l’Educational Data Mining. Il serait intéressant à mes yeux de poursuivre le travail d’illustration des différentes catégories proposées via des exemples issus de préférence des recherches françaises. On peut même envisager à terme de poser les bases d’ouvrages de méthodologie analogue à ceux qui se sont développés en langue anglaise (Romero et Ventura, 2007).

Néanmoins, la barrière de la langue n’est probablement pas le principal obstacle pour les chercheurs et jeunes chercheurs face à la barrière que constitue le manque d’accessibilité des articles, en particulier sur Internet. Les ouvrages de référence sont coûteux, et les exemples que l’on y trouve ne sont pas toujours suffisamment extrapolables aux situations rencontrées par les communautés de recherche. On peut envisager la mise à disposition gratuite et en ligne de catalogues présentant les différentes formes d’analyse, classées par famille. On pourra proposer un découpage par forme d’analyse, au sens statistique du terme, comme nous l’avons fait dans la seconde partie de ce document. On pourra également s’intéresser à la thématique de l’analyse, ou bien, de manière plus vaste, à la stratégie de recherche dans son ensemble, comme dans le cas des méthodes mixtes.

La possibilité d’accéder à un catalogue de formes d’analyses structuré, autour de catégories reconnues dans les différentes littératures relatives au champ de l’EDM, pourrait constituer un point de départ utile, en particulier pour des étudiants ou des jeunes chercheurs découvrant le domaine. Si l’on ajoute aux entrées de ce catalogue des codes et des jeux de données, artificielles ou réelles, permettant d’illustrer les formes d’analyses choisies, les utilisateurs d’un tel catalogue auraient toutes les cartes en main pour débuter dans le champ de l’EDM. Pour ne rien vous, cacher, j’ai contribué à une proposition de cette nature sur un github avec des collègues de l’ANR Hubble, mais la proposition n’en est qu’à un état embryonnaire à ce stade.

L’essentiel des ressources disponibles en ligne consacrées à la question provient d’institutions américaines, qui impriment ainsi leur marque sur les jeunes chercheurs se formant sans doute autant par la littérature grise que par les publications de recherche. Comme pour d’autres champs de recherche, il est peut-être temps d’accroître la visibilité et la participation des institutions françaises dans le grand jeu du partage de ressources en ligne.

PS : La bibliographie associée à cet article est disponible dans ce billet.

Cet article s’inscrit dans une série de billets consacrés aux techniques d’analyse en Educational Data Mining (fouille de données éducatives). La lecture des articles précédents est nécessaire pour mieux comprendre la démarche.

Licence : Pas de licence spécifique (droits par défaut)

Répondre à cet article

Qui êtes-vous ?
[Se connecter]
Ajoutez votre commentaire ici

Ce champ accepte les raccourcis SPIP {{gras}} {italique} -*liste [texte->url] <quote> <code> et le code HTML <q> <del> <ins>. Pour créer des paragraphes, laissez simplement des lignes vides.

Suivre les commentaires : RSS 2.0 | Atom