Innovation Pédagogique et transition

Une initiative de l'Institut Mines-Télécom avec un réseau de partenaires

Ouvrir la boîte noire de la production de vidéos pour les MOOC. Vers une analyse sociotechnique.

13 décembre 2016 par Rémi Sharrock MOOC 1691 visites 1 commentaire

Résumé :

Le développement des MOOC requiert la production de matériel pédagogique sous des formats multimédias. Les vidéos sont largement utilisées dans les MOOC existants. Alors que l’usage des vidéos dans des contextes éducatifs a été très étudié, les processus de production des vidéos ont été peu examinés dans la littérature existante. Cet article montre qu’il est crucial d’analyser les processus de production des vidéos pour comprendre les effets des MOOC sur l’interaction pédagogique. Il propose d’étudier les dispositifs sociotechniques sur lesquels la production de vidéo repose. Ces dispositifs mettent en forme le contenu pédagogique, les modes d’action de l’enseignant, et le rôle anticipé de l’étudiant. Cet article propose un répertoire analytique permettant de caractériser les effets des choix techniques pour la production de vidéos, et suggère donc de repenser les termes de l’évaluation de la qualité des vidéos pédagogiques.

Mots-clés :Vidéo ; MOOC ; analyse sociotechnique ; production.

Brice Laurent¹, Rémi Sharrock²,

remi.sharrock [at] telecom-paristech.fr

1 Centre de Sociologie de l’Innovation, Mines ParisTech, Paris, France
2 Télécom ParisTech, Institut Mines-Telecom, Paris, France

~~~~~~~~~~~~~~~~~~~~~

Un article publié au VIIIe Colloque des Questions de Pédagogie dans l’Enseignement Supérieur, Brest, 17, 18 et 19 Juin 2015.

I. INTRODUCTION

Alors que l’usage de la vidéo en classe est souvent conseillé par les praticiens (par exemple Zollman and Fuller, 1994), il est souvent décrit comme minimal, limité à des interventions irrégulières et peu connectées les unes aux autres (Kaufmann and Mohan, 2009). Les supports vidéo offrent cependant des moyens intéressants d’exposer des contenus pédagogiques graphiques, interactifs, multi-dimensionnels. En tirer partie suppose d’exploiter les caractéristiques techniques spécifiques des dispositifs audiovisuels, plutôt que de les concevoir comme des ajouts déconnectés de la pratique pédagogique, ou comme une réplication virtuelle des pratiques d’enseignement traditionnelles.
Cet article propose de contribuer à une littérature consacrée à l’usage des vidéos pour des objectifs pédagogiques. La vidéo nous intéresse ici particulièrement dans la mesure où elle est utilisée (ou pourrait l’être) au sein de MOOC (Cours en ligne ouverts et massifs). Notre approche est fondée sur l’analyse des dispositifs socio-techniques qui permettent la production de vidéo. Ces dispositifs, très peu décrits dans la littérature existante, sont d’une importance capitale pour saisir la production conjointe des instruments de communications (par ex. Capture d’écrans, tutoriels, présentations PowerPoint commentées en audio, expériences scientifiques filmées, vidéos captées sur le terrain, dialogues et débats filmés ...) et des pratiques d’enseignement (comprenant le comportement de l’enseignent, la nature du contenu pédagogique, et les rôles attendus pour les étudiants). Cet article montre que l’analyse des dispositifs sociotechniques permettant la production de vidéo rend visible les effets d’innovations pédagogiques comme les MOOC – que ces effets consistent à reproduire des pratiques d’enseignement existantes, qu’ils les déplacent ou en créent de nouvelles.
La production de vidéo est étroitement liée aux modalités de circulation et d’usage. Ceci est d’autant plus évident que les vidéos sont aisément circulables en ligne, et donc utilisables tout autant dans la salle de classe que dans une multitude d’autres lieux. Intégrées dans des MOOC, les vidéos sont censées être massivement diffusées, ce qui pose des problèmes spécifiques – notamment en termes de production du contenu pédagogique et d’anticipation des publics possibles. Ces difficultés font directement écho à d’autres innovations pédagogiques comme l’enseignement par correspondance, pour lesquelles la distribution massive de contenus pédagogiques est associée avec la définition de besoins spécifiques déterminant les pratiques d’enseignement (Lee, 2008).
L’analyse des dispositifs sociotechniques que nous proposons consiste à mettre en évidence les relations entre des choix de modes de production de contenus vidéo et des modes de circulation et d’usage, des façons de définir les rôles des enseignants et des étudiants, et des contenus pédagogiques. Nous proposons de montrer qu’une étude de la transformation des pratiques d’enseignement peut être menée à partir de l’analyse des dispositifs mettant en forme la production des vidéos. Pour ce faire, nous développons ici un répertoire analytique permettant de rendre compte de la variété des processus de production de vidéo et de leurs effets. Cette approche vise à contribuer à renouveler les perspectives existantes proposant des méthodes d’évaluation des vidéos (et plus généralement des MOOC). Ces dernières sont fréquemment fondées sur la mesure de performance en fonction de critères de succès pré-définis. Par contraste, l’approche défendue dans cet article consiste à analyser les divers procédés de construction du matériau d’enseignement, et leurs effets sur les pratiques pédagogiques.
Ce texte débute par une discussion de la littérature existante relative à l’usage des vidéos pour des objectifs éducatifs, avant tout centrée sur l’évaluation de l’efficacité (section 2). L’approche alternative que nous proposons est fondée sur un ensemble de travaux du domaine des études sociales des sciences (science and technology studies, STS), qui ont analysé le rôle des dispositifs sociotechniques (section 3). En nous appuyant sur ces travaux, nous proposons une description détaillée de diverses options techniques pour la production de vidéos, principalement destinées à des MOOC, et nous analysons les effets de ces options (section 4).

II. LITTERATURE

L’usage de la vidéos dans l’enseignement supérieur a été largement étudiée, la plupart du temps dans des objectifs d’évaluation. L’évaluation est menée via deux grands courants. Le premier s’intéresse à la mesure de l’effet des vidéos, très souvent en évaluant les “gains de connaissances” (knowledge gains, Kay et Kletskin, 2012) ou encore les “résultats d’apprentissage” (learning achievements, Choi et Yang, 2011). Ces mesures s’appuient sur une large palette de méthodes quantitatives et statistiques (Armstrong et al, 2011). Une démarche typique consiste à comparer les notes des étudiants avant et après l’introduction de vidéos (Dupuis et al, 2013). D’autres auteurs proposent d’analyser la production de vidéos par les étudiants eux-mêmes, dans ce même objectif d’évaluation des gains de connaissance (Jarvinen et al, 2012). Les conclusions les plus fréquentes de ces travaux consistent à insister sur la nécessité d’intégrer les contenus vidéo aux séquences pédagogiques en mettant en place des interactions régulières entre enseignants et étudiants (Hill et Nelson, 2011). Le second ensemble de travaux proposant d’évaluer l’usage des vidéos est fondée sur la mesure des « perceptions », ou de la « satisfaction » des enseignants ou des étudiants à qui sont montrées des vidéos en classe (Lonn and Teasley, 2009 ; Candarli and Yuksel, 2012 ; Schreiber et al, 2010 ; Leijen et al, 2009 ; Yen, 2010 ; Eick and King, 2012 ; Hill and Nelson, 2011).
Ces deux ensembles de travaux diffèrent dans leurs objectifs et leurs méthodes. Mais ils partagent des hypothèses similaires et une façon commune de définir l’objet de l’enquête. Tous ces travaux considèrent que les vidéos sont des contenus donnés, non problématiques. Aucun d’entre eux ne se penche sur la variété des modes de production, et sur les effets de ces modes sur les activités d’enseignement et sur les comportements attendus des enseignants ou des étudiants. À l’inverse, ces travaux considèrent que le contenu de l’information dispensée et son efficacité pédagogique sont indépendants des instruments mobilisés pour le produire.
Des enquêtes qualitatives se sont intéressées aux diverses utilisations des vidéos pédagogiques en classe ou en dehors. Certaines proposent des typologies d’usage (par exemple McGarr, 2009 différencie les utilisations « de substitution », « supplémentaire » ou « créatives » - dans ce dernier cas les étudiants produisent eux-mêmes les vidéos). Ces études se penchent sur les façons par lesquelles les vidéos renforcent, soutiennent ou amplifient les informations délivrées (Lankow et al., 2012 ; Klanten et al., 2011). Ces travaux sont parfois précautionneux et préfèrent insister sur l’incertitude relative à l’évaluation des effets des représentations visuelles, en particulier lorsqu’elles ne sont pas accompagnées d’informations dispensées par d’autres moyens (Gershon et Ward, 2001). Les travaux qualitatifs introduisent une certaine variété dans les types de vidéo, et montrent que les usages peuvent varier grandement. Mais comme les études quantitatives, ils tendent à considérer de façon indifférenciée la diversité des méthodes de production et de circulation.
Dans la suite de ce texte, nous proposons d’examiner au contraire les modalités de production des vidéos. Il nous semble crucial en effet de prendre la mesure de la diversité des options techniques disponibles pour la production de vidéos, options techniques dont les effets sont importants sur les possibilités de circulation et d’usage. Les études des dispositifs sociotechniques offrent une voie analytique pertinente pour ce faire, comme nous le montrons dans la suite de ce texte en nous appuyant sur la participation active dans la production de MOOC d’un des auteurs de ce texte ainsi que sur l’analyse de plus d’une centaine de vidéos pédagogiques

III. DISPOSITIFS SOCIOTECHNIQUES UTILISES DANS LE PROCESSUS DE PRODUCTION DE VIDEO

Comment étudier les effets de la production de vidéo sur les pratiques d’enseignement ? Les études sociales des sciences et des techniques ont montré que les artefacts techniques « font de la politique » (Winner, 1980). Ils inscrivent dans leurs détails matériels des possibilités d’usage et en interdisent d’autres (Akrich, 1992 ; Latour, 1993). La description fine des composantes des dispositifs sociotechniques, c’est-à-dire des assemblages comprenant les instruments techniques et leurs utilisateurs attendus, permet ainsi de mettre en évidence les effets politiques des objets techniques. Cette perspective suggère de considérer les techniques de production des vidéos comme des dispositifs sociotechniques : adopter ce point de vue permet de considérer que la production de vidéo n’est pas un processus neutre, mais participe à la fabrication de certains rôles pour les acteurs de l’enseignement et à celle du contenu pédagogique. Cela suppose de faire de l’enseignement une pratique distribuée, fondée sur des dispositifs sociotechniques hétérogènes parmi lesquels les vidéos peuvent prendre place. Tout comme on peut analyser la salle de classe comme un dispositif fondé sur des techniques et où la configuration spatiale met en forme l’interaction pédagogique (McGregor, 2003 ; Yaneva, 2009), on peut étudier les processus de production de vidéos comme des dispositifs mettant en forme les composantes de l’enseignement.
Avant de montrer comment cette approche se traduit pour l’étude des dispositifs produisant des vidéos, il est nécessaire de faire la différence entre l’approche que nous défendons ici avec une perspective critique visant à montrer que les instruments techniques distordent la réalité de l’information. Un bon exemple de cette dernière est l’étude des présentations PowerPoint, qui ont été décrites comme des manières de simplifier à l’extrême des informations complexes (voire les manipuler) dans le but de convaincre un auditoire (Tufte, 2003). Dans cette perspective, la réalité de l’information est confrontée aux biais introduits par les dispositifs de communication. Pourtant le même outil peut être décrit dans d’autres termes. David Stark et Véréna Paravel analysent ainsi PowerPoint comme un instrument participant à la mise en forme de situations sociales où la représentation visuelle agit comme dispositif de coordination s’appuyant sur l’échange d’informations (Stark et Paravel, 2008). Plutôt que d’introduire une dichotomie entre l’information et sa représentation par le dispositif de communication, Stark et Paravel considèrent que les deux sont constitués mutuellement, et, ce faisant, mettent en forme les composantes des situations sociales en jeu. Ils proposent, à cet égard, une analyse sociotechnique dont la pertinence est manifeste pour étudier l’imbrication entre les techniques de production vidéo, le contenu éducatif et la situation d’enseignement.
Une façon de suivre cette approche est de s’appuyer sur la notion d’”agencement”, introduite par Michel Callon (Callon, 2004). Elle permet en effet de rendre compte des dispositifs sociotechniques qui distribuent les possibilités d’action, déterminent la nature de l’information échangée, et mettent en forme des organisations collectives. Dans le cas qui nous intéresse ici, les agencements comprennent les éléments matériels qui permettent de produire les vidéos, et, plus spécifiquement, qui permettent à l’enseignant de mettre en forme son cours pour une diffusion vidéo. La description des techniques de production de vidéo comme des agencements permettra de connecter les caractéristiques techniques des instruments utilisés par les producteurs de vidéos avec les effets qu’elles ont sur les rôles de l’enseignant impliqués et sur la nature du contenu pédagogique. Dans les paragraphes suivants, nous suivons donc le processus de production de vidéo pédagogiques pour les MOOC, et mettons en évidence les effets de la diversité des choix techniques sur la nature de l’interaction pédagogique.

IV. LA PRODUCTION DE VIDEO POUR LES MOOC : UNE ANALYSE SOCIOTECHNIQUE.

Dans cette section, nous détaillons les différents styles de vidéo pédagogique et leur ligne de production, c’est à dire la succession de la phase de planification et préparation, la production et la post-production. Nous explorons les équipements actuels ainsi que les futurs outils et nous caractérisons les agencements sociotechniques sur lesquels s’appuie la production de vidéos pédagogique. Certaines des vidéos que nous avons analysées sont déjà utilisées dans des MOOCs, d’autres sont produites par des acteurs du monde académique, du monde de la formation professionnelle, par des studios professionnels ou même des amateurs devenus célèbres dans les sphères des sites de partage de vidéo en ligne comme YouTube. Bien entendu, nous ne nous focalisons pas seulement sur des exemples à succès ou bien sur des cas qui semblent « satisfaisants » pour les acteurs/instructeurs impliqués. En effet, il est étonnant de constater à quel point certaines personnes sont forcées d’utiliser des technologies avancées totalement inadéquates lorsqu’elles sont manipulées sans expérience (par exemple des techniques de transparence sur fond vert ou des prompteurs) ; alors même que le résultat pédagogique aurait pu être atteint en utilisant une technologie beaucoup plus simple et moins chère. Un autre exemple parlant serait l’utilisation de tableaux numériques interactifs très onéreux (plusieurs milliers d’euros) mais parfois frustrants à l’utilisation ou des télécommandes de la console de jeux WII de Nintendo avec un petit stylo infrarouge permettant de transformer n’importe quelle surface (mur, bureau, tableau blanc, écran LCD) en un tableau interactif parfois difficiles à calibrer correctement (Lee, J.C. 2008).
Par conséquent, il est important de comprendre la complexité de l’ensemble des processus de production vidéo puisque certaines idées de production peuvent paraître simple au premier abord mais s’avèrent extrêmement difficile à mettre en œuvre concrètement. D’autres, en revanche, semblent très difficiles ou impraticables mais sont très facilement mises en œuvre en vidéo. Dans tous les cas, l’environnement, la configuration et les outils choisis ont un impact fort et transforment parfois significativement les pratiques des instructeurs/acteurs/enseignants dans ce processus de production.

La planification et la préparation.
Même si les technologies vidéo changent rapidement, le « storytelling » (la « mise en récit » en français) reste la clé du processus de production. L’écriture de scénario est intimement liée à la technologie utilisée pour fabriquer la version textuelle et/ou graphique de l’histoire racontée en vidéo. Des éditeurs de texte spécialisés pour l’écriture de scénario comme Celtx, Final Draft, Adobe Story, Montage, Scriptwar, Storyist, Scripped, Movie Outline peuvent être utilisés pour créer des scripts adoptant une norme, un standard industriel, notamment utilisé au cinéma, au théâtre, à la radio. Ces éditeurs, contrairement aux éditeurs de texte classique, permettent aux auteurs de gérer l’étiquetage et facilitent la décomposition de scripts en petites parties. Ils permettent l’inclusion et la différentiation des éléments visuels, de dialogue/narratifs, de jeu ou de performance d’acteurs, de temporalité, de description d’objets ou d’environnements voire même de métadonnées (commentaires, idées). Une autre fonctionnalité importante qui peut être utilisée est la co-construction du script : comme l’acte d’écriture implique généralement plusieurs auteurs/écrivains/créateurs de différents domaines, ces éditeurs offrent des fonctionnalités de synchronisation d’écriture en temps réel et à plusieurs, ce qui ouvre le champs de la pratique d’écriture collaborative.
Notre point ici est d’insister sur le fait qu’écrire un texte avec ce genre d’outils n’est pas un processus neutre. Cette utilisation façonne le processus de production du contenu pédagogique à travers plusieurs actions. En effet, ils formalisent les parties orales et produisent une certaine rationalité dans la vidéo induite par la préparation rigoureuse et détaillée de « l’acte de parler ». Cet acte peut alors perdre de son naturel et de sa spontanéité, ce qui constitue une transformation majeure et souvent largement sous-estimée. Ces outils divisent également le discours en des pièces bien délimitées et définies, une division qui peut être d’autant plus transformée pendant la phase de post-production (spécifiquement la phase de montage dans laquelle des parties peuvent être coupées). Ils se focalisent sur la production d’une narration sans s’interroger jusqu’à quel point l’histoire est supposée être auto-suffisante, ou potentiellement complétée ou ré-interprétée par les acteurs/instructeurs/enseignants et bien sûr par les étudiants au moment du visionnage de la vidéo – un aspect particulièrement sensible compte tenu de la massivité de la circulation des contenus dans un MOOC.
Cette forme d’information éducative doit manifestement se voir connectée aux rôles des enseignants, rôles qui ne se conforment pas avec leur façon habituelle de faire. En effet, certains vont laisser une marge importante à l’improvisation orale, improvisation basée sur un cadre qu’ils ont préalablement établi (des notes sur papier, un support de présentation, des répétitions multiples de fragments de discours…). D’autres ne voudront tout simplement pas écrire de script. Ceci est particulièrement vrai si le contenu pédagogique a été enseigné à de multiples reprises dans des salles de classe conjointement à l’utilisation d’outils comme PowerPoint ou Keynote. Enfin, la co-construction d’un script avec les outils activant cette fonctionnalité pose les problèmes classique et inévitables de l’écriture collaborative (Dourish and Bellotti, 1992).

La production : l’environnement
L’environnement naturel d’un enseignant pendant son activité est en grande majorité une audience dans une salle de classe, un amphithéâtre ou une salle de travaux pratiques. L’audience peut varier en nombre (de quelques dizaines à, parfois, des milliers) et l’hétérogénéité peut être contrôlée ou estimée (en terme de prérequis, dans un programme/parcours). Le lieu peut varier en taille, architecture ou organisation spatiale. Comme support pour l’écriture, de multiples tableaux sont utilisés : tableau blanc, noirs, papiers ; l’enseignant est d’habitude debout quand il écrit sur ces supports. Des téléviseurs ou des méthodes de projection (projection vidéo, projection d’un écran d’ordinateur, rétroprojection) sont utilisés comme support pour les présentations pour montrer des contenus à l’audience. La projection va de pair avec des logiciels de présentation comme PowerPoint, Keynote, Impress, Beamer, Prezi, Sozi pour visualiser l’information. Du fait de cette configuration, une séance est limitée en temps : de quelques minutes (par exemple, modèle des conférences TED) à quelques heures (cours magistraux dans les universités). Dans cet environnement et par la proximité physique avec l’audience, l’enseignant peut obtenir un feedback immédiat du public et peut par conséquent adapter ses explications en temps réel. Des enseignants se sentent d’ailleurs beaucoup plus à l’aise lorsqu’une dose d’interactivité et d’improvisation est impliquée dans leur discours.

La production : enregistrer l’environnement naturel
Un minimum d’une caméra et d’un microphone doit être utilisé pour capter la performance d’un enseignant dans son environnement naturel. Plusieurs caméras peuvent néanmoins être utilisées pour capturer différents angles/perspectives (pour voir l’atmosphère, l’audience, l’enseignant, les écritures, les projections etc..) et plusieurs microphones peuvent être utilisés pour enregistrer l’interactivité avec l’audience. Les caméras peuvent être soit fixes, soit manœuvrées par un cameraman (bougées en rotation, panoramique, zoom). Les microphones peuvent également être fixes (micros d’ambiance), installés sur l’orateur (micro cravate) ou distribués dans l’audience (micro standards).
Enregistrer l’environnement naturel avec une audience est généralement beaucoup plus difficile que prévu. Premièrement, la caméra fixe peut voir son champs de vision limité, ce qui peut couper des parties pertinentes de l’événement capté. L’utilisation de plusieurs caméras ou de caméras actionnées mobiles peut donner le même résultat problématique, ou pire : l’enregistrement de parties non pertinentes. En effet, certains caméramans se focalisent davantage sur un acteur qui bouge (ici, l’enseignant) au mauvais moment, par exemple quand le contenu pédagogique sur un tableau est d’une importance capitale. Les caméramans peuvent également zoomer ou enregistrer des parties qui sont hors de propos ou sans rapport à ce que l’enseignant voudrait souligner puisqu’il est, et on l’oublie souvent, très difficile de suivre l’intention pédagogique et de filmer en même temps. Si une méthode de projection ou un téléviseur sont utilisés, il peut y avoir des difficultés extrêmes d’enregistrement de l’écran ou de la surface de projection : problèmes d’éclairage, de réflexions lumineuses, d’ombres, de qualité médiocre, d’images détériorées ou souvent illisibles. De plus, si l’enseignant montre (avec un geste, avec son doigt, avec un pointeur) une zone d’intérêt particulière, il peut être difficile de suivre le mouvement ou parfois impossible si deux zones sont montrées simultanément (par exemple, pour expliquer un phénomène d’interaction entre deux zones). L’enseignant peut, de surcroît, obstruer le champ de vision de la caméra et doit parfois adapter sa position pour laisser la caméra filmer certaines parties importantes.
Le contact visuel joue un rôle important quand l’enseignant veut attirer l’attention sur un sujet : il regarde droit dans les yeux quand il parle, et cherche ou fixe des regards. Dans cette configuration, l’enseignant peut ne jamais regarder les caméras directement mais se focalisera beaucoup plus naturellement sur l’audience à la place. Ceci peut produire une vidéo très frustrante à regarder, dans laquelle l’enseignant semble avoir des yeux déviants ou dans le pire des cas des yeux avec un regard vide de sens. Les vidéos produites dans ce contexte peuvent également apparaître moins personnelles pour le spectateur à cause de cette sensation de distance accrue avec l’enseignant. En effet, il peut paraître manifestement plus intéressé par son audience que par les caméras elles-mêmes.
Concernant la très importante qualité audio, une discipline rigoureuse doit être établie avec l’audience si les interactions sont enregistrées. Chaque fois qu’un membre du public intervient oralement, le microphone doit être prêt, la personne doit parler clairement dedans, agripper correctement le microphone et doit donner son accord au préalable pour participer et être enregistré en vidéo. Bien sûr, tout ceci influence les attitudes, parfois même à des niveaux insoupçonnés, car le comportement humain est différent face à une caméra - une influence connue sous le nom d’“effet expérimentateur” (Constantinou et al, 2008). Enfin, l’enseignant et l’audience savent qu’ils doivent faire des efforts pour être enregistrés correctement ce qui modifie nécessairement leur comportement naturel.
Ainsi, l’enregistrement d’un environnement “naturel” d’enseignement ne peut pas se satisfaire d’une simple reproduction de l’agencement habituel de la salle de classe. Un grand nombre d’adaptations doivent être effectuées et ces adaptations ont un effet significatif sur le contenu du contenu pédagogique, sur le rôle de l’enseignant et sur le rôle des étudiants/de l’audience. Des difficultés parfois insoupçonnées émergent de chaque détail du dispositif technique nécessaire aux pratiques d’enregistrement en général. Des pratiques tacites (par exemple le contact visuel) acquièrent une tout nouvelle importance lorsque des processus d’enregistrement les modifient : ce qui était habituellement fluide et involontairement, inconsciemment intégré dans l’interaction d’enseignement devient maintenant un processus sophistiqué dont on prend conscience et qui induit des ajustements et des adaptations dont l’impact est fortement sous-estimé. Le rôle des enseignants et des étudiants est transformé, ainsi que la nature de l’information qu’ils échangent.

La production : Enregistrer l’environnement naturel sans audience
Avoir à enregistrer un événement impliquant des enseignants et la présence d’un public pour une audience en ligne (formation à distance) conduit à un conflit d’intérêt : délivrer un contenu éducatif à la fois pour des étudiants en ligne et pour une audience frontale (rythme différent, interaction possible, feedback temps réel). Avoir à enregistrer un événement impliquant des enseignants sans audience physique frontale déplace et focalise le centre d’intérêt : il devient plus important de délivrer un contenu éducatif à des étudiants uniquement en ligne. L’enseignant peut enregistrer à son propre rythme, plusieurs fois s’il le désire, et peut s’appuyer sur la phase de postproduction pour l’aider à choisir les meilleurs moments ou condenser son discours en coupant les longs passages, les parties hésitantes ou les cafouillages. La phase de postproduction consiste à améliorer, éditer et mixer différentes pistes (vidéo, audio, animation, graphiques…) : tout ce qui a été enregistré en phase de production est assemblé pour produire une séquence vidéo finalisée. Les erreurs peuvent être corrigées et des effets peuvent être ajoutés : effets vidéo, audio, musique. En outre, la vitesse d’écriture sur un tableau est beaucoup plus lente que la vitesse de lecture (orale ou cognitive). Cela signifie qu’il y a un compromis à faire entre la densité du contenu affiché et la parole ; entre l’explication et la cognition du spectateur. Sans une audience frontale réactive, l’enseignant n’a pas de possibilité de feedback en temps réel. Cela le force à être beaucoup plus imaginatif dans le but de détecter et d’éliminer toute ambiguïté possible dans le contenu éducatif. Ces ambiguïtés viennent de discours imprécis, d’illustration ou de gestuelle incertaines, d’exemples équivoques, à plusieurs sens (dont l’interprétation génère des représentations très différentes), de termes non définis, de concepts flous ou même d’écritures illisibles. A cause de la présence de la caméra et de l’absence de l’audience, l’enseignant peut paraître perdu dans son regard, en train de rechercher un contact visuel qui pourrait le rassurer alors même qu’il doit fixer directement la caméra. L’enseignant peut paraître perturbé de ne pas pouvoir accéder à une interactivité en temps réel pour poser des questions. Dans un MOOC, il doit, à la place, imaginer et transformer ces questions en QCM ou exercices complémentaires de la vidéo. Le feedback est alors beaucoup plus étalé dans le temps (asynchrone) car la seule façon d’y avoir accès est de mettre le contenu en ligne, d’inviter le public à son utilisation et de collecter suffisamment de données sur son utilisation. C’est seulement une fois ces étapes franchies que le travail analytique pertinent pour le feedback de l’enseignant peut démarrer : par exemple identifier une ambiguïté en relevant un grand nombre de questions reliées à une partie du contenu pédagogique.

La production : enregistrer en studio
L’enregistrement en studio repose sur un grand nombre d’instruments techniques permettant le captage de sons, mais aussi d’images du professeur et de son contenu pédagogique (supports de présentation, écritures, expérimentations scientifiques). Les instruments de captage vidéo comprennent des caméras de poche, des webcams, des cameras numériques pour le grand public, des caméras professionnelles, des dispositifs d’enregistrement de diffusions télévisées, des outils de capture d’écran (camstudio, camtasia, graps, screenflow, snagit…), des caméras portables (GoPro, Lunettes Google). Les instruments d’enregistrement audio comprennent des casques audio/micro bon marché, des webcams, des micros intégrés aux ordinateurs portables, des micros cravate, standard ou professionnels, des enregistreurs de poche ou encore des micros de table. La grande variété d’instruments de captage se combine à une diversité de supports d’écriture. Ces derniers englobent les supports bien connus (paper board, tableau blanc, tableau noir, mais aussi une simple feuille de papier filmée du dessus), mais aussi des outils plus sophistiqués. Parmi ceux-ci, on trouve les ardoises filmées du dessus, les tablettes (iPad, tablettes Android), les stylos numériques, les tablettes graphiques, les tableaux numériques interactifs. On peut ajouter à cette liste divers types d’écrans permettant de mettre en place des effets d’incrustation (fonds verts notamment), mais aussi l’ensemble du matériel de studio, comprenant téléprompteurs, caméras à bras robotiques, absorbeurs de sons, une grand variété de lampes et lumières (spots, lumière diffuse, lumière d’ambiance). Le studio peut inclure du mobilier comparable à ce qu’utilisent les médias professionnels, notamment télévisuels, mais aussi des aménagements spécifiques à la matière enseignée (du matériel de chimie, des oeuvres d’art ou des instruments de musique). Ces listes ne sont pas exhaustives, mais elles permettent d’identifier le grand nombre de combinaisons possibles entre les divers outils de captation nécessaires à la fabrication de vidéos pédagogiques. Chacune de ces combinaisons détermine fortement les possibilités d’action de l’enseignant et de l’étudiant, mais aussi la nature de l’information pédagogique transmise.
L’une de ces combinaisons, très répandue, consiste à limiter l’appareillage technique. Comme le font de nombreux MOOC, dans lesquels les enseignants sont filmés dans leur bureau, dans une bibliothèque ou sur un campus, le professeur peut utiliser ces endroits qui lui sont bien connus comme studio bon marché et relativement peu équipé. De nombreux MOOC utilise le bureau de l’enseignant, et guère plus qu’une webcam et un outil de capture d’écran - deux dispositifs aujourd’hui largement disponibles à un faible coût, et faciles à manipuler. Dans cette situation, la production de la vidéo consiste à capter le discours de l’enseignant par webcam, alors que celui-ci fait son cours en face de son écran (et est susceptible de faire des gestes ou de montrer tel ou tel objet devant la webcam) tout en déroulant sa présentation à l’écran (cette présentation étant enregistrée par un dispositif de capture d’écran). Ce sont deux vidéos qui sont alors créées : la vidéo enregistrée par la webcam, et la vidéo de capture d’écran. Les deux peuvent être diffusées simultanément en utilisant une division d’écran ou bien la technique PIP (“picture in picture”). Dans les deux cas, les deux espaces vidéo sont hermétiques l’un à l’autre. L’image de l’enseignant est située dans un des deux espaces, et celui-ci ne peut interagir physiquement avec l’autre espace, où est diffusée la capture d’écran (pour montrer de la main une zone importante par exemple). Ceci limite fortement les possibilités de démonstration pédagogique - un problème qui peut être résolu en utilisant un pointeur de souris pour désigner des zones sur la capture d’écran d’ordinateur, mais aussi des pointeurs intégrés dans les logiciels de présentations (PowerPoint ou Keynote donnent ainsi la possibilité d’utiliser un pointeur laser virtuel), ou encore des techniques de postproduction (permettant d’introduire des effets de surlignages, des flèches graphiques, des effets de “main invisible” - une main semi-transparente à travers laquelle on peut voir le contenu pédagogique utilisé - tels que mis en œuvre par les MOOC de l’EPFL ou ceux d’Udacity).
Comme on le voit, la situation la plus simple de l’enregistrement d’un cours vidéo se complique grandement dès que sont examinés les dispositifs nécessaires pour faire fonctionner l’interaction pédagogique. Des choix aussi anodins que celui d’une souris ou d’un pointeur se révèlent cruciaux pour permettre de produire dans la vidéo finale les effets de démonstrations attendus dans le contenu pédagogique. Si l’on suit les choix techniques possibles, on verra alors de nouveaux problèmes émerger, dont les effets sur la relation pédagogique sont significatifs. Par exemple, si l’enseignant utilise des supports d’écriture numériques (tels que stylos numériques ou tablettes), il est alors impossible de désigner physiquement les zones importantes (de la main ou par l’intermédiaire d’un pointeur physique), mais il est nécessaire d’employer un pointeur virtuel ou d’ajouter des marques d’écriture (en encerclant les zones concernées par exemple). Les pointeurs virtuels sont souvent difficilement discernables (des exemples bien connus comprennent les petits pointeurs utilisés dans les vidéos dites avec un “style Khan Academy”), ces pointeurs virtuels tentent de représenter l’emplacement d’une main ou d’un doigt mais sont souvent trop petits et presque invisibles. Les vidéos produites pour les MOOC sur la base des supports d’écriture traditionnels (paperboard, tableau blanc ou tableau noir) ou en filmant des feuilles de papier sur lesquelles écrit l’enseignant ont l’avantage de rendre visibles la main et le stylo du professeur, qui peut alors mettre en évidence physiquement des zones filmées, ce qui peut rendre l’explication plus fluide, notamment lorsque ce sont des mouvements ou des processus complexes qui doivent être commentés.
Dans un studio à l’équipement plus sophistiqué, l’utilisation d’outils professionnels comme les fonds verts (qui permettent de produire des effets de transparence), ou les téléprompteurs offrent certes une palette plus large d’options de démonstration visuelle. Cependant ils requièrent dans le même temps des compétences spécifiques de la part de l’enseignant, qui se trouve alors dans une situation de captage qui n’a rien à voir avec son expérience pédagogique habituelle. Dans ce dernier cas, l’agencement fonctionne avec un enseignant très spécifique, expert de techniques peu répandues dans le milieu éducatif. Si ces conditions ne sont pas remplies, l’effet sur le contenu des vidéos est immédiat, ce qui apparaît nettement dans certaines vidéos où l’enseignant tente de désigner du doigt une zone spécifique, avec la même difficulté que rencontrerait un présentateur météo inexpérimenté. Dans d’autres cas, on demande à l’enseignement de demeurer aussi immobile que possible de telle sorte qu’aucun contenu visuel important ne soit caché par ses mouvements. Enfin, la lecture de téléprompteurs est un exercice beaucoup plus difficile qu’il n’en a l’air, certaines personnes se sentant fortement perturbées ou désemparées si ce dispositif leur a été imposé sans formation spécifique.
La description des multiples choix techniques sur lesquels repose la production de vidéo en studio pourrait être poursuivie sans peine. Mais les éléments rassemblés ici sont suffisants pour mettre en évidence le fait que chacun de ces choix impacte directement les formes d’action de l’enseignant, le type de contenu pédagogique qu’il est capable de produire, et, dans un second cas, les usages possibles de ces vidéos. Non seulement chacun de ces choix est important, mais c’est aussi l’association entre eux qui est crucial : l’agencement ainsi produit détermine les possibilités d’intervention de l’enseignant. Par exemple, le degré de son immersion varie grandement avec la complexité de l’appareillage technique du studio - des instruments techniques complexes peuvent interférer dans les pratiques de l’enseignant au point de rendre impossibles l’emploi de ses techniques pédagogiques habituelles. Ceci peut avoir pour corollaire une redéfinition du contenu présenté, et, au final, rendre nécessaires de nouvelles compétences de la part de l’enseignant. Plus l’agencement devient complexe, plus la production d’une interaction pédagogique fluide requiert un réglage fin, et plus l’expertise de l’enseignant doit s’étendre vers des domaines techniques qui lui étaient auparavant peu familiers, ou être déléguée à d’autres (techniciens, spécialistes de la production vidéo, graphistes ou artistes). Au final, c’est la performance de l’enseignement qui peut elle-même être déléguée : dans certaines des vidéos que nous avons examinées, des acteurs sont engagés pour jouer le rôle de l’enseignant. Ce dernier cas est une situation extrême, où l’agencement permettant la production de vidéo en studio redéfinit radicalement le rôle et les pratiques de l’enseignant. Dans tous les cas, cet agencement n’est pas neutre, mais peut transformer les modes de l’interaction pédagogique.

V. CONCLUSION

L’usage des vidéos pour l’enseignement a été étudié avant tout sous un angle évaluatif qui ignore la variété des processus de production des vidéos, des pratiques éducatives, et, au final, des objectifs qui peuvent être assignés aux vidéos éducatives. Nous avons proposé de rendre compte de cette diversité en décrivant les options techniques disponibles pour la production de vidéo et leurs implications en termes de circulation et d’usage. Apparaît alors ce qui demeure souvent dans l’ombre des analyses d’évolutions pédagogiques comme les MOOC, c’est-à-dire l’infrastructure nécessaire à la production du matériel d’enseignement. Bien souvent ignorée par les travaux cherchant à évaluer l’impact des vidéos, elle est pourtant cruciale pour comprendre leur valeur pédagogique. Ainsi, les descriptions proposées dans les pages précédentes rendent compte des effets des choix techniques pour la production de vidéos sur les actions possibles des enseignants et des étudiants et sur les contenus éducatifs.
L’approche proposée ici ne fonde pas l’évaluation des vidéos sur des critères pré-définis comme la satisfaction perçue par les enseignants ou les étudiants, ou encore les « gains de connaissance ». Elle propose en revanche de mettre en relation les composantes des dispositifs sociotechniques avec les rôles et les pratiques des acteurs de l’enseignement. Elle suppose d’entreprendre une description détaillée des choix possibles au cours des différentes phases de la production de vidéos, de la préparation à la post-production. Son intérêt est de mettre en lumière les effets de diverses composantes de la fabrication du contenu éducatif, notamment l’espace dans lequel les vidéos sont produites, les outils numériques permettant de construire les récits vidéo, mais aussi des instruments ordinaires tels que les stylos, pointeurs ou feuilles de papier, qui équipent et contraignent les pratiques d’enseignement. Ainsi, la description des dispositifs sociotechniques qui rendent possible la production de vidéo permet de mettre en évidence le rôle crucial de ces composantes dans les redéfinitions de la pédagogie que des développements actuels comme les MOOC sont susceptibles d’introduire. En redéfinissant non seulement le contenu pédagogique mais aussi les compétences attendues de la part de l’enseignant, la production de vidéo pour les MOOC peut avoir des effets très profonds sur l’organisation des institutions d’enseignement. La description des agencements sur lesquels repose la production de l’interaction pédagogique est une porte d’entrée pour repérer certains de ces effets.

RÉFÉRENCES

Akrich, M. (1992). The de-scription of technical objects. In W. Bijker and T. Pinch (Eds.), Shaping technology/building society. Cambridge : MIT Press, pp. 205-224.

Armstrong, A. W., Idriss, N. Z., & Kim, R. H. (2011). Effects of video-based, online education on behavioral and knowledge outcomes in sunscreen use : a randomized controlled trial. Patient education and counseling, 83(2), pp. 273-277.

Bellantoni, P. (2005). If it’s purple, someone’s gonna die : the power of color in visual storytelling. Burlington : Focal Press.

Callon, M. (2004). Europe wrestling with technology. Economy & Society, 33(1), pp. 121-134.

Candarli, D., & Yuksel, H. G. (2012). Students’ perceptions of video-conferencing in the classrooms in higher education. Procedia-Social and Behavioral Sciences, 47, pp. 357-361.

Choi, H. J., & Yang, M. (2011). The effect of problem-based video instruction on student satisfaction, empathy, and learning achievement in the Korean teacher education context. Higher Education, 62(5), pp. 551-561.

Constantinou, M., Ashendorf, L., & McCaffrey, R. J. (2005). Effects of a third party observer during neuropsychological assessment : When the observer is a video camera. Journal of Forensic Neuropsychology, 4(2), pp. 39-47.

Dourish, P., & Bellotti, V. (1992). Awareness and coordination in shared workspaces. In Proceedings of the 1992 ACM conference on Computer-supported cooperative work. ACM, pp. 107-114.

Dupuis, J., Coutu, J., & Laneuville, O. (2013). Application of linear mixed-effect models for the analysis of exam scores : Online video associated with higher scores for undergraduate students with lower grades. Computers & Education. 66, pp. 64-73.

Eick, C. J., & King Jr, D. T. (2012). Nonscience Majors’ Perceptions on the Use of YouTube Video to Support Learning in an Integrated Science Lecture. Journal of College Science Teaching, 42(1), pp. 26-30.

Gershon, N., & Page, W. (2001). What storytelling can do for information visualization. Communications of the ACM, 44(8), pp. 31-37.

Hill, J. L., & Nelson, A. (2011). New technology, new pedagogy ? Employing video podcasts in learning and teaching about exotic ecosystems. Environmental Education Research, 17(3), pp. 393-408.

Jarvinen, M. K., & Jarvinen, L. Z. (2012). Elevating Student Potential : Creating Digital Video to Teach Neurotransmission. Journal of Undergraduate Neuroscience Education, 11(1), A6.

Kaufman, P. B., & Mohan, J. (2009). Video use and higher education : options for the future. Study funded by Copyright Clearance Center and conducted by Intelligent Television in cooperation with New York University. Retrieved from http://library. nyu. edu/about/Video_Use_in_Higher_Education. pdf.

Kay, R., & Kletskin, I. (2012). Evaluating the use of problem-based video podcasts to teach mathematics in higher education. Computers & Education, 59(2), pp. 619-627.

Klanten, R., Ehmann, S., & Schulze, F. (Eds.). (2011). Visual storytelling : Inspiring a new visual language. Berlin : Gestalten.

Lankow, J., Ritchie, J., & Crooks, R. (2012). Infographics : The power of visual storytelling. Wiley.

Latour, B. (1993). Petites leçons de sociologie des sciences. Paris : La Découverte.

Lee, F. (2008). Technopedagogies of mass individualization : correspondence education in the mid twentieth century. History and Technology, 24(3), pp. 239-253.

Lee, J. C. (2008). Hacking the nintendo wii remote. Pervasive Computing, IEEE, 7(3), pp. 39-45.

Leijen, Ä., Lam, I., Wildschut, L., Robert-Jan Simons, P., & Admiraal, W. (2009). Streaming video to enhance students’ reflection in dance education. Computers & Education, 52(1), pp. 169-176.

Lonn, S., & Teasley, S. D. (2009). Podcasting in higher education : What are the implications for teaching and learning ?. The Internet and Higher Education, 12(2), pp. 88-92.

McGarr, O. (2009). A review of podcasting in higher education : Its influence on the traditional lecture. Australasian Journal of Educational Technology, 25(3), pp. 309-321.

McGregor, J. (2003). Making spaces : Teacher workplace topologies. Pedagogy, culture and society, 11(3), pp. 353-377.

Schreiber, B., Fukuta, J., & Gordon, F. (2010). Live lecture versus video podcast in undergraduate medical education : A randomised controlled trial. BMC medical education, 10(1), p. 68.

Sherer, P., & Shea, T. (2011). Using online video to support student learning and engagement. College Teaching, 59(2), pp. 56-59.

Stark, D., & Paravel, V. (2008). PowerPoint in Public Digital Technologies and the New Morphology of Demonstration. Theory, Culture & Society, 25(5), pp. 30-55.

Tufte, E. R. (2003). The cognitive style of PowerPoint. Cheshire, CT : Graphics Press.

Tufte, E. R., & Weise Moeller, E. (1997). Visual explanations : images and quantities, evidence and narrative. Cheshire, CT : Graphics Press.

Winner, L. (1980). Do artifacts have politics ?. Daedalus, 109(1), pp. 121-136.

Yaneva, A. (2009). Making the social hold : Towards an Actor-Network theory of design. Design and Culture, 1(3), pp. 273-288.

Licence : Pas de licence spécifique (droits par défaut)

Vos commentaires

# Le 20 décembre 2016 à 17:06, par Olivier Berger En réponse à : Ouvrir la boîte noire de la production de vidéos pour les MOOC. Vers une analyse sociotechnique.

Cet article pointe effectivement des éléments importants.

Je pense qu’il serait également intéressant d’envisager des enjeux, la faisabilité d’une élaboration incrémentale des vidéos dans un processus de production collaborative.

Il n’est pas toujours faisable de produire un script au sein d’une équipe d’enseignants peu expérimentés et de séparer cette phase de conception de celle de la production des vidéos.

Or la nature volumineuse des vidéos qui rend difficiles les transfers (notamment sur des formats bruts - rushes) et la difficulté d’appropriation des outils de montage, ne facilitent pas le travail collaboratif, incrémental autour des vidéos.

La capacité à travailler de façon itérative pourrait aussi permettre une "maintenance" des vidéos pour adapter les contenus dans le temps (ou pour des usages multiples) de façon maîtrisée et à un coût raisonable.

Il reste du travail dans ces directions.