Innovation Pédagogique
Institut Mines-Telecom

Une initiative de l'Institut Mines-Télécom avec un réseau de partenaires

N° 24 | Data Paper : émergence d’une nouvelle donne scientifique

Un article repris de http://journals.openedition.org/rfs...

Questionner les politiques publiques en éducation aux médias et à l’information

Dossiers RFSIC à paraître

Coordination Gérald Kembellec, Olivier Le Deuff

Le Contexte

Les Sciences dites “dures” sont équipées de protocoles qui les amènent à récolter et parfois publier leurs données d’expériences à des fins d’analyses et de reproductibilité, ce bien sûr, quand les enjeux de concurrence le permettent.

Les sciences sociales ne sont pas en reste, avec des données d’enquêtes qualitatives et quantitatives qui une fois dépouillées, normalisées et formalisées seront traitées avec des méthodes statistiques pour répondre à des problématiques disciplinaires. Si les données de sondages et d’enquêtes quantitatives peuvent être facilement publiées une fois anonymisées, il n’en va pas de même pour les données d’entretiens qui à de rares exceptions n’ont pas vocation être publiées [1].

Les initiatives en sciences humaines sont plus rares, notamment parce que les démarches sont diverses, mais aussi parce que la culture est plutôt de soigner la forme écrite finale au point de ne pas encombrer le lecteur d’éléments supplémentaires. Cependant les démarches de scientificité qui s’emparent des sciences humaines depuis l’avènement des humanités numériques et l’intégration des outils de traitement massif de corpus provoquent des mutations de pratiques de diffusion des résultats et matériaux de la recherche.

À partir des années 2010, les instances de financement de la recherche se sont saisies de la question des données en Europe, avec l’ANR dans le cas spécifique de la France. Ainsi, depuis 2012, l’Europe a sensibilisé les chercheurs à l’intégration des problématiques de gestion des données avec les appels Horizon 2020. La France, dans sa volonté de s’inscrire dans une transformation numérique a proposé un cadre général avec la loi pour une république numérique en 2016 qui a trouvé son écho dans le monde scientifique avec le Comité pour la science ouverte (CoSO) et la Bibliothèque Scientifique Numérique (BSN) (Rebouillat, 2019). De plus, comme Horizon 2020, l’ANR réclame systématiquement un plan de gestion de données pour les projets financés depuis 2019. Les questions qui y sont débattues portent bien évidemment autant sur les pratiques des chercheurs avec des études que sur le partage lui-même : que partager, pour qui et comment partager, qui s’en charge et pour quel bénéfice ?

L’objet data paper

De même que les pratiques de recherches se transforment, l’éditorialisation scientifique connaît des évolutions successives opportunes dans lesquelles se situent les publications qui prennent en compte la question des données. Les Data Papers s’inscrivent dans ces nouvelles logiques qui consistent à publier non seulement les résultats de la recherche, mais aussi les données sur lesquelles reposent les analyses (Schöpfel & al., 2019). Les SHS ont leur place à prendre dans ce mouvement. En effet, les elles se sont toujours construites sur des formes de données que sont au premier titre, les formes documentaires, des premières bibliographies aux publications scientifiques.

Le data paper et les SIC

En ce qui concerne les SIC, la démarche apparaît comme un retour aux fondamentaux disciplinaires. Paul Otlet recommandait le développement de nouveaux outils et de nouveaux traitements en 1934 : « L’Humanité est à un tournant de son histoire. La masse des données acquises est formidable. Il faut de nouveaux instruments pour les simplifier, les condenser ou jamais l’intelligence ne saura ni surmonter les difficultés qui l’accablent, ni réaliser les progrès qu’elle entrevoit et auxquels elle aspire. » (Otlet, 1934)

Pour surmonter cette masse de données, rien qu’en ce qui concerne les domaines scientifiques, il apparaît opportun d’opter pour une bonne gestion documentaire des données produites afin d’assurer leur conservation, leur interopérabilité et leur accessibilité.

Les enjeux et usages

Les enjeux de la science ouverte (Open Science) et du libre accès aux publications scientifique se prolongent donc par la mise à disposition des données de la recherche (Open Research Data), mais pour provoquer des usages et des citations, le simple partage ne suffit pas : il faut des données qualifiées répondant à des standards de formalisme. Les principes des FAIR (findability, accessibility, interoperability, and reliability) data (Wilkinson, 2016) sont désormais reconnus et défendus par plusieurs institutions parmi lesquelles figurent notamment les bibliothèques.

Dans ce cadre, les sciences de l’information et de la communication apparaissent bien situées pour étudier les problématiques des enjeux de qualification, de documentation, de communicabilité des données de la science et de la communication scientifique dans ses formes renouvelées.

Une datalogie

Pour ce dossier, nous sollicitons donc des contributions qui privilégient donc la forme du data paper. Ici, il n’y a pas de thématique imposée, si ce n’est que le sujet d’étude doit être un sujet abordé par les sciences de l’information et de la communication.

Nous souhaitons valoriser, dans ce dossier, les travaux qui s’inscrivent dans l’open fair science et qui permettront des pistes de réutilisation des matériels de données qui seront fournies. Nous veillerons également à ce que les processus méthodologiques soient clairement définis et détaillés pour comprendre l’obtention des données et les conditions potentielles de leur réutilisation. Le dossier est ouvert à une diversité d’approches. Il existe en effet plusieurs types de data papers et les SIC n’ont pas intérêt à une uniformité en la matière tant la discipline est riche en approches et en méthodologies.

Bibliographie

Commission européenne (2016). H2020 Program : Guidelines on FAIR Data Management in Horizon 2020. Version 3.0. http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-data-mgt_en.pdf

Kembellec, G. (2019). Produire, analyser et partager des données ouvertes en Humanités Numériques  : Quelques bonnes pratiques. 12ème Colloque international d’ISKO-France, Données et mégadonnées ouvertes en SHS  : de nouveaux enjeux pour l’état et l’organisation des connaissances  ? https://hal.archives-ouvertes.fr/hal-02306958

Le Deuff, Olivier (2016). « Anatomie et nouvelle organologie de l’édition ouverte », Revue française des sciences de l’information et de la communication 8,2016, DOI : https://doi.org/10.4000/rfsic.1871

Otlet, Paul. (1934). Traité de documentation. Le livre sur le livre. Bruxelles : Palais Mondial.

Rebouillat, V. (2019). Ouverture des données de la recherche  : De la vision politique aux pratiques des chercheurs. Thèse de doctorat du Conservatoire national des arts et métiers, Paris.

Schöpfel, J. (2018). Hors norme ? Une approche normative des données de la recherche. In. Revue Communication, Organisation, Société du Savoir et Information. https://revue-cossi.info/numeros/n-5-2018-processus-normalisation-durabilite-information/730-5-2018-schopfel

Schöpfel, J., Farace, D., Prost, H., & Zane, A. (2019). Data papers as a new form of knowledge organization in the field of research data. Consulté 17 décembre 2019, 12ème Colloque international d’ISKO-France  : Données et mégadonnées ouvertes en SHS  : de nouveaux enjeux pour l’état et l’organisation des connaissances  ? https://halshs.archives-ouvertes.fr/halshs-02284548

Urfist Méditerranée & INRA. (2018, mai 28). Le contenu d’un data paper. Consulté 14 décembre 2019, à l’adresse Doranum website : https://doranum.fr/data-paper-data-journal/contenu-data-paper/

Wilkinson, Mark D. ; Dumontier, Michel ; Aalbersberg, IJsbrand Jan ; Appleton, Gabrielle ; et al. (15 March 2016). “The FAIR Guiding Principles for scientific data management and stewardship”. Scientific Data. 3 : 160018. doi :10.1038/sdata.2016.18.

Modalités de soumission des contributions

Les articles doivent être soumis au plus tard fin septembre 2021 sous la forme d’un texte de 35 000 signes maximum (espaces et bibliographie compris, 5 mots-clés, un titre) aux adresses suivantes : oledeuff@gmail.com et gerald.kembellec@gmail.com (vous recevrez un accusé de réception).

Dans l’article, il vous est demandé de respecter l’anonymat, y compris s’il est fait référence à des publications antérieures du ou des auteur.e.s. Les articles seront évalués en double aveugle. Les propositions peuvent être rédigées en anglais ou en français.

Le guide pour la rédaction des articles est à consulter sur le lien suivant : https://journals.openedition.org/​rfsic/​401 - Merci de le respecter scrupuleusement.
Calendrier

Envoi des textes pour évaluation : fin septembre 2021

Notification de l’évaluation : fin novembre 2021

Remise des textes définitifs : fin décembre 2021

Publication prévue : mi-janvier 2022.

Licence : CC by-nc-sa

Notes

[1Ex. Réseau Quetelet : réseau français des centres de données pour les sciences sociales http://www.reseau-quetelet.cnrs.fr/spip.

Répondre à cet article

Qui êtes-vous ?
Ajoutez votre commentaire ici

Ce champ accepte les raccourcis SPIP {{gras}} {italique} -*liste [texte->url] <quote> <code> et le code HTML <q> <del> <ins>. Pour créer des paragraphes, laissez simplement des lignes vides.

Suivre les commentaires : RSS 2.0 | Atom