Cadres d’usage des données par des développeurs, des data scientists et des data journalistes
Porté par Elico (EA 4147), ce livrable n°3 est associé à la tâche D2.3 : « Results of inquiry of end users’ needs and practices, and usage scenarios ». Il présente les résultats de l’enquête auprès des réutilisateurs professionnels des données ouvertes, menée de février à avril 2017. L’objectif de ce travail a été triple : réutilisation des données. Le livrable qui résulte de cette enquête est organisé en trois parties. La première décrit le contexte et présente l’état de l’art sur les réutilisations des données ouvertes. La seconde explicite la méthodologie déployée dans la conduite de l’enquête et dans l’analyse des résultats. La troisième partie rend compte des résultats de l’enquête en présentant d’abord les spécificités de données utilisées et en analysant ensuite la chaîne de traitement de données par des développeurs, des data scientists et des data journalistes interviewés. Enfin, la synthèse, disponible à la page 41, met en exergue des points à prendre en compte pour favoriser la réutilisation des données ouvertes par des professionnels des données. disposition d’informations mais également de données ouvertes et réutilisables. Les cadres législatif et administratif de l’open data ont été récemment définis par plusieurs lois1 et par le Plan d’action national 2015‐20172.
Bien qu’elle soit un des éléments clefs des discours d’accompagnement de l’ouverture des données, la notion de réutilisation reste mal définie, aussi bien par les acteurs publics que par les entreprises du numérique ou les chercheurs, chacun investissant cette notion ouvertes par différentes organisations privées, ce rapport souligne l’inadéquation entre l’offre de données et les jeux de données les plus utilisés. Le document appelle les administrations publiques à mieux aligner l’offre et invite les entreprises à davantage communiquer autour des réutilisations réussies des données ouvertes. Les deux enquêtes de terrain conduites dans le cadre de cette ANR ont cherché à comprendre le contexte et les pratiques de réutilisation des données ouvertes. La première enquête menée de septembre 2015 à juin 2016 se focalisait sur des réutilisateurs des données liées à la mobilité du portail des données métropolitaines data.grandlyon.com. Les La notion de cadre d’usage qui est au centre de ce livrable vient des travaux de Patrice Flichy ; il distingue un « cadre de fonctionnement », qui renvoie aux fonctionnalités de l’objet et à l’usage technique, et un « cadre d’usage », qui se réfère à l’usage social. Les deux chaque réutilisateur est porteur d’une histoire parallèle, liée à son propre écosystème et à ses propres finalités que nous tentons de saisir par notre enquête de terrain. Pour ce faire, nous avons décliné le cadre d’usage en trois catégories que nous avons tentées de saisir à(1995).« L’action dans un cadre sociotechnique. Comment articuler technique et usage dans une même analyse? ». In : Les autoroutes de l’information, un produit de la convergence, J.‐G. Lacroix et G. Tremblay (Eds.), Sainte‐Foy, Presses de l’Université du Québec, p. 405‐433 ; Flichy, P. (1995). L’innovation technique. Récents développements en sciences sociales vers une nouvelle théorie de l’innovation, Paris, La Découverte ; Flichy, P. (2008). « Technique, usage et représentations », Réseaux, vol.2, n° 148‐149), p. 147‐174. DOI : 10.3917/res.148.0147. URL: https://www.cairn.info/revue‐reseaux1‐2008‐2‐page‐147.htm; Flichy, P. (2013). « Rendre visible l’information. Une analyse sociotechnique du traitement des données », Réseaux, vol. 2, n° 178‐179, p. 55‐89.
mené une série d’entretiens semi‐directifs avec différents réutilisateurs professionnels des données en portant une attention au type de données utilisées, à la chaîne du traitement des données, aux outils et aux technologies utilisés, aux spécificités d’utilisation des données en temps réel et enfin aux différentes modalités d’utilisation des données (ANNEXE 1. GUIDE D’ENTRETIEN). De février à avril 2017, V. Dymytrova et V. Larroche ont conduit 26 entretiens semi‐directifs d’une durée moyenne de 45 minutes ce qui est une gageure avec des professionnels dont le temps est compté. Figure 1. Répartition des interviewés par catégorie socio‐professionnelleLes professionnels interrogés ont été identifiés par deux moyens : certains noms ou entreprises nous ont été suggérés par les interviewés de l’enquête 2016, d’autres ont été Parmi les personnes interrogées, nous comptons 7 développeurs ; 6 data scientists/analystes, 6 data journalistes, 3 fournisseurs de portails et 4 personnes‐ressources le chargé de mission Développement Numérique à la Région Rhône‐Alpes‐Auvergne ; le chef de projet Opendata de la Métropole de Grenoble ; le chargé de mission Innovation numérique au Tubà et les fondateurs de la coopérative Datactivi.st (cf. Figure 1). Tous les entretiens ont été enregistrés et ont fait l’objet de verbatim. L’analyse qualitative effectuée comprend les codages thématique et axial des propos des interviewés. Par rigueur scientifique, les entretiens ont été anonymisés, seuls le métier et le type d’organisation/d’entreprise seront ici mentionnés afin de rendre compte de la diversité des parcours et des situations des interviewés, issus de mondes socio‐professionnels hétérogènes.