La quantité croissante de données est un phénomène largement documenté. L'expansion des sources, des catégories et des formats de données massives (big data), de même que l'extension des domaines de recherche qui s'y rattachent, occupent une panoplie de chercheurs universitaires. Les sciences sociales sont d'ailleurs au centre de ce mouvement. Le défi d'offrir, en une perspective distincte, une description et une explication sociologique d'un tel phénomène en constante adaptation demeure néanmoins à combler. Ce recueil d’études sous la direction de Menger et Paye –issu d'un colloque tenu à Paris en 2014– propose un portrait préliminaire de la science des données massives selon une perspective sociologique inédite, d'héritage et d'influence française. Il constitue, en ce sens, une contribution originale quoique marginale au débat épistémologique sur les transformations induites par les données massives en sciences sociales.
Les auteurs de cette collection de textes proposent effectivement des recherches axées sur les historiques et les évolutions paradigmatiques qui traversent les domaines de la pratique scientifique et commerciale des data sciences. La plupart des essais de cette collection brossent notablement un portrait plutôt sombre d'une structure insidieuse qui transforme non seulement les données en produits commerciaux mais également les utilisateurs et les internautes en travailleurs soumis à une forme d'aliénation nouvelle, celle de la « manipulation des besoins individuels par le marché » (13). Ce constat est celui de Guillaume Tiffon qui propose, dans son chapitre sur la sociologie du travail informatique, de repenser l'analyse de la production des big data dans une perspective marxiste d'aliénation et d'assujettissement plutôt que d'exploitation d'une plus-value (78). L'usage des données, défend-il, ne correspond plus à une pratique productive –envisagée de manière fonctionnaliste– mais plutôt à une pratique commerciale foncièrement asymétrique et inégale entre producteurs « initiés » et consommateurs « non-initiés ».
La plupart des études qui composent ce recueil soulignent d'une manière ou d'une autre cette tension qui régit l'infrastructure précaire et mal réglementée des données massives. Entre commercialisation et science—les deux dimensions étant elles-mêmes souvent emboitées l'une dans l'autre—le phénomène big data, comme le souligne P-M. Menger, « fait voir à la fois comment augmente le nombre d’éléments d'un environnement générateur d'informations relationnelles traçables (le thème des objets connectés/capteurs), et comment se transforment les comportements des individus (humains et non humains) qui sont de plus en plus massivement émetteurs et récepteurs d'informations traçables » (9).
Or, le thème central de la sécurité des données, de la confidentialité personnelle au regard de la « quantification massive des individus » est assurément l'angle mort lourd de ce recueil. Les contributions éthiques manquent gravement à la réflexion déployée. Les lacunes sont principalement notables en ce qui a trait à l'exploitation d'un nombre pourtant non négligeable de recherches, principalement américaines, qui se sont récemment intéressées à la façon dont la confidentialité s'articule et se transforme au gré des évolutions technologies (voir Acquisti, Brandimarte & Loewenstein, 2015; Barcenilla & Bastien, 2009; boyd & Crawford, 2012; Keller, Shipp & Shroeder, 2016; Lazer & Radford, 2017).
Au-delà de ces considérations, l'intérêt marqué pour les pratiques sociales concrètes et les logiques souterraines qui les motivent traverse l'ouvrage. Le « défi démocratique » (13) du phénomène big data, particulièrement un défi qui vient de paire avec celui de la confidentialité est abordé de façon cruciale. Bernard E. Harcourt est ainsi l'un de ceux qui soulignent la manière dont la mutation de la connaissance à l’ère du numérique interroge la relation libérale traditionnelle entre l’État, la politique et l’économie (51). Le défi démocratique devient par le fait même un défi sécuritaire : l'accumulation de données menace l'anonymité citoyenne et assure aux détenteurs (privés et publics) de ces données un pouvoir de prédiction individualisé. Les essais de ce recueil laissent ainsi transparaître, avec justesse, l'idée que la marchandisation des données personnelles représente le défi premier des sociétés numérisées. La sociologie européenne rejoint par ailleurs de cette manière les conclusions éthiques Quasi unanimes d'outre-Atlantique.
Cette contribution éclectique remplit donc sa fonction en proposant une ouverture essentielle vers une compréhension sociologique de ce phénomène tant étudié et pourtant élusif. Menger, Paye et leurs collaborateurs nous proposent en effet un itinéraire socio-épistémologique qui mérite d’être parcouru. En plus des complémentarités évidentes avec les travaux (de nature plus éthique) réalisés dans le monde anglo-saxon, cet ouvrage ouvre une perspective structuraliste inédite dont l'attachement profond à la sociologie du travail et des hiérarchies sociales est rafraichissant. La redéfinition et la reconceptualisation de notions fondamentales selon cette perspective permettent par le fait même d’élargir le champ toujours croissant de la recherche sur la science des données.