La fracture numérique des big data

Article intéressant sur InternetActu à propos du grand bond de l'analyse de données sur le web ; par danah boyd et Kate Crawford.

On y retient surtout que les données ne sont pas si valides qu'on le voudrait et que, de ce fait, il est nécessaire de réaliser un grand travail de nettoyage avant de pouvoir les exploiter.

Ainsi, non seulement les résultats peuvent s'avérer approximatifs de part un enregistrement incomplet ou partiel, mais en plus tous les scientifiques (ou journalistes) pourraient ne pas y avoir accès.

En définitive, la difficulté et le coût de l’accès aux données des Big Data aboutissent à une culture étriquée des résultats de recherche. Les grandes entreprises de données n’ont aucune obligation de rendre leurs données disponibles, et ont un contrôle total sur le choix de ceux qui y accèdent. Les chercheurs du champ des Big Data qui ont accès à ces jeux de données propriétaires sont moins susceptibles de choisir des questions qui pourraient être litigieuses pour une société de médias sociaux, par exemple, s’ils pensent que cela peut aboutir à l’interruption de leur droit d’accès. Les effets dissuasifs sur les types de questions de recherche qui peuvent être posés – en public comme en privé – sont une chose dont nous devons tous tenir compte pour évaluer l’avenir des Big Data.

Ce qui pose donc la problématique des conclusions qu'on pourrait en avoir. Conclusions qui alimenteraient toutes nos réflexions sur l'usage des médias sociaux (ou du web en général) et influenceraient certaines écoles de pensées.

Lire Big Data : la nécessité d’un débat.