Data : nerf de la guerre et source d’effervescence des Big Data

buste de Nicolas Boileau par François Girardon Source : photo cc WIKIPEDIA« Avant donc que d’écrire, apprenez à penser.
Selon que notre idée est plus ou moins obscure,
L’expression la suit, ou moins nette, ou plus pure.
Ce que l’on conçoit bien s’énonce clairement,
Et les mots pour le dire arrivent aisément. »

Nicolas Boileau (1674, l’Art poétique)

Et si on parlait simplement des Big Data ?

Et il n’avait pas complètement tort. Ma soeur – même elle ! – qui a tout à fait oublié d’être idiote, m’a encore dit qu’elle ne comprenait à peu près rien à ce que je faisais. Je vais donc essayer de lui expliquer mon projet : la #data.

data

Novlangue

Avec un peu d’habitude, d’expérience et de pratique, il est très facile de jargonner une espèce de novlangue absolument horrible et d’enchainer des mots vides de sens. Certains en font un métier, pas toujours par goût. D’autres en font un art. D’autres, encore, s’en servent pour s’inventer une crédibilité, cachant derrière des écrans de fumée la platitude de leurs propos. C’est une tendance générale, je n’invente ni ne découvre rien.

Le monde de la #data n’échappe à la règle. A se demander s’il n’y pas une volonté de confiscation du sens, d’escamotage du réel derrière ce jargon. Jargon qui se couple aisément avec celui concernant les startups, soit dit en passant. Si, entre spécialistes, il est tentant, voire pratique, de parler boutique et d’échanger par mot-clés, quand on s’adresse à des interlocuteurs qui ont fait l’habile choix de ne pas consacrer 10h/jour aux mathématiques appliquées et à l’informatique, il convient de clarifier.

Incommunicabilité

Pourquoi en parler ? Car l’incommunicabilité rode. Quand on se consacre à la recherche scientifique, on renonce à parler de son travail avec ses proches. Cas classique qui amène soit à se couper du monde, les matheux sont très forts à ce petit jeu, soit à faire l’effort de traduire et trouver des images pour, tout de même, avoir quelque chose à raconter.

Depuis ma conversion au monde de l’exploitation massive de la donnée d’entreprise, je rencontre des problématiques similaires ; moins complexes certes, car je n’ai plus besoin de dessiner des trucs moches sur des tableaux, mais tout de même, expliquer avec les mains le (probable) fonctionnement d’un algorithme, c’est souvent périlleux. Et faux, au final, le réel est taquin et tend des pièges à qui théorise trop. S’il est facile de se réfugier derrière des mots compliqués et de faire son malin, il n’en résulte pas forcément grand chose d’intéressant dans le cadre d’une discussion, d’un échange : à part faire passer son interlocuteur pour un idiot, qu’il n’est évidemment pas, sous prétexte qu’il ne lui parait pas a priori évident d’augmenter la dimension de l’espace métrique pour simplifier un calcul, utiliser l’argument d’autorité technique ne sert à rien. D’ailleurs, qui est réellement intéressé par ce genre de choses ?

data

En quelques mots

Les données (data), ce sont des chiffres, des mots, des images. Une base de données, c’est une façon de stocker des données, de les ranger de façon structurée. Les données sont le nerf de la guerre et la cause de toute l’effervescence des dernières années autour du Big Data (données massives) : les entreprises, suivant l’exemple des nouveaux géants que sont Google. Amazon, Facebook, Amazon (GAFA) et leurs pendants chinois BATX (Baidu, Alibaba, Tencent et Xiaomi), sont aujourd’hui convaincues qu’elles étaient en danger si elles n’exploitaient pas leur bases de données. Double sentiment : la donnée est stratégique et source de danger.

Manichéisme ? Religion ? Les comportements ne sont pas toujours logiques. Le fait est que de nombreux outils sont apparus (1), spécialisés sur le traitement d’énormes masses de données ; et techniquement, couvrant tout le spectre entre la plomberie avancé et les systèmes experts. De nombreux vendeurs, conseillers, communicants, architectes logiciels, etc. se réfugient derrière cette complexité technique et une certaine difficulté conceptuelle pour sur-dimensionner les réponses, gonfler les factures, grossir les projets. La dynamique s’auto-entretient.

Imposture ?

Alors, me dirait ma soeur, avec tout le bon sens qui, s’il est d’adoption, n’en reste pas moins angevin : « donc tu vends du vent, toi aussi mon frère, tu escroques le chaland ? ».

Non, évidemment. Notez que je devrais, car ça paie mieux et c’est moins fatiguant.

Développer des programmes pour analyser et traiter des données, ça n’a rien à voir avec les discours frénétiques sur l’innovation ou la disruption digitale.

(1) Note: HadoopMapReduce, Spark, bases noSQL, etc.

Data : nerf de la guerre et source d’effervescence des Big Data was last modified: avril 5th, 2017 by Thomas Gerbaud
Thomas Gerbaud

Thomas Gerbaud

(re)Dresseur de données chez Ocean Data
Centralien, physicien et data scientist aguerri aux plasmas de fusion magnétique, Thomas Gerbaud livre ses réflexions d'expert et de praticien de la #data.
Thomas Gerbaud

Votre avis nous intéresse :