Qu’est-ce que le Big Data ?

Internet offre une profusion de données accessible par un grand nombre de personnes, c’est même son rôle principal. Ces données sont sous forme texte, image, son, vidéo. Chaque source de données peut avoir des formats différents : le texte par exemple, peut être représenté sous forme HTML (utilisé en majorité)  mais également sous forme de fichiers, PDF, Doc, XLS, base de données, etc…, c’est également le cas pour les images (Jpeg, PNG, Gif, ai, eps…) son et vidéo (MP3, MP4, AVI, Mov…). Dans les grandes entreprises, la multitude de données et notamment les bases clients, sont disséminées entre leurs différents sites ou filiales et ces bases ne sont pas toujours corrélées entres elles, ainsi que tous les fichiers hébergés sur les postes de travail et serveurs.

Pour lire et interpréter ces différents formats, votre browser est capable de lire une partie de ces formats mais certains ne peuvent être lus que par l’ajout de plugin (ajout d’un composant spécifique dans votre browser) ou par le biais de logiciels complémentaires (logiciels métiers et support, bureautique, client base de données, retouche image, lecteur son et vidéo…). Il a donc été développé des logiciels capables de récupérer les informations choisies sur une multitude de format afin de constituer une base de données exploitable par ceux-ci pour l’analyse (généralement NoSLQ pour les puristes). De nouveaux métiers sont apparus tels que Data scientist, Chief Data Officer (CDO), Data Analyst…La liste des métiers de l’informatique devient longue.

Le principe du Big Data est donc de pouvoir capturer, rechercher puis analyser l’ensemble de ces formats sur une quantité importante de données. Et les premiers à disposer d’une base gigantesque de données sont bien sûr les moteurs de recherche (Google, Yahoo, Bing…) et les réseaux sociaux (Facebook, twitter, LinkedIn, YouTube…). Les grandes entreprises ne sont pas en reste, une profusion de logiciels spécifiques dédiée Big Data permet de récupérer les données internes et également les données externes par le biais d’API (Application Program Interface). Ces interfaces communiquent avec différentes bases de données fournies par certains géants d’Internet et notamment Facebook (nous allons en venir plus loin…). Ces entreprises peuvent alors analyser leurs propres données mais également accéder aux données externes mises à disposition par ces géants d’Internet.

A titre d’exemple, lorsque vous faite une recherche sur un symptôme d’état grippal sur Google, ce dernier récupère votre question. Par ce biais, grâce aux différentes personnes ayant la même ou recherche similaire, il est possible pour Google de suivre la demande dans une région, un pays. Ainsi, Google peut estimer de sources sûres, un pic d’épidémie, sa progression et évolution à travers le monde.

Autre exemple, une société d’assurance dont je tairai le nom, analyse ses clients sur les réseaux sociaux et en fonction d’un événement heureux annoncé fièrement par le client sur Facebook par exemple, cette assurance peut proposer un avenant au contrat pour prendre en compte le ou la petite dernière.

Le Big Data est avant tout un outil permettant aux entreprises de mieux cibler les clients existants ou potentiels. Son application peut également mieux servir les populations, tout dépend ce que l’on en fait.

Alors, le Big Data, bénéfique ou pas ?

Dans un premier temps, cela peut paraître louable, le fait par exemple de suivre l’évolution d’une épidémie à travers le monde peut permettre de faire réagir les organisations de santé afin de prévenir une population.

Pour une société qui veut augmenter ses revenus en proposant des contrats ciblés pour ces propres clients pourquoi pas, c’est un principe tout comme le sont le marketing, la publicité. Mais cela peut être dérangeant pour certains d’entre nous car cette société s’immisce dans votre vie privée. Donc, tout dépend de ce que l’on diffuse sur Internet. Si vous recevez une proposition commerciale en vous étonnant que c’est exactement une offre qui correspond à votre situation, ne vous interrogez plus ou du moins, cherchez la source de ces informations.

Vous avez bien compris, le bénéfice va aux faiseurs de services et produits, rarement au client final.

Tout comme la publicité qui s’adresse à tous, le Big Data sert essentiellement à vendre mais en ciblant plus précisément, ce qui est bien plus rentable. Si je reviens à Google, la recherche d’une évolution d’une épidémie est louable pour l’humanité, tant que ces données vont essentiellement fournir les organisations de santé. Pour une société pharmaceutique, cela lui permet de produire exactement la quantité de médicament dans une région, un pays et c’est plutôt positif, mais elle peut aussi provoquer la rareté pour augmenter ses prix lors du pic. Tout dépend de l’éthique de la société.

Alors Big Brother ? (1984 – roman d’Orwell)

Si l’informatique qui je le rappelle est la technologie de l’information, nous permet avant tout de traiter et recevoir les informations nécessaires à notre curiosité, bien-être et notre efficacité. Peut-on craindre avec le Big Data une dérive si cette technologie est détournée de sa vocation première ?

Ne soyons pas dupe, le Big Data sert à vendre, comme beaucoup de technologies, ce qui peut déranger, c’est la possibilité de « fouiller » dans notre vie privée étalée sur Internet.

Lorsque j’ai créé mon compte sur Facebook, j’ai été sidéré que l’application soit capable de me proposer comme ami, des personnes que je connaissais parfois à peine et dont je n’avais plus de contact depuis bien longtemps (l’algorithme Big Data ayant cherché les sources sur LinkedIn, google, divers sites Web…), j’avoue que c’est toujours bluffant de voir les traces sur lesquelles nous pouvons laisser des informations mêmes infimes.

Facebook est le premier à s’être fait prendre officiellement la main dans le pot de confiture, avec l’affaire Cambridge Analytica. Cette société a pu connaître l’orientation politique d’un panel de population (env 87 millions d’utilisateurs d’analysés quand même ! – source le Monde), pouvant aider un certain candidat politique à mieux cibler cette population. Facebook avait-il la connaissance du but de cette entreprise ? Je vous laisse juge du potentiel malfaisant non seulement politique, mais que dire d’un état despotique pouvant avoir recours à ces données.

En résumé, utiliser les moteurs de recherche, les réseaux sociaux demandent un peu de bon sens. Même si ceux-ci peuvent vous garantir la confidentialité, les législations ne concernent que le pays ou vous résidez et sont différentes à chaque frontière, et bien sûr, Internet n’en n’a pas. Tout dépend donc des engagements que prennent les entreprises Internet avec vos données. Si les moteurs de recherche et les réseaux sociaux sont gratuits, ils faut qu’ils trouvent leur source de revenu, pour les moteurs de recherche, sa base est de mettre en avant les entreprises payant au clic suite à la recherche par un mot clé (c’est pour ça que vous voyez toujours en premier les sites avec le mot annonce, voir Adwords pour google). Pour les réseaux sociaux, la source de revenu, c’est vous ou plus précisément vos données. Vu les résultats fnanciers de ces sociétés ça marche plutôt bien.

N’oubliez pas que toutes les sociétés sont là pour gagner de l’argent, c’est le principe de l’économie, et si vous pensez que le fait de la gratuité d’utilisation est un gage d’honnêteté sans but mercantile, vous vous trompez (lire les conditions d’utilisation, mais qui le fait ?).

N’étalez pas votre vie personnelle sur Internet sans être sûr d’un mauvais effet retour, c’est ma simple recommandation, c’est néfaste lors d’un recrutement par exemple, il y a longtemps que les DRH ou recruteurs fouillent le web et les comptes de réseaux sociaux. Et le droit à l’oubli absolu est complexe à obtenir voire impossible. Si vous demandez à Facebook par exemple d’effacer votre compte, c’est possible, mais vos posts partagés vers d’autres “amis”, vers d’autres sites web ou bases de données contituées avant votre demande, ne sont pas de la responsabilité de Facebook, donc vous gardez des traces.

Bien sûr, ce n’est que mon avis. Je n’ai pas stoppé mon compte Facebook personnel ou professionel, même si j’y ai songé, car j’estime ne pas avoir de données sensibles, mais à la prochaine affaire, quel sera l’impact ?….