‘Big Data, comment prévoir ‘ : mon édito sur RCF

Les big data, pour les non connaisseurs, c’est l’art d’organiser une ensemble de données gigantesques et de les analyser en vue de produire un résultat et un diagnostic.En travaillant sur une masse d’informations importante, on peut tirer des conclusions surprenantes: par exemple les voitures oranges subissent moins d’accidents que les autres. On peut aussi trouver dans le big data des éléments plus logiques, plus évidents: ainsi les personnes ayant déclaré fumer ont plus souvent des problèmes de santé que les autres. Un ouvrage dénommé  Big Data – La Révolution Des Données Est En Marche‘ rédigé par Kenneth cukier, peut permettre à ceux qui ne s’y connaissent guère dans le domaine, de s’initier rapidement à la notion. Même si l’œuvre pêche peut-être par une trop grande vulgarisation.On peut, avec le big data prédire des comportements et les gérer.  En améliorant par exemple les transports, la santé.. En analysant les requêtes  des utilisateurs de son moteur de recherche, google a ainsi pu deviner les zones dans lesquelles on trouvait le plus de malades pendant certaines épidémies. Toujours dans le domaine de la santé, en utilisant des bases de données ayant étudié des millions de fois des maladies du nourrisson, il a été possible d’améliorer le cycles des soins apportés aux bébés.. Ou encore, toujours dans le domaine des bébés, les données peuvent à partir de vos de vos recherches numériques, savoir si vous êtes enceinte et des entreprises proposer des offres adaptées à ces situations. Le monde du big data n’a certes pas attendu l’informatisation de la planète pour exister. Si les marins peuvent désormais disposer d’une vaste base de données avec marinexplore, c’est au 19e siècle que le monde des données de masse a envahi la mer. M.Maury, en reportant des millions d’informations de voyages a permis de simplifier grandement les routes des bateaux en leur indiquant des chemins surs et rapides. En faisant en sorte de prévoir des comportements, le big data ne cherche pas ce qui est forcément juste mais à trouver des probabilités sérieuses. Si généralement une voiture orange a moins d’accident qu’une autre, cela ne veut pas dire que parce que votre voiture est bleue vous connaitrez forcément plus de danger en la conduisant. De même les données que l’on déduit des big datas doivent être interprétées. Pourquoi les gens en véhicule oranges ont-ils moins d’accidents? Parce que la couleur se voit davantage sur la route? Parce que le orange étant une option en plus du modèle de base, les propriétaires s’investissent davantage dans leurs véhicule et donc y prennent soin ?Difficile à savoir. En tous cas les propriétaires de véhicules orange ont moins d’accidents que ceux disposant des mêmes modèles peints en blanc. Quelles conclusions en tirer? Avec le big data les assurances auto vont-elles donner un bonus aux propriétaires de véhicules orange? Ou va-t-on assister à l’obligation d’acheter une voiture orange? Comme on le voit les possibles sont ouverts. Espérons tout de même que prévoir n’amènera pas à l’arbitraire. Je vous remercie.