De nos jours, il est impossible de prendre un journal ou un magazine sans lire des articles sur les changements considérables qui sont sur le point d‘être apportés à notre société. Nous ne parlons pas du changement climatique ou de l‘État de surveillance, mais d‘un phénomène qui promet d‘améliorer nos vies : le Big Data.
Tout d‘abord, il convient de préciser ce à quoi nous faisons référence lorsque nous parlons de Big Data. Il s‘agit de l‘utilisation moderne de superordinateurs extrêmement puissants pour stocker et analyser d‘énormes quantités de données à une macro-échelle. Bien que l‘homme ait presque toujours collecté des données, jusqu‘à récemment, nous ne disposions pas des outils nécessaires pour analyser ces données sans déployer des efforts considérables. Les données devaient être examinées à la main, les calculs effectués sur papier et enfin compilés, le tout dans un effort coordonné si compliqué qu‘il en devenait impossible. Même après l‘invention des ordinateurs, il a fallu des décennies pour qu‘ils soient assez puissants et puissent stocker suffisamment d‘informations pour rendre possible l‘analyse de ces énormes ensembles de données. Même lorsque des ordinateurs suffisamment puissants ont été mis au point, ils étaient hors de portée de tous, à l‘exception de ceux qui avaient les poches les plus profondes. On les appelait alors "superordinateurs" pour les différencier de ceux utilisés par tous les autres.
Mais nous sommes au milieu d‘une mer de changements : pour la première fois dans l‘histoire, l‘analyse de ces vastes entrepôts de données est non seulement possible, mais aussi accessible et réalisable pour l‘entreprise moyenne. Cet accès promet de tout changer dans notre façon de vivre. Bienvenue dans l‘ère du Big Data.
Le sport est l‘une des premières réussites du Big Data
Compte tenu de l‘obsession des amateurs de sport pour les statistiques de toutes sortes, il semblerait naturel que le sport soit l‘un des premiers domaines d‘application du Big Data. Tous les ingrédients sont réunis : les données sont là et facilement accessibles, le sujet suscite beaucoup d‘intérêt et il y a même beaucoup d‘argent à la clé. Et finalement, c‘est arrivé au baseball (plus tard, l‘histoire est devenue la base du film acclamé Moneyball).
Mais le baseball n‘est pas le seul domaine où le Big Data peut trouver des applications. En effet, le hockey est un autre sport où il a commencé à avoir un impact important. Des scientifiques comme Aaron Clauset ont bouleversé de nombreuses "règles" sportives. Dans un article publié en libre accès dans EPJ Data Science, Clauset a réfuté l‘idée bien établie du "momentum", selon laquelle les joueurs et les équipes ont des "périodes de gloire" au cours desquelles de nombreux points sont marqués en succession rapide. Clauset a constaté qu‘il ne s‘agissait guère plus que d‘un choix aléatoire : des gens qui voient des motifs dans les feuilles de thé.
Mais cela ne signifie pas que les Big Data ne peuvent pas être utilisées de manière productive par les entraîneurs. Un séminaire organisé en 2013 à Toronto sur les applications du Big Data au hockey a mis en évidence plusieurs façons dont les entraîneurs peuvent utiliser les données relatives à leurs joueurs pour améliorer leur jeu. Grâce à une analyse complexe, les joueurs peuvent se voir attribuer des notes différentes en fonction de certaines de leurs caractéristiques, comme leur capacité à occuper un poste donné. Cela peut aider les entraîneurs à choisir où (et quand) déployer un joueur pour maximiser ses chances de marquer. Bien que la plupart des sports aient été plus résistants à la révolution du Big Data que le baseball, ce n‘est qu‘une question de temps avant que tous les sports organisés n‘adoptent ces méthodes d‘analyse des données.
Données : Mieux qu‘une intuition sur quelqu‘un
L‘une des forces du Big Data est sa capacité à déterminer des relations entre des facteurs apparemment sans rapport. Le secteur du recrutement est un autre domaine dans lequel les données ont la possibilité de révolutionner la manière dont les affaires sont menées. Ce secteur est concerné par toutes sortes d‘indicateurs de réussite, de la recherche de talents à la fidélisation des employés. Un exemple utile est celui de Gate Gourmet, un traiteur pour l‘industrie du transport aérien. L‘un des analystes des ressources humaines de l‘entreprise a remarqué que le personnel de l‘aéroport O‘Hare de Chicago connaissait un taux de rotation de 50 % et a entrepris d‘en déterminer la raison. Une analyse approfondie a révélé un lien étroit entre la rotation des employés et le temps passé à se rendre au travail. Gate Gourmet a pu adapter ses stratégies d‘embauche pour trouver des travailleurs plus proches de l‘aéroport et réduire son taux de rotation de près de la moitié.
Voir la forêt pour les arbres
D‘une certaine manière, la gestion forestière, qui met l‘accent sur les tendances et les relations à long terme, a prédit le Big Data. Mais à l‘époque, les scientifiques étaient contraints de traiter des abstractions et les prévisions devaient être adaptées à des régions spécifiques, voire à des forêts spécifiques. Aujourd‘hui, les forestiers peuvent obtenir des informations basées sur des outils généraux en saisissant simplement les données de leur propre forêt. Les logiciels peuvent prendre en compte les types d‘arbres, les différents taux de croissance, les climats, les conditions météorologiques et de nombreuses autres variables, et peuvent prédire les résultats sur des années, des décennies, voire des siècles. Cette analyse a prouvé sa valeur en permettant d‘identifier les zones à haut risque d‘incendies de forêt dangereux ou même d‘effondrement écologique. C‘est vrai : Le Big Data peut même sauver des vies.
Un impact sur la santé
Il n‘est donc pas surprenant que l‘un des domaines les plus importants où le Big Data influencera l‘avenir soit celui des soins de santé. Les scientifiques ont enfin accès à des statistiques anonymes concernant des millions de personnes, ce qui leur permet (après analyse) d‘avoir un aperçu sans précédent des détails de la vie des gens. Un exemple récent a été publié dans le Journal of American Medical Informatics Association, qui a analysé les recherches effectuées par les internautes sur Google afin d‘identifier une interaction médicamenteuse inconnue jusqu‘alors. Les chercheurs ont constaté que les personnes qui recherchaient à la fois la paroxétine (un antidépresseur) et la pravastatine (un médicament contre le cholestérol) étaient plus susceptibles de rechercher des symptômes d‘hyperglycémie, un lien qui a été établi par la suite dans une étude.
Big Data : Les grandes conclusions
Ces quatre exemples ne sont que la partie émergée de l‘iceberg. En réalité, où que vous regardiez, il existe des processus qui peuvent être améliorés par l‘application de données, qu‘il s‘agisse de calculateurs de prêts commerciaux gratuits ou de statistiques avancées sur le hockey. Nous n‘avons couvert ici que quelques domaines où son impact se fera sentir, mais la vraie question pourrait bien être : où le Big Data ne va-t-il pas tout changer ?
Nick Rojas est un consultant en affaires et un écrivain qui vit à Los Angeles et à Chicago. Il conseille les petites et moyennes entreprises depuis plus de vingt ans. Il a contribué à des articles pour Visual.ly, Entrepreneur et TechCrunch. Vous pouvez le suivre sur Twitter @NickARojas, ou le contacter à l‘adresse [email protected].