Mon compte Devenir membre Newsletters

Big data

La datamasse, plus connue sous son appellation anglophone big data, est la terminologie informatique utilisée pour décrire le volume excessif de données à traiter auquel les entreprises sont aujourd'hui confrontées. En 2001, le cabinet Gartner a élaboré une grille de lecture permettant l'analyse des big data, symbolisée par 3 "V" : volume, variété et vélocité.

Le volume des big data

Aujourd'hui, les entreprises doivent faire face à une véritable explosion des données stockées. Le volume des big data met en exergue les limites des infrastructures de stockage traditionnelles qu'utilisent la majorité des sociétés. Or, les données numériques générées dans le monde seraient passées de 1,2 zettaoctet par an en 2010 à 2,8 zettaoctets en 2012. Les estimations pour 2020 s'élèvent à 40 zettaoctets. Cette évolution en constante augmentation résulte de la multiplicité des progrès technologiques associés aux mutations de la société, qui s'oriente vers un échange accru d'informations.

La variété

Les datacenters doivent faire face à la variété des données qu'ils stockent, puisque ces dernières peuvent être semi-structurées, brutes ou non structurées. Leurs provenances sont diverses : web, text mining, image mining, etc. Elles peuvent également être géo-démographiques par îlot, publiques, ou dépendre de la propriété des consommateurs. La variété des big data explique la difficulté d'utiliser ces informations à partir d'infrastructures traditionnelles de datawarehousing, qui sont davantage configurées pour traiter des informations structurées et issues d'un nombre restreint de sources.

La vélocité

La notion de vélocité des big data fait référence à la vitesse avec laquelle les données sont produites, captées puis échangées. Certains systèmes s'appuient sur des flux croissants de données, c'est-à-dire sur des données en mouvement. C'est le cas, notamment, des sites qui utilisent des enchères en temps réel, ou encore des systèmes que les entreprises ou la Bourse élaborent afin de mettre en place des processus chrono-sensibles.

Articles liés à cette définition :