Twitter Facebook Google Plus Linkedin email Imprimer Pdf

||| BIG DATA

Logical Datawarehouse : Ce que HADOOP apporte concrètement.

Le 19 février 2014 par J-F. VANNIER, Business Intelligence Infrastructures, Bull

Selon HortonWorks, fin 2015, la moitié des données stockées dans le monde le seront sur des infrastructures HADOOP. Certaines entreprises comme les « pure players » de l’Internet, les acteurs de la distribution ou de la finance qui gèrent des flux considérables d’informations ont déjà adopté ces technologies. Pour toutes les autres entreprises se pose la question de l’utilité, de la pertinence, du coût de la mise en œuvre de ces nouvelles technologies. Pourquoi mettre en place HADOOP ? Pour quels usages, quelles données ? Quels bénéfices vont-elles retirer de la mise en place d’extensions de leur Datawarehouse ?

Accéder à des données non exploitées : Les systèmes d’information regorgent de données non exploitées, de bases cloisonnées, de données archivées : Historiques, éléments de détails, bases départementales etc. Certaines peuvent se révéler pertinentes. HADOOP va permettre de les ramener au sein de l’environnement décisionnel, de les intégrer rapidement, de les stocker facilement à un coût moindre, de les tamiser finement afin d’en extraire des pépites. L’injection de ces données dans le Datawarehouse pourra lors se faire via cet « Extended ODS » sans perturber les processus existants, si besoin avec d’autres outils, et sur de gros volumes.

Etendre à de nouveaux formats : On pense évidemment aux formats de données issues du web. Mais il y a aussi les documents bureautiques, les emails, etc. Ces sources d’informations diffuses, pas, peu ou mal exploitées. En n’imposant ni format de données, ni format de stockage, HADOOP facilite l’échange d’information. Les freins technologiques au partage d’informations sont levés même s’il reste à adresser les aspects de sécurité, la cohérence fonctionnelle des données entre elles et les réticences organisationnelles. Mais un socle technologique existe pour éliminer les silos de données.

Déployer de nouveaux outils : HADOOP, ca n’est pas que du stockage. Sur le framework viennent se greffer des outils d’analyse, de graphes, de gestion de documents, de « machine learning », de statistiques, d’analyse sémantique qui permettent une autre analyse des données existantes, d’autres représentations pour les utilisateurs. Ces outils nouvelle génération vont apporter plus de confort, de pertinence et de liberté aux utilisateurs.

Diminuer les coûts et gagner en agilité : Si on compare à volume de données équivalent, à performance équivalente sur un spectre d’usage commun, le coût d’une solution basée sur HADOOP est 5 à 20 fois moins élevé qu’une appliance usuelle du marché. Elle va de plus permettre une plus grande souplesse dans l’architecture, dans le développement de nouvelles applications. On étend le périmètre du Datawarehouse. On l’enrichit au fur et à mesure des projets, en s’appuyant sur des démarches agiles et en assurant de la progressivité de l’investissement.

HADOOP n’a pas obligatoirement vocation à remplacer le DatawareHouse actuel, essentiellement support du reporting. En revanche, au fur et à mesure de l’évolution des besoins vers plus d’analytique, vers une demande de meilleure valorisation de l’information, il s’impose comme un socle naturel pour un DatawareHouse étendu, un logical DatawareHouse devenu alors indispensable.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*