Accueil 9 Solutions 9 Outil ETL pour DSI : Agrégation de données

DIRECTEURS DE SYSTÈMES D’INFORMATION

Hugo : un outil ETL

Le challenge de l’agrégation de données 

Suite à la transformation numérique des entreprises et le développement du digital, les entreprises se retrouvent avec une diversité de sources de données et ont besoin d’un outil ETL

Chaque source expose des données avec des structures différentes, en grande quantité et aux formats différents. 

Cette multitude de données est  à double tranchant. D’une part, elle constitue une valeur importante pour les  entreprises dans la performance de leurs processus. D’autre part, les entreprises éprouvent des diffciultés à agréger ces multitudes de données pour les exploiter, les traiter et les analyser correctement.

Outil ETL - Agrégation de données

La problématique d’agrégation de données est présente depuis des années et accentuée depuis le développement de l’IA, du big data, du Cloud.

En effet, depuis des années, la démarche pour agréger les données dans les systèmes est de mettre en place un outil ETL pour extraire, transformer et exploiter les données. 

La problématique des ETL est la dépendance sur la structure de données sources. Lorsque cette dernière évolue, l’ensemble de la chaîne est à mettre à jour. Les entreprises ont besoin de faire appel constamment à des spécialistes de l’ETL pour ajouter ou maintenir ces sources de données. 

Ceci engendre des délais et des coûts non négligeables aux entreprises.

Processus Hugo pour l’agrégation de données

Hugo est un outil ETL mais avec une approche différente des ETL classiques qui permet d’extraire et de transformer les données sans être dépendant de la structure des sources de données. 

✔️ Pour chaque source de données, l’utilisateur expert du domaine métier de l’entreprise (non développeur) localise les données de la source avec un outil visuel drag & drop. Cette règle de localisation suffit pour que Hugo cherche l’information avec une analyse syntaxique (NPL) pour extraire l’information puis appliquer les règles de transformation exprimée aussi par un outil simple. 

✔️ L’ensemble des données transformées sont ensuite injectées dans le gisement de données de l’entreprise. 

Fonctionnalités de l’outil ETL Hugo

Hugo transforme et agrège les données sans dépendre de leur structure

Extraction et nettoyage des données basée sur des règles de localisation de données

 localisation des informations à extraire des différentes sources

Consolidation des données avant injection. Comparaison de données et détection des différences de données entre les données du gisement et la nouvelle donnée entrante

Support de source de données à des millions de lignes

Moteur de recherche performant pour analyser et naviguer dans la base constituée de millions de lignes de données

 localisation des informations à extraire des différentes sources

Outil de catégorisation automatique des données du gisement de données

Extraction et mapping de données automatique par Hugo

Extraction et transformation du gisement vers des services externes à l’entreprise

Offre Hugo

Mise à disposition

Hugo, outil ETL est proposé en mode SaaS ou OnPremise

Tarif

Le prix d’Hugo est fonction du nombre de sources à agréger

Services

Service d’accompagnement sur le paramétrage et l’integration d’Hugo dans votre SI

Cas d’usage : Alimentation d’un Datalake 

Le processus ETL (Extract, Transform, Load) pour le Datalake de cette assurance nécessitait une équipe de plusieurs développeurs et la durée de prise en compte des sources de données prenait des mois.

Hugo est maintenant utilisé en tant que outil ETL unique pour injecter les données dans le Datalake quelque soit la source.

Outil ETL - Cas client Datalake - Hugo