Qu‘est-ce que le tissu de données ?
Data fabric est une variante d‘un cadre distribué et décentralisé d‘analyse et de gestion des données, ou d‘un modèle de conception de couche d‘intégration des données, préconisé par les analystes de Gartner. La structure de données est largement considérée comme un cadre concurrent du maillage de données, préconisé par le leader d‘opinion du secteur, Zhamak Dehghani. Le concept de tissu de données, tel qu‘articulé par Gartner, est une architecture émergente et un modèle de conception de la gestion des données permettant d‘obtenir des pipelines d‘intégration de données flexibles, réutilisables et augmentés, afin d‘accélérer et, dans certains cas, d‘automatiser l‘accès aux données et le partage de celles-ci. Les métadonnées actives, qui servent à automatiser les tâches de gestion des données, constituent un attribut clé du modèle de conception de la structure de données.
En outre, selon la définition de Gartner, une structure de données prend en charge les cas d‘utilisation opérationnels et analytiques sur plusieurs plates-formes et processus de déploiement et d‘orchestration. Les structures de données prennent en charge une combinaison de différents styles d‘intégration de données et exploitent les métadonnées actives, les graphes de connaissances, la sémantique et la ML pour améliorer la conception et la fourniture de l‘intégration de données.
Il est important de comprendre que le tissu de données (et il en va de même pour le maillage de données) est un modèle de conception qui est construit à partir de plusieurs composants de données plateforme , et non pas acheté par le biais d‘une seule unité de gestion des stocks.
Comment fonctionne le tissu de données ?
La structure de données est une architecture de données distribuées qui permet de stocker, de traiter et d‘unifier les données sur différents sites et plates-formes. Elle permet l‘intégration des données, la virtualisation, l‘orchestration, la gestion des métadonnées, la gouvernance, la sécurité et la confidentialité.
Une structure de données utilise l‘analyse continue des données existantes et identifiables, rendue possible par des métadonnées actives et des techniques d‘IA/ML, pour soutenir la conception, le déploiement et l‘utilisation de données intégrées et réutilisables dans tous les environnements, y compris les plates-formes hybrides et multicloud .
La structure de données fournit également un catalogue de données (un dépôt centralisé de métadonnées et d‘informations sur les actifs disponibles) et des API d‘accès aux données pour faciliter l‘interaction des utilisateurs et des applications avec les données de manière transparente. Il s‘agit d‘une architecture de données distribuée qui permet de stocker et de traiter les données sur différents sites et plateformes.
Quelles sont les technologies utilisées pour soutenir le tissu de données ?
L‘activation d‘une structure de données implique l‘utilisation d‘une combinaison d‘outils et de technologies pour intégrer, gérer et analyser les données de manière transparente au sein d‘une organisation. Une architecture de tissu de données permet d‘obtenir une vue unifiée et cohérente des données à travers différentes sources et différents environnements. Voici des outils qui pourraient être utiles dans le processus de mise en œuvre et d‘activation d‘une structure de données :
- Intégration de données / iPaaS
- Stockage et gestion des données
- Virtualisation des données
- Catalogue de données
- Gouvernance des données
- Gestion des métadonnées
- Analyse et intelligence économique
- Sécurité des données et conformité
- Apprentissage automatique et IA
- Orchestration du flux de travail
N‘oubliez pas que les outils spécifiques que vous choisirez dépendront des exigences de votre organisation, de l‘infrastructure existante et de la nature des données avec lesquelles vous travaillez. En outre, le déploiement peut impliquer une combinaison de solutions sur site et de solutions basées sur le site cloud, en fonction de la stratégie de votre organisation.
Quels sont les avantages du tissu de données ?
Les avantages du tissu de données sont multiples :
- Les spécialistes de la technologie, tels que les directeurs informatiques, les gestionnaires de données ( plateforme ) et les ingénieurs de données, peuvent voir leur productivité augmenter grâce à l‘automatisation de l‘intégration et de l‘accès aux données, qui allège le fardeau d‘une charge de travail en constante augmentation.
- Les citoyens intégrateurs, tels que les utilisateurs professionnels et les cadres, bénéficient également d‘un accès automatisé aux données, ainsi que d‘une facilité d‘utilisation qui simplifie leurs efforts pour accomplir plus rapidement leur travail avec les données.
- L‘entreprise bénéficie d‘une valorisation plus rapide des données dans l‘ensemble de l‘entreprise. L‘entreprise est plus agile et plus réactive et, en outre, elle devient une culture plus forte axée sur les données et la maîtrise des données.
Quels sont les défis posés par le "data fabric" ?
Étant donné qu‘une structure de données moderne est construite et assemblée, et non achetée par le biais d‘une UGS unique, les défis liés à la structure de données entrent en jeu lorsque les composants nécessaires de la structure de données ne sont pas encore disponibles ou suffisamment matures pour réaliser la vision d‘un environnement de structure de données automatisé. Voici quelques exemples :
- Manque de métadonnées pour permettre la catégorisation et la découverte des données.
- Difficulté à créer des intégrations et des automatisations en raison d‘interfaces difficiles à utiliser.
- Une IA/ML non développée ou immature, qui peut conduire à des résultats imprécis
- Des performances lentes, ce qui est traditionnellement le compromis lorsque l‘on fédère une requête à travers des systèmes de données distribués.
- Absence d‘un tissu d‘intégration de données transparent et interdomaines, ce qui signifie que les silos de données ne seront pas éliminés.