Concevoir et déployer un data warehouse
Ralph Kimball, Laura Reeves, Margy Ross, Warren Thornthwaite
Editeur: Eyrolles
Une approche centrée sur le cycle de vie dimensionnel
Le marché du data warehouse a dépassé le stade des balbutiements. Rien quaux États-Unis, plus dun millier dentrepôts de données de toutes sortes sont opérationnels et en perpétuelle évolution, pour répondre aux besoins des organisations qu'ils servent. L'approche en cycle de vie dimensionnel remplace la perspective statique qui prévalait il y a quelques années. Cet ouvrage aborde de façon approfondie les techniques de modélisation dimensionnelle et l'architecture en bus décisionnel qui permettent de répondre aux besoins d'évolutivité des data warehouses aujourd'hui.
Conduire un projet de data warehouse
Véritable "guide de terrain" alimenté par les 25 années d'expertise de Ralph Kimball dans le domaine du data warehouse, cet ouvrage met à la disposition des décideurs tout un ensemble d'outils et de techniques pour concevoir, développer et déployer un data warehouse au sein dune grande entreprise. Avec une approche résolument pratique, Ralph Kimball livre dans cet ouvrage toutes les clés dun déploiement réussi. Chacune des étapes, de lanalyse au déploiement effectif, en passant par la modélisation et la conduite de changement, s'inscrit dans le cadre d'une méthodologie claire et détaillée.
A qui sadresse ce livre ?
- Aux décideurs qui souhaitent avoir une vision globale du data warehouse, de ses enjeux et des solutions disponibles ;
- Aux fonctionnels, informaticiens et chefs de projets impliqués dans la mise en place de solutions de data warehouse
Au sommaire
- Le cycle de vie dimensionnel
- Évolution du cycle de vie
- Approche par le cycle de vie
- Guide dexploitation du cycle de vie dimensionnel
- Gestion et planification du projet, définition des besoins
- Définir le projet et planifier le projet
- Préparation et conduite d'entretiens
- Analyser les résultats
- Initiation à la modélisation dimensionnelle
- Assemblage des modèles dimensionnels : larchitecture en bus décisionnel
- Modélisation dimensionnelle : techniques de base
- Cours avancé de modélisation dimensionnelle
- Tables dimensionnelles étendues
- Table des faits étendues
- Requêtes et états ROLAP avancés
- Construction de modèles dimensionnels
- La méthode matricielle
- Gérer le projet de modélisation dimensionnelle
- Architecture technique des outils darrière-plan (back room)
- Magasins de données de la zone de construction (back room)
- Services des outils darrière-plan (back room)
- Architecture du portail de restitution (front room)
- Magasins de données du portail de restitution (front room)
- Services daccès aux données du portail de restitution (front room)
- Infrastructure et métadonnées
- Métadonnées et catalogue des métadonnées
- Cours avancé sur lInternet et la sécurité
- Architecture en composants logiciels
- Gérer la sécurité dans un environnement de data warehouse
- Cours avancé sur les agrégats
- Développer le plan des tables dagrégats
- Créer les agrégats
- Administrer les agrégats
- Algorithme de navigation dans les agrégats
- Mise au point de la conception physique
- Définir des conventions
- Développer le modèle physique des données
- Élaborer le plan dindexation initial
- Concevoir et construire la base de données
- Développer la structure de stockage physique
- Mettre en place un système de surveillance de lutilisation
- Préparation des données (data staging)
- Vue densemble de la préparation des données
- Préparation des tables dimensionnelles
- Chargements de tables des faits et opérations sur le data warehouse
- Qualité et nettoyage des données
- Construction des applications utilisateur
- Rôle de lapplication utilisateur
- Spécification des applications utilisateur
- Développement des applications utilisateur
- Planification du déploiement
- Aptitude à linstallation des postes de travail
- Développer la stratégie de formation des utilisateurs
- Développer une stratégie dassistance aux utilisateurs
- Développer la structure de déploiement
Documenter la stratégie de déploiement
- Maintenance et croissance du data warehouse
- Gérer lenvironnement de data warehouse existant
- Préparation de la croissance et de lévolution du data warehouse
- Hiérarchiser les priorités des opportunités de croissance et dévolution