Table des matières
- Avant-propos
- 1. But de l’ouvrage
- 2. De multiples concepts et quelques outils
- 2.1 Une modélisation indispensable et des outils utiles
- 2.2 Un concept, de multiples modèles
- 3. Rapports versus décisionnel
- 4. Le quiproquo du Big Data
- 5. Utilisateurs visés
- 6. À propos du contenu
- 6.1 Technologies utilisées
- 6.2 Code couleur pour les schémas
- Aborder le décisionnel
- 1. Quid des termes décisionnels
- 1.1 De nombreux termes pour de nombreux concepts
- 1.2 Détails par catégorie
- 1.2.1 Le projet : décisionnel, aide à la décision ou la Business Intelligence
- 1.2.2 Le système d’information : SID ou système d’information décisionnel
- 1.2.3 Les données : base de données décisionnelle relationnelle, entrepôt de données et magasin de données
- 1.2.4 La modélisation spécifique : base de données multidimensionnelle, OLAP, cubes
- 1.2.5 Le chargement des données : ETL, intégration
- 1.2.6 La restitution de la donnée : reporting, restitution, rapports, états, tableaux de bord, analyse, reporting ad hoc
- 1.3 Synthèse
- 2. La justification du décisionnel
- 2.1 Des données et un besoin déjà présents
- 2.1.1 Un besoin analytique
- 2.1.2 Bien qualifier ce besoin
- 2.2 La réponse à un besoin métier
- 2.3 Une nécessité technique
- 2.4 Une nécessaire historisation
- 2.5 Nécessaire mais dispensable
- 2.1 Des données et un besoin déjà présents
- 3. Mise en œuvre du projet
- 3.1 Les étapes
- 3.2 Découper le projet
- 4. Identification du besoin
- 4.1 Identifier les utilisateurs cibles
- 4.2 Reprise de l’existant
- 4.2.1 Reprise en l’état
- 4.2.2 Identification des éléments clés
- 4.3 Demandes récurrentes
- 4.4 Identification des nouveaux besoins
- 4.5 Formaliser le besoin
- 4.5.1 Matrice des besoins
- 4.5.2 Détails complémentaires
- 4.6 La réalité
- 1. Quid des termes décisionnels
- Repenser la donnée
- 1. De la technique au métier
- 2. Des « applications » aux « objets »
- 3. De l’événement à la période
- 4. Du transactionnel à l’analyse
- 5. De l’exhaustivité à la simplicité
- Comprendre les spécificités du décisionnel
- 1. Le multidimensionnel : hiérarchiser la donnée
- 1.1 Les dimensions
- 1.2 Les cubes
- 1.3 Densité d’un cube
- 1.4 Les technologies de cubes
- 1.5 L’interaction avec le datawarehouse
- 1.6 Un langage spécifique : le MDX
- 1.7 Les modes de stockage
- 1.7.1 Différents modes de stockage
- 1.7.2 MOLAP
- 1.7.3 ROLAP
- 1.7.4 HOLAP
- 1.7.5 Synthèse et choix
- 1.7.6 Autres technologies
- 2. Les fondamentaux de la base de données relationnelle
- 2.1 Le rôle de la base de données relationnelle
- 2.2 La dénormalisation
- 2.2.1 Principe
- 2.2.2 Dénormaliser les référentiels
- 2.2.3 Dénormaliser les transactions
- 2.3 Pourquoi ne pas tout dénormaliser ?
- 2.4 Les modèles de données
- 2.4.1 Dimensions versus référentiels
- 2.4.2 Modèle en étoile
- 2.4.3 Modèle en flocon
- 2.4.4 Choix du modèle
- 2.4.5 Modèle en galaxie ou constellation
- 1. Le multidimensionnel : hiérarchiser la donnée
- Identifier le projet
- 1. Entrepôts et magasins de données
- 1.1 Deux éléments distincts
- 1.2 Identification des caractéristiques
- 2. Méthodologies de conception
- 2.1 Inmon : de l’entrepôt aux magasins
- 2.2 Kimball : des magasins à l’entrepôt
- 2.3 Une même vision cible
- 2.4 Choisir une méthode et Middle-Out
- 2.5 Le piège de la technique
- 3. Formaliser l’entrepôt et les magasins de données
- 3.1 Les différents rôles de l’entrepôt de données
- 3.2 Les multiples concepts du magasin de données
- 3.2.1 Les limites de la définition de base
- 3.2.2 Le magasin de données comme nécessité technique
- 3.2.3 Ordonnancement avec l’entrepôt
- 3.2.4 Cardinalités entre datamarts et restitutions
- 4. La base de données opérationnelle
- 4.1 L’ODS
- 4.2 La Staging Area ou Landing Zone
- 5. Identifier les contraintes
- 5.1 Avant-propos
- 5.2 Contraintes technologiques
- 5.2.1 Processus de choix des technologies
- 5.2.2 Choix d’une solution pour la modélisation de la base de données relationnelle
- 5.2.3 Choix d’une solution pour la modélisation des cubes
- 5.3 Contraintes techniques
- 5.3.1 Accès aux données
- 5.3.2 Espace disque
- 5.3.3 Exploitation
- 5.4 Contraintes projet
- 5.4.1 Attentes utilisateurs
- 5.4.2 Planning
- 5.4.3 Normes et modélisation
- 5.4.4 Sécurité
- 1. Entrepôts et magasins de données
- Concevoir le modèle
- 1. Identifier les étoiles
- 1.1 L’importance des étoiles
- 1.2 Structuration ascendante
- 1.3 Identifier un fait
- 2. Formaliser une dimension
- 2.1 Dimension référentielle et dimension de faits
- 2.2 Les hiérarchies
- 2.2.1 Identifier une hiérarchie
- 2.2.2 Construire une hiérarchie
- 2.2.3 Ascendance unique
- 2.2.4 Homogénéité des niveaux
- 2.2.5 Profondeur limitée et prédéfinie
- 2.2.6 Les éléments communs entre les branches
- 2.3 Dimension basée sur les faits
- 2.3.1 Dans la base de données relationnelle
- 2.3.2 Dans la base de données multidimensionnelle
- 2.3.3 Alternatives à l’absence de référentiel
- 2.4 Structure d’une table de dimension
- 2.4.1 Identifiants techniques
- 2.4.2 Codes, libellés et attributs fonctionnels
- 2.4.3 Structure des tables
- 2.5 Le cas particulier de la dimension temps
- 3. Formaliser les indicateurs
- 3.1 Différents termes et différents concepts
- 3.2 Indicateur intensif et indicateur extensif
- 3.3 Indicateurs calculés simples
- 3.4 Indicateurs calculés complexes
- 4. Identifier les données
- 4.1 Dans la base de données décisionnelle
- 4.2 Dans la base de données opérationnelle
- 5. Formaliser la table de faits
- 5.1 La structure type d’une table de faits
- 5.2 Les sources des tables de faits
- 5.3 Consolidation de tables de faits
- 5.4 Contraintes techniques
- 5.5 La gestion des valeurs nulles
- 5.6 Granularité de la table de faits
- 5.6.1 Finesse des données
- 5.6.2 Impact sur la volumétrie
- 6. Formaliser la table d’agrégats
- 6.1 Rôle et structure d’une table d’agrégats
- 6.2 Utilisation de filtres
- 6.3 Utilisation d’agrégats de dimension
- 6.3.1 Méthodes et limites
- 6.3.2 Impacts sur la granularité
- 6.4 Utilisation d’agrégats de faits
- 6.5 Suppression de dimension
- 6.6 Contraintes techniques
- 7. Nommer les objets
- 8. Schéma synthétique des flux et types d’objets
- 8.1 Entrepôt en flocon et magasins en étoile
- 8.2 Entrepôt en étoile et magasins en étoile
- 8.3 Entrepôt en flocon et magasins en flocon
- 1. Identifier les étoiles
- Historiser les données
- 1. Les raisons de l’historisation
- 2. Historisation des dimensions
- 2.1 Une évolution de la réalité métier
- 2.2 Dimension à évolution lente
- 2.2.1 Les méthodes courantes
- 2.2.2 Ajout d’une nouvelle ligne
- 2.2.3 Ajout d’une nouvelle colonne
- 2.3 Dimension à évolution rapide
- 2.4 Choix de la période
- 3. Historisation des faits
- 3.1 Identification des faits
- 3.2 Problématique et historisation des faits
- 4. Historiser ou corriger ?
- 4.1 Identification du contexte analytique de la donnée
- 4.2 Le temps des choix et concessions
- 5. Initialisation d’un système historisé
- 5.1 Des données historiques mais non historisées
- 5.2 Utiliser le contexte initial du SID
- 5.3 Autres méthodes
- 6. Durée d’historisation idéale
- 6.1 Entre contrainte technique et utilité métier
- 6.2 Historisation des indicateurs agrégés
- 7. Remarques complémentaires
- 7.1 Reconsidérer le problème
- 7.2 Calcul sur une période
- 7.3 Impact sur la volumétrie
- 7.4 Dates d’effet, saisie et chargement
- Enrichir le modèle
- 1. Problématique de conception des objets
- 1.1 Limiter le découpage des objets
- 1.2 Les plages de dates dans les faits
- 1.2.1 Périodes basiques
- 1.2.2 Chevauchements de périodes
- 1.3 L’utilisation d’une mesure comme dimension
- 1.4 Les indicateurs distinctifs
- 1.5 Transformer un attribut en dimension
- 1.6 La relation many-to-many dans une dimension
- 1.6.1 Présentation du problème
- 1.6.2 Répartir les parents dans plusieurs hiérarchies
- 1.6.3 Répartir les parents dans plusieurs dimensions
- 1.7 Diviser une étoile en plusieurs étoiles
- 1.7.1 En enlevant une dimension
- 1.7.2 En rajoutant une dimension
- 1.7.3 Influence des données sources
- 2. Problématiques de la dimension temps
- 2.1 Les valeurs par défaut sur la dimension temps
- 2.2 Les dimensions temps métier
- 2.3 L’utilisation parcimonieuse des dates
- 2.4 L’analyse sur les heures
- 3. Problèmes de granularité des transactions reçues
- 3.1 Description du problème
- 3.2 Des données opérationnelles trop fines
- 3.3 Des données opérationnelles trop larges
- 3.4 Des données opérationnelles hétérogènes
- 4. Problématiques des référentiels
- 4.1 Stratégies de rejet
- 4.2 Utilisation d’alias
- 4.3 Les référentiels non analytiques
- 4.4 Les référentiels autoalimentés
- 4.4.1 Justification et création d’un référentiel autoalimenté
- 4.4.2 Regroupements et hiérarchies des référentiels autoalimentés
- 5. Problématiques de correction des faits
- 5.1 Création d’un flux de correction
- 5.2 Corriger une mesure
- 5.3 Corriger une ventilation
- 1. Problématique de conception des objets
- Charger les données
- 1. Le choix de la solution d’intégration
- 1.1 SQL versus ETL
- 1.2 Choix techniques
- 1.2.1 Performances
- 1.2.2 Fonctions avancées
- 1.2.3 Formats de données
- 1.3 Une interface explicite
- 1.4 Compétences
- 1.5 Bilan
- 2. Chargement des éléments du modèle
- 2.1 Les différents types de chargements utilisables dans un SID
- 2.1.1 Annule et Remplace
- 2.1.2 Insertion ou Mise à jour (alias UPSERT)
- 2.1.3 Insertion des modifications (alias INSERT)
- 2.2 Utilisation des types de chargements dans le SID
- 2.2.1 Synthèse par flux
- 2.2.2 L’effet boule de neige dans les flux transactionnels
- 2.2.3 L’évolutivité du contexte
- 2.1 Les différents types de chargements utilisables dans un SID
- 3. Ordonnancement des éléments
- 3.1 Dépendances des objets
- 3.2 Compartimentage des objets
- 3.3 Fréquence d’intégration
- 4. En dehors des phases d’exploitation
- 4.1 Chargement initial
- 4.2 Reprises de données
- 1. Le choix de la solution d’intégration
- Optimiser le modèle
Soyez le premier à donner votre avis sur “Modélisation décisionnelle Concevoir la base de données pour les traitements OLAP”