Correction exercices élaboration de modèles d’entrepôts de données Série 02
Correction exercices élaboration de modèles d’entrepôts de données Série 02
-
Exercice 01
-
Énoncé
- Vous pouvez visualiser l’énoncé de l’exercice
-
Solution
- Question : 01
- Question : 02
- Consultation
- Question : 03
- Le prix et le nombre de consultations (nb_consult)
- Question : 04
- Trois dimensions : Médecin, Personne, Temps
- Question : 05
- Date: Année–>Trimestre–>Mois–>JourSemaine–>Date
- Question : 06
- Question : 07
-
Exercice 03
-
Énoncé
- Vous pouvez visualiser l’énoncé de l’exercice
-
Solution
- Qu’est ce qu’une table de faits?
- La table de faits est la table centrale du modèle dimensionnel. Elle contient les informations observables (les mesures) sur ce qu’on veut analyser: table de faits des ventes par exemple.
- Une ligne d’une table de faits correspond à une mesure. Ces mesures sont généralement des valeurs numériques et additives;
- Une table de faits assure les liens plusieurs à plusieurs entre les dimensions.
- Elles comportent des clés étrangères, qui ne sont autres que les clés primaires des tables de dimension.
- Pour les ventes, on peut avoir les faits suivants: chiffre d’affaire net, quantités et montants commandés, quantités facturées, quantités retournées, volumes des ventes, etc.
- Pour la gestion de stock : nombre d’exemplaires d’un produit en stock, niveau de remplissage du stock, taux de roulement d’une zone, etc.
- Pour la gestion des ressources humaines : performances des employés, nombre de demandes de congés, nombre de démissions, taux de roulement des employés, etc.).
- La table de faits
- La table de faits est : vente
- Qu’est ce qu’une table de dimension?
- Une table de dimension représente un axe d’analyse : dimension de temps, dimension géographique, dimension client, etc.
- Les tables de dimension sont les tables qui raccompagnent une table de faits, elles contiennent la description textuelle de l’activité. Une table de dimension est constituée de nombreuses colonnes qui décrivent une ligne. C’est grâce à cette table que l’entrepôt de données est compréhensible et utilisable, elles permettent des analyses en tranches et en dés.
- Une dimension est généralement constituée: d’une clé artificielle, une clé naturelle et des attributs.
- Schéma en étoile
- Schéma en flocon
- Schéma en constellation
-
Exercice 04
-
Énoncé
- Vous pouvez visualiser l’énoncé de l’exercice
-
Solution
- Ce schéma est caractéristique de la modélisation dimensionnelle (du nom des dimensions) la plupart du temps mise en oeuvre dans la conception d’un ED. Un schéma en étoile peut également être représenté sous forme de cube de données.
- A partir de la base de données relationnelle figurée par notre schéma en étoile, il est possible de développer un logiciel simple (à base de SQL par exemple) qui édite des sommes de« montant de la vente », ou chiffres d’affaires (CA).
- On peut tracer autant de cubes D qu’il y a de valeurs pour la variable date. Un cube D représente une coupe de l’hypercube à 4 dimensions, selon une valeur de la variable date. De même, on peut faire des coupes du cube D pour toutes les valeurs de produit, par exemple. On obtient alors autant de tableaux à 2 dimensions (client, vendeur) qu’il y a de valeurs à produit.
- A partir de D, on peut faire 3 types de tableaux à 2 dimensions : (client, vendeur), (produit, vendeur), (client, produit) A partir de l’ensemble A, B, C, D, on peut faire en plus les 3 coupes qui gardent date (client, date), (produit, date), (vendeur, date),donc en tout 6 types de tableaux à 2 dimensions.
-
Exercice 05
-
Énoncé
- Vous pouvez visualiser l’énoncé de l’exercice
-
Solution
- La plupart des attributs dimensionnels ont un ID ainsi qu’un champ descriptif. Par exemple, dans la table Date, le mot ‘Novembre’ n’est pas suffisant pour identifier avec précision ce mois, car on le retrouve dans chacune des années. Il faut donc un attribut idMois (ex: ’11/2010′) ainsi qu’un attribut descriptif descrMois (ex: ‘Novembre’).
- C’est la même chose pour l’attribut ville: le même nom de ville peut se trouver dans plusieurs pays ou même plusieurs fois dans un même pays; Nous avons créé une table TypeClient selon la stratégie de mini-dimension.
- L’avantage est que la table TypeClient peut être pré-générée (toutes les combinaisons possibles de sexe, ville, groupe d’âge, etc.). De même, les tables Destination, Date, Forfait, Promotion et CanalVentes peuvent également être pré-générée et ne sont (presque) jamais modifiées. Seule la table de dimension Client est modifiée à chaque fois qu’un client s’ajoute au système;
- La clé primaire de la table de faits Vente est une clé composée car il est très rare que l’on accède individuellement les lignes de cette table. En revanche, les clés primaires des tables de dimension sont toujours des clés artificielles simples (ex: NUMBER).
-
a.
-
Roll-up on temps to Année
Slice Année = 2012
Roll-up on temps to Année
Slice Année = 2013
(Cout « total », donc Slice avec une opération d’agrégation)
b.
-
Roll up on Date to jourSemaine
Roll-up on Médecin to spécialité
Roll-up on Personne to sexe
c.
-
Dice mois = octobre
(Cout des consultations, donc Dice sans une opération d’agrégation)
-
1.2
1.3
1.4
-
Q:01
Q:02
Solution