Généralités sur les Systèmes d’Information Décisionnels
Ce chapitre a pour objectif de présenter les concepts généraux d’un Système d’Information Décisionnel (SID) que nous allons utiliser pour réaliser notre projet. Ainsi dans la suite de ce chapitre nous allons expliquer les concepts généraux qui existent.
Concepts généraux
Modélisation multidimensionnelle C’est une nouvelle méthode de conception autour des concepts métiers. Les analyses décisionnelles sont basées sur des traitements OLAP directement reliés à la modélisation de l’information sous une forme conceptuelle proche de la perception qu’en a l’analyste. Cette perception de l’information est basée sur une vision multidimensionnelle des données. La modélisation multidimensionnelle consiste à considérer un sujet analysé comme un point dans un espace à plusieurs dimensions. Les données sont organisées de manière à mettre en évidence le sujet analysé et les différentes perspectives de l’analyse.
Présentation des concepts
Nous commencerons par expliquer les concepts fondamentaux de l’informatique décisionnelle nécessaire pour la mise en place de notre solution.
Concept de Faits
• Fait : modélise le sujet de l’analyse (ce que nous souhaitons mesurer) selon divers axes d’analyse. Il est formé de mesures correspondant aux informations de l’activité analysée et de clés étrangères des axes d’analyses (dimension). [22] 2017-2018 Généralités sur les Systèmes d’Information Décisionnels Les faits sont généralement des valeurs numériques provenant des processus d’affaires. Il existe trois types de fait : fait additif, fait semi-additif et fait non additif. Fait additif : un fait est additif s’il est additionnable suivant toutes les dimensions. Fait semi-additif : un fait est semi-additif s’il n’est additionnable que suivant certaines dimensions. Fait non additif : un fait est non additif s’il n’est pas additionnable quelques soient les dimensions. • Table de faits : c’est la table principale du modèle dimensionnel. Elle contient les données observables (les faits) que nous possédons sur un sujet et que nous voulons étudier, selon divers axes d’analyse (les dimensions). Elle contient un ou plusieurs faits numériques qui se produisent par la combinaison de clés définissant chaque enregistrement. En d’autres termes, c’est un ensemble de données structuré, composé de champs de type dimension et de champs de type mesure. Elle contient les clés étrangères des axes d’analyse.
Concept de Dimension
• Dimension : c’est un axe à partir duquel nous observons les faits. Elle se compose de paramètres correspondant aux informations faisant varier les mesures de l’activité. Les dimensions fournissent le contexte (qui, quoi, quand, où, pourquoi et comment) des faits. [22] • Table de dimension : contient les axes d’analyse selon lesquels nous voulons étudier des données observables qui, soumises à une analyse multidimensionnelle, donnent aux utilisateurs des renseignements nécessaires à la prise de décision. Elle contient l’ensemble des informations descriptives des faits. Et elle contient en général beaucoup moins d’enregistrements qu’une table de faits.
Concept de Granularité
La granularité est le niveau de détail représenté par les données dans une table de faits ou de dimensions au niveau de l’entrepôt de données.
Concept d’ hiérarchie
• Hiérarchie : elle sert, lors des analyses, à restreindre ou accroître les niveaux de détail de l’analyse. Elle organise les paramètres d’une dimension conformément à leur niveau de détail. [22] • Niveau d’ Hiérarchie : un niveau d’ hiérarchie se définit au niveau des tables de dimensions. Cela permet d’agréger les données. Woly SARR Mise en place d’un système décisionnel page 32 2017-2018 Généralités sur les Systèmes d’Information Décisionnels
Concept de Mesure
Une mesure est une quantité présente dans la table de faits et qui permet de mesurer les faits. C’est l’élément de données sur lequel portent les analyses, en fonction des différentes dimensions. [22] Par exemple : nombre de personnes dans une chambre est un exemple de mesure.
Types de modèles
Il existe plusieurs types de modèles qui peuvent être utilisés pour mettre en place un datawarehouse et qui utilisent ces notions de faits et de dimensions. Dans la pratique, pour construire un modèle approprié pour un datawarehouse, nous avons deux différents types de modèles : le modèle en étoile et le modèle en flocon. Nous allons donc présenter chacun de ces modèles.
Modèle en étoile
Il est composé d’une table de fait centrale et des tables de dimensions. Ces tables de dimensions n’ont pas de liaison entre elles et qu’elles sont directement reliées à la table de faits qui contient les données à analyser. Ce modèle est basé sur des faits qui ont lieu dans le temps et qui ne se modifient pas. • Avantages — Facilité de navigation. — Nombre de jointures limité. • Inconvénient — Redondance dans les dimensions.
Modèle en Flocon
Ce modèle est une variante du modèle en étoile. Il est composé d’une table de fait qui est au cœur du modèle et des dimensions. Le principe étant qu’il peut exister des hiérarchies de ces dimensions qui gravitent autour de la table centrale (table de fait). Dans une table de dimension, nous n’avons qu’un seul niveau hiérarchique. La table de dimension de niveau hiérarchique le plus bas est reliée à la table de fait. Nous disons qu’elle a la granularité la plus fine. L’origine de la modélisation en flocon est de créer des hiérarchies de dimensions, de telle manière à avoir moins de lignes par dimensions. • Avantages — Normalisation des dimensions. — Économie d’espace disque. Woly SARR Mise en place d’un système décisionnel page 33 2017-2018 Généralités sur les Systèmes d’Information Décisionnels • Inconvénients — Modèle plus complexe (jointure). — Requêtes moins performantes. — Grande complexité en termes de lisibilité et de gestion : navigation difficile. [22]
Stockage des données
Le COUD a une masse de données en croissance constante. Ces données sont d’abord stockées dans un datawarehouse puis dans des dubes ou datamarts selon les traitements métiers que nous aurons à faire.
Datawarehouse
Un entrepôt de données, ou dataWarehouse est une vision centralisée et universelle de toutes les informations de l’entreprise. C’est une structure, c’est-à-dire comme une base de données, qui a pour but, contrairement aux bases de données, de regrouper les données de l’entreprise pour des fins analytiques et pour aider à la prise de décision. Cette décision est une action entreprise par les décideurs de l’entreprise et vise à améliorer, quantitativement ou qualitativement, la performance de l’entreprise. En gros, c’est un gros volume d’informations épurées, organisées selon les métiers de l’entreprise, historisées et provenant de plusieurs sources de données, servant aux analyses et à l’aide à la décision. [22]
Caractéristiques
Les données du datawarehouse ont un ensemble de caractères, qui sont au nombre de quatre (4), qui leur est spécifique. Elles doivent alors être : • orientées sujet : au cœur du datawarehouse, les données sont organisées par thème. Les données propres à un thème, par exemple les données de la scolarité, contiennent seulement l’information utile à la scolarité pour la prise de décision ; • intégrées : les données proviennent de sources hétérogènes utilisant chacune un type de format. Avant d’être intégrées au sein du datawarehouse, elles doivent être mises en forme et unifiées afin d’en assurer la cohérence ; • non volatiles : les données ne disparaissent pas et ne changent pas. Un datawarehouse devrait conserver la traçabilité des informations et des décisions prises. Une requête émise sur les mêmes données à un temps d’intervalle doit donner le même résultat ; • historisées : contrairement au système de production les données ne sont jamais mises à jour. Les données non volatiles sont aussi horodatées