Les systèmes décisionnels du point de vue de l’architecture

Selon une étude d’IDC (International Data Corporation) d’ici 2025, plus de 163 ZB de données seront produites dans le monde [33]. Dans le monde industriel, cette « masse » de données est vue par le CIGREF  comme le nouvel « or noir » [11]. Cette analogie de la masse des données actuelle ou à venir avec l’ère du pétrole, et son impact sur le vingtième siècle, est intéressante à étudier car elle est reprise par beaucoup de commentateurs et acteurs du secteur du numérique  . Chacun y accentue les comparaisons pour appuyer l’impact qu’ont et vont avoir les données dans les organisations mais aussi dans nos modes de vie. Les travaux de recherche du CIGREF sur le défi du numérique [11] sont basés sur plusieurs entretiens avec les plus grandes entreprises françaises, qui partagent leur expérience, vision et stratégie autour des données. Pour le CIGREF, les données vont : — impacter l’évolution de notre civilisation;
— devenir un enjeu économique;
— devenir un enjeu géostratégique et politique;
— devenir une ressource vitale du siècle ;
— conduire à la découverte de gisements.
S’il est vrai que cette masse de données va révolutionner la vie de nos entreprises et la façon dont elles opèrent leur « métier » [11], la comparaison avec le nouvel « or noir », même si elle est frappante et reprise par beaucoup de commentateurs du numérique, est à notre avis erronée.

En effet, le pétrole est une ressource difficilement renouvelable, sur le déclin, ce qui n’est en aucun cas la situation des données, dont le volume ne cesse de croître et leur exploitation à peine initiée .

Nous ne considérons donc pas les données comme le nouvel « or noir » des entreprises ou organisations mais plutôt comme leur patrimoine ou capital, en expansion, qu’elles souhaitent exploiter au mieux en vue d’en tirer de la valeur. Dans ce point de vue nous sommes rejoints par le CIGREF [12] qui voit les données d’une entreprise comme son capital et c’est au travers la valorisation de ce capital, que les entreprises vont pouvoir tirer de la valeur. Le point de vue du CIGREF a évolué lui aussi entre son positionnement en 2014 [11], et celui décrit dans leur rapport en 2016 [12] qui repositionne les données n’ont plus comme l’or noir mais comme le capital d’une organisation. C’est l’exploitation de ce capital de données qui occupe l’axe central de nos travaux et notamment les solutions et architectures mises en place pour valoriser et tirer parti de ce capital : les lacs de données. Pour mieux comprendre ce que sont les lacs de données et leur place dans le système d’information d’une organisation, nous nous intéressons tout d’abord aux systèmes d’information déjà en place et qui tirent déjà parti d’un ensemble de données dont ils disposent. Ces systèmes sont des systèmes dits d’aide à la décision (ou systèmes décisionnels) [6]. Au cœur de ces systèmes s’opère la transformation des données en information de valeur permettant la prise de décision.

Nos travaux de recherche portent sur l’évolution de ces systèmes décisionnels au travers de l’augmentation du volume et de la variété des données désormais disponibles dans une entreprise, l’évolution des attentes des entreprises sur l’exploitation de ces données, les innovations technologiques et l’impact sur l’architecture du système d’information.

Le système d’information

Plusieurs milliers de travaux académiques traitent du système d’information, de sa définition, sa conception, son positionnement, sa couverture, son approche, les domaines qui le composent. Le système d’information a même sa discipline de recherche dédiée, et il serait trop présomptueux d’essayer d’en faire une synthèse dans nos travaux. Nous adoptons la définition simple d’un système d’information qui est la suivante et extraite des travaux de Servigne [70] : Le système d’information (SI) est un ensemble organisé de ressources qui permet de collecter, stocker, traiter et distribuer de l’information, en général grâce à un ordinateur. Il s’agit d’un système sociotechnique composé de deux sous-systèmes, l’un social et l’autre technique. Le sous-système social est composé de la structure organisationnelle et des personnes liées au SI. Le sous-système technique est composé des technologies (hardware, software et équipements de télécommunication) et des processus d’affaires concernés par le SI. Les travaux francophones de [64] font une synthèse de vingt cinq ans d’articles sur le sujet et classent les sujets de recherche du SI en cinq grands domaines :
— informationnel, qui recouvre la gestion des données et des connaissances ;
— fonctionnel, qui englobe le traitement des transactions et l’aide aux tâches opérationnelles ;
— décisionnel, qui traite des processus de décision et d’aide à la décision ;

— relationnel, qui rassemble les processus de communication ;
— général, quand le système d’information est traité dans sa globalité.
Dans nos travaux nous nous appuyons sur les travaux de Le Moigne [38], dans le domaine de la systémique, qui ont permis de dégager le modèle constituant la base de la majorité des approches actuelles du système d’information. Ce modèle distingue, dans une organisation, trois sous-systèmes :
— le système opérant, qui se compose de l’ensemble des ressources relatives à l’activité de l’entreprise ;
— le système de pilotage qui englobe l’ensemble des éléments responsables de la gestion et de la conduite de l’entreprise et de ses moyens ;
— le système d’information, vu comme outil de communication entre le système opérant et le système de pilotage.

Le but principal du système d’information, dans cette optique, est de fournir à chaque acteur de l’organisation toutes les informations sur sa situation actuelle, passée ou à venir. Le même agent peut se trouver virtuellement, soit au niveau du pilotage, soit au niveau opérant suivant la situation considérée. Le système d’information automatisé a repris ce modèle en offrant aux utilisateurs une « super » base de données dans laquelle chacun d’eux est susceptible de trouver ce dont il a besoin. C’est en fait autour d’elle que s’organise l’entreprise. C’est l’évolution de cette « super » base de données, et les facteurs qui en sont les vecteurs qui sont au centre de nos travaux. C’est au coeur de ce système d’information que sont localisés, les systèmes décisionnels, que nous considérons comme un composant du système d’information d’une organisation.  Dans ce sens, nous rejoignons l’approche de J.Bucki et Y.Pesqueux[36], qui étend la vision de Le Moigne : Ils ne réduisent pas le concept de système d’information (SI) à une « super  » base de données mais le considère comme un élément à part entière, plus complexe. Selon J.Bucki et Y.Pesqueux[36] Les données contenues dans le système d’information, orienté structure décisionnelle, sont regroupées autour des activités et des connaissances relatives à leur comportement. L’intégration du système décisionnel avec le système d’information devient dès lors naturelle .

Dans le monde industriel se retrouvent les mêmes notions de système opérant (ou transactionnel), système d’information et système de pilotage. Ces notions se retrouvent aussi dans la littérature scientifique anglo-saxonne et industrielle, sous les nominations de System of Record, System of insights, System of engagement. Dans certaines organisations, le système d’information est parfois assimilé au système décisionnel, car c’est par lui qu’est présentée l’information. Un abus de langage est souvent fait entre système d’information et système décisionnel.

Dans nos travaux nous distinguons ces deux appellations, et nous nous focalisons sur les systèmes décisionnels et leur architecture.

Les architectures des systèmes d’information

Dans son sens large, le terme « architecture » désigne un art de construire, de disposer ou de décorer un édifice. Ainsi, l’étude de l’architecture d’un système d’information consiste à examiner la structure d’un ensemble de composants fonctionnels, applicatifs, matériels et logiciels ainsi que le mode de relation qu’entretiennent ces composants. Dans nos travaux, nous adoptons la démarche d’urbanisation, décrite par Servigne [69] : La démarche d’urbanisation recentre le pilotage de l’évolution du système d’information sur la stratégie et les besoins des métiers de l’entreprise ou organisation concernée. Elle est basée sur un modèle en quatre couches successives : Métier, Fonctionnelle, Applicative et Technique. L’architecture d’information se décline donc selon quatre couches d’architecture :
— Architecture métier ;
— Architecture fonctionnelle ;
— Architecture applicative ;
— Architecture technique.

Table des matières

Introduction
1.1 Contexte
1.2 Motivations et objectifs
1.2.1 Motivations
1.2.2 Objectifs
1.3 Organisation du mémoire et contributions
2 Les systèmes décisionnels du point de vue de l’architecture
2.1 Introduction
2.2 Le système d’information
2.3 Les architectures des systèmes d’information
2.4 Les systèmes décisionnels
2.4.1 L’historique
2.4.2 L’infocentre versus l’entrepôt de données .
2.4.3 Les composants d’un système décisionnel
2.4.4 Les différences entre l’entrepôt de données et les magasins de données
2.4.5 Les architectures des systèmes décisionnels
2.4.6 L’architecture de référence
3 L’évolution des systèmes décisionnels
3.1 L’évolution des logiciels décisionnels
3.1.1 Acquérir
3.1.2 Stocker
3.1.3 Exploiter
3.1.4 Archiver
3.2 L’évolution des infrastructures- introduction du concept HTAP
3.2.1 Le temps réel
3.2.2 En mémoire
3.2.3 Hybridation
3.2.4 Le stockage Flash
3.3 L’évolution des données
3.3.1 Données structurées, non structurées et semi-structurées : la différence
3.3.2 L’évolution des données sous l’influence des données massives
3.4 L’évolution des usages
3.4.1 L’analyse descriptive
3.4.2 L’analyse de diagnostic
3.4.3 L’analyse prédictive
3.4.4 L’analyse prescriptive
3.5 L’évolution de la modélisation
3.5.1 L’approche Data Vault
3.5.2 Règles de base d’une modélisation Data Vault
3.5.3 Lien avec la modélisation dimensionnelle
3.5.4 Avantages de Data Vault
3.5.5 Inconvénients de Data Vault
3.5.6 Conclusion sur les Data Vaults
3.6 La technologie Apache Hadoop
3.6.1 Historique de Apache Hadoop
3.6.2 Les enjeux du marché Apache Hadoop
3.6.3 Le lexique Apache Hadoop
3.6.4 Les composants d’Apache Hadoop
3.6.5 Les acteurs industriels autour de Hadoop
3.7 Apache Spark versus Apache Hadoop
3.8 L’impact de la technologie Hadoop sur les systèmes décisionnels
3.9 L’impact de l’évolution des systèmes décisionnels sur les architectures de référence
3.9.1 Les données – data sources
3.9.2 L’acquisition
3.9.3 Analytique en mouvement – Analytics in motion
3.9.4 Système d’exploitation du système décisionnel – Analytics Operating System
3.9.5 Zone de stockage du système décisionnel – Analytical Data Lake Storage
3.9.6 Accès aux données – data access
3.9.7 Découverte et exploration-Discovery et Exploration
3.9.8 Usages – Actionable Insight
3.9.9 Cas d’usage des données – Enhanced Application
3.9.10 Gouvernance et gestion de l’information – Information management governance
3.9.11 La sécurité
3.9.12 Les plate-formes et infrastructures
3.10 Les limites des systèmes décisionnels
3.11 Synthèse du chapitre 3
Conclusion

Cours gratuitTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *