Cours buts de la répartition des bases de données, tutoriel & guide de travaux pratiques en pdf.
Besoins, Objectifs & Définitions
Les pressions pour la distribution
Il devient impératif de décentraliser l’information (cas des multinationales),
Augmentation du volume de l’information (14 fois de 1990 à 2000),
Augmentation du volume des transactions (10 fois dans les 5 prochaines années). Besoin de serveurs de BDs qui fournissent un bon temps de réponse sur des gros volumes de données. Prédiction d’accroissement: Vitesse des microprocesseurs : 50% par an, Capacité des DRAM : 4 fois tous les 4 ans, Débit des disques : 2 fois sur les 10 dernières années. Goulot d’étranglement sur les E/Ss. Pour améliorer le débit des E/Ss :
Partitionnement des données,
Accès parallèle aux données,
Utiliser plusieurs nœuds (avec un bon coût/ performance), et les faire communiquer par un réseau. Les BDRs se sont développées, grâce au progrès technologiques réalisés au niveau de l’infrastructure réseau et des postes de travail.
Buts de la répartition des bases de données
Les bases de données réparties ont une architecture plus adaptée à l’organisation des entreprises décentralisées.
Plus de fiabilité : les bases de données réparties ont souvent des données répliquées. La panne d’un site n’est pas très importante pour l’utilisateur, qui s’adressera à autre site.
Meilleures performances : réduire le trafic sur le réseau est une possibilité d’accroître les performances. Le but de la répartition des données est de les rapprocher de l’endroit où elles sont accédées. Répartir une base de données sur plusieurs sites permet de répartir la charge sur les processeurs et sur les entrées/ sorties.
Faciliter l’accroissement: l’accroissement se fait par l’ajout de machines sur le réseau.
SGBD réparti
Une base de données centralisée est gérée par un seul SGBD, est stockée dans sa totalité à un emplacement physique unique et ses divers traitements sont confiés à une seule et même unité de traitement. Par opposition, une base de données distribuée1 est gérée par plusieurs processeurs, sites ou SGBD. Un système de bases de données réparties ne doit donc en aucun cas être confondu avec un système dans lequel les bases de données sont accessibles à distance. Il ne doit non plus être confondu avec une multibase ou une BD fédérée. Dans une multibase, plusieurs BDs interopérent avec une application via un langage commun et sans modèle commun. Dans une BD fédérée, plusieurs BDs hétérogènes sont accédées comme une seule via une vue commune. Du point de vue organisationnel nous distinguons deux architectures : 1. Architecture Client-Serveur : les serveurs, ont pour rôle de servir les clients. Par servir, on désigne la réalisation d’une tâche demandée par le client. 2. Architecture Pair-à-Pair (Peer-to-Peer, P2P) : par ce terme on désigne un type de communication pour lequel toutes les machines ont une importance équivalente.