Etat de l’art sur les systèmes P2P

Etat de l’art sur les systèmes P2P

Les réseaux peer to peer (P2P) sont considérés aujourd’hui comme l’une des plus importantes sources de partage de données et leur intérêt ne cesse de croître au fur et à mesure qu’ils sont utilisés dans de nombreux domaines. Un système P2P ou Peer-to-Peer désigne tout système informatique basé sur un modèle réseau d’égale à égale ou chaque nœud est à la fois offreur et demandeur de services (d’où l’appellation de tel nœud “Servent” contraction de “serveur” et de “Client” ) par opposition au modèle Client/serveur où chaque nœud a un rôle bien précis (soit il offre un service ce qui fait de lui un serveur, ou bien il est demandeur de service ce qui fait de lui un client). Même si un tel modèle existe depuis les premiers pas de l’informatique, les premiers systèmes P2P n’ont suscité d’intérêt qu’avec l’apparition de la première plateforme de partages de musique en l’occurrence Napster , ce qui par la suite a donné naissance à une myriade d’applications informatiques basées sur le modèle P2P.

Définition d’un système P2P 

L’absence de standardisation du modèle P2P, laisse libre court à la multiplication de définitions très variées. Le terme peer to peer est utilisé dans de nombreux contextes, parfois avec différentes significations. Ainsi dans la littérature nous retrouvons une multitude de définitions. Elles ne sont pas toutes parfaitement équivalentes : nous pouvons citer :

Definition1 “Peer to-Peer computing is the sharing of computer resources and services by direct exchange between systems.” Intel P2P Working Group [56].
Definition2 “P2P is a way of structuring distributed applications such that the individual nodes have symmetric roles. Rather than being divided into clients and servers each with quite distinct roles (such as Web clients vs. Web servers), in P2P applications a node may act as both a client and a server.”William Yeager, P2P Working Group[57].
Definition3 “A distributed network architecture may be called a P2P network, if the participants share a part of their own hardware resources (processing power, storage capacity, network link capacity, printers). These shared resources are necessary to provide the Service and content offered by the network (e.g. file sharing or shared workspaces for collaboration). They are accessible by other Peers directly, without passing intermediary entities. The participants of such a network are thus resource providers as well as resource requestors.” Pr Rüdiger Schollmeier, Université technique de Munich (TUM)[53].
Definition4 “P2P is a class of applications that takes advantage of resources (storage,cycles, content, human presence) available at the edges of the Internet. Because accessing these decentralized resources means operating in an environment of unstable connectivity and unpredictable IP addresses, P2P nodes must operate outside the DNS system and have significant or total autonomy from central servers.” Clay Shirky, écrivain et consultant spécialisé dans les technologies Internet[58].

Il ressort de toutes ces définitions, qu’un système P2P se rapporte à une classe de systèmes et d’applications qui utilisent des ressources distribuées afin de rendre un service de façon totalement décentralisée. Un système est dit P2P lorsqu’il autorise la communication directe entre entités d’un réseau, sans passer obligatoirement par une autorité centrale, telle qu’un serveur.

Caractéristiques d’un système P2P 

Un système P2P se distingue par plusieurs caractéristiques :

Partage de ressources
C’est une caractéristique essentielle des systèmes P2P. En effet, les systèmes P2P sont nés du besoin des applications fortement consommatrices de ressources qui prennent diverses formes, matérielles ou logicielles tel que : Capacité de stockage, puissance de calcul, services, etc. Ces applications offrent des performances médiocres sur des architectures Client/serveur où seuls les serveurs sont surexploités alors que les ressources des machines clientes sont inutilisées. La solution a été de concevoir un système où tout participant coopère en mettant en commun ses ressources et opérant aussi bien comme serveur que client : le P2P [53,54].

Décentralisation
La première caractéristique d’un système P2P est la décentralisation. Un tel système est dépourvu d’entité centrale de coordination pour l’organisation du réseau, ou pour l’utilisation de ressources, ce qui implique une communication directe entre les nœuds pour toutes les tâches demandées. Aucun nœud n’a de contrôle central sur l’autre. Un tel système n’est pas facile à concevoir d’où l’existence de systèmes hybrides qui ne sont pas entièrement décentralisés [51,55].

Passage à l’échelle
Le passage à l’échelle d’un système p2p est souvent décrit comme l’intérêt principal. L’un des premiers avantages de la décentralisation est la facilité du passage à l’échelle due à l’absence de nœuds centraux qui se chargent de la synchronisation et de la coordination, ceci explique l’intérêt suscité par le P2P. Une définition récurrente du principe du passage à l’échelle est la suivante : “la résistance au changement d’échelle dans un réseau P2P correspond à la capacité propre du système à maintenir son efficacité inchangée lors de l’arrivée ou du départ d’un certain nombre de nœuds” [54,55].

Anonymat
L’anonymat se traduit par la possibilité donnée aux utilisateurs d’utiliser le système P2P sans se préoccuper des ramifications juridiques ou autres, ainsi que de lutter contre toutes formes de censure. Nous pouvons distinguer six formes d’anonymat : d’auteur, d’éditeur, de serveur, de document, de lecteur et de requête. Plusieurs applications implémentent cette caractéristique car elle permet de ne pas être identifiable sur un réseau. [59]

Autonomie
Les systèmes P2P sont dédiés aux architectures à large échelle. Une telle architecture est fortement instable non seulement à cause des pannes mais surtout à cause de la liberté d’un Peer à se connecter ou à se déconnecter à tout moment, ou de disposer de ses ressources comme il l’entend. Donc en évitant d’avoir une gestion centralisée, un système P2P offre un degré d’autonomie considérable aux utilisateurs en réalisant les traitements localement et librement sur leurs Peers contrairement aux autres architectures [51,60].

Connectivité Ad Hoc
Le comportement des usagers influe considérablement sur la disponibilité des peers. Les usagers peuvent à leurs gré se connecter ou se déconnecter de manière spontanée et donc imprévisible. Du fait de la volatilité des Peers, des mécanismes de duplication et de synchronisation sont mis en place pour pallier à ce problème. L’absence d’un peer ou d’une ressource ne doit pas être considérée comme une faute [55].

Auto-Organisation
De par la nature décentralisée d’un système P2P et de ses utilisateurs (Autonome et Connectivité Ad Hoc), l’auto organisation du système est la solution la plus envisageable, ainsi chaque Peer maintient une vue locale et le système s’auto organise au gré des interactions entre Peers. Cette caractéristique prend encore plus de sens lors du passage à l’échelle d’un système aussi dynamique, en effet une gestion centralisée serait couteuse en terme de moyens [55,60].

Robustesse et Tolérance aux pannes
La Robustesse d’un système se résume par sa capacité à maintenir une stabilité même en cas de défaillances de certains de ces composants, cela se traduit dans les systèmes P2P par leurs capacités à fonctionner et à se stabiliser même en cas d’erreur, ou de déconnexion de certains Peers. Les systèmes P2P pallient au problème du point de défaillance présent dans les architectures client-serveur, puisque leur aspect décentralisé leur permet de continuer à offrir les services auxquels ils sont dédiés même après la disparition de certains de leurs participants.

Performance
La performance est un souci significatif dans les systèmes P2P. Ces derniers visent à améliorer leur performance par l’agrégation de nouvelles ressources (capacités de stockage et puissances de calcul). Cependant, en raison de la nature décentralisée de ces modèles, la performance est influencée par trois types de ressources : traitements, stockage et gestion du réseau. En particulier, les délais de communication sont très significatifs dans les réseaux à grande échelle.

Table des matières

Introduction générale
Problématiques et motivations
Contributions
Expérimentations
Organisation du manuscrit
1. Etat de l’art sur les systèmes P2P
1.1 Introduction
1.2 Définition d’un système P2P
1.3 Caractéristiques d’un système P2P
1.3.1 Partage de ressources
1.3.2 Décentralisation
1.3.3 Passage à l’échelle
1.3.4 Anonymat
1.3.5 Autonomie
1.3.6 Connectivité Ad Hoc
1.3.7 Auto‐Organisation
1.3.8 Robustesse et Tolérance aux pannes
1.3.9 Performance
1.3.10 Réduction des coûts
1.4 Topologies des systèmes P2P
1.4.1 Première Génération : Architecture Centralisée
1.4.2 Deuxième Génération : Architecture Décentralisée
1.4.3 Troisième Génération : Architecture hybride
1.5 Taxonomie des systèmes P2P
1.5.1 Calcul distribué
1.5.2 Distribution de contenu (partage de fichiers)
1.5.3 Travail collaboratif
1.5.4 Plateformes
1.6 Conclusion
2. Etat de l’art sur les grilles informatiques
2.1 Introduction
2.2 Origine
2.3 Définition
2.4 Caractéristiques des grilles
2.5 L’évolution des grilles informatiques
2.5.1 Première génération : interconnexion de supercalculateurs
2.5.2 Seconde génération : utilisation de middleware
2.5.3 Troisième génération : approche orientée service
2.6 Taxonomie des grilles
2.6.1 Intragrille (par analogie avec Intranet)
2.6.2 Extragrille (par analogie avec Extranet)
2.6.3 Intergrille (par analogie avec Internet)
2.6.4 Grilles de calcul
2.6.5 Grilles d’information
2.6.6 Grilles de données (stockage)
2.7 Architecture d’une grille
2.8 Applications des grilles
2.9 Grille vs système P2P ?
2.10 Conclusion
3. Réplication dans les grilles de données
3.1 Introduction
3.2 Technique de réplication des données
3.2.1 Définition
3.2.2 Création des répliques
3.3 Avantages et inconvénients de la réplication
3.4 Stratégies de réplication
3.4.1 Réplication basée sur le placement des répliques
3.4.2 Réplication basé sur le nombre des répliques
3.4.3 Réplication pour les architectures Super‐Peer
3.5 Conclusion
4. Stratégie 1 : Réplication des données dans un environnement P2P non structuré
4.1 Problématique
4.1.1 Pourquoi un réseau non structuré
• Localisation des informations
• Hétérogénéité entre les peers
• Capacité de stockage et de bande passante
• Acheminement des requêtes
4.2 Modèle proposé
4.2.1 Modèle du système Peer‐to‐Peer
4.2.2 Architecture du modèle logique
4.3 Architecture générale du modèle proposé
4.3.1 Etape de prétraitement
4.3.2 Etape de traitement
4.4 Etude Expérimentale et Evaluation
4.4.1 Paramètres de simulation
4.4.2 Expérimentation 1
4.4.3 Expérimentation 2 : Temps de réponse moyen
4.4.4 Expérimentation 3 : Impact de la suppression des données
4.4.5 Expérimentation 4 : Impact de la gestion des défaillances
4.5 Conclusion
5. Stratégie 2 : Réplication de données basée sur un modèle de coût
5.1 Problématique
5.2 Architecture du modèle proposé
5.2.1 Topologie de la grille
5.3 Modèle de réplication
5.3.1 Hypothèses
5.3.2 Notations
5.3.3 Architecture fonctionnelle du modèle de réplication
5.4 Expérimentation et Evaluation
5.4.1 Temps de réponse moyen
5.4.2 Nombre de répliques créées
5.4.3 Consommation des ressources réseaux
5.4.4 Nombre de messages échangés
5.4.5 Nombre de requêtes perdues
5.5 Conclusion
6. Stratégie 3 : Réplication dynamique des données basée sur la méthode Fast spread
6.1 Problématique
6.2 Stratégie de réplication proposée
6.2.1 Hypothèses
6.2.2 Architecture Fonctionnelle du modèle de réplication
6.3 Etude expérimentale
6.3.1 Métriques utilisées
6.3.2 Expérimentation et évaluation
6.4 Conclusion
7. Stratégie 4 : Réplication dynamique des données basée sur l’algorithme BHR
7.1 Introduction
7.2 Topologie de la grille
7.3 Modèle de réplication
7.3.1 Hypothèses
7.3.2 Architecture fonctionnelle du modèle de réplication
7.4 Expérimentation et évaluation
7.4.1 Paramètres d’évaluation
7.4.2 Scénario de configuration de la grille
7.4.3 Résultats et discussion
7.5 Conclusion
Conclusion Générale

Cours gratuitTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *