Outils et concepts pour la gestion de réseaux

Outils et concepts pour la gestion de réseaux

 Données pour la gestion de réseaux

Mesures actives et mesures passives La gestion de réseau passe par la collecte d’information auprès des composants logiciels et matériels impliqués, réalisée au travers de mesures. Ces mesures peuvent être actives (déclenchées par un moniteur) ou passives (stockées par le programme lui-même). 20 Outils et concepts pour la gestion de réseaux Une mesure active est une mesure qui est déclenchée arbitrairement. Ainsi, les indicateurs clés de performance (KPI pour Key Performance Indicator) correspondent à des mesures programmées à intervalles réguliers.

Ils permettent un suivi général de l’état de santé du système. Les mesures réalisées peuvent être variées. Elles peuvent concerner directement les équipements présents dans le réseau. Par exemple, il peut s’agir de mesurer la température d’une machine ou l’utilisation de sa mémoire vive. Des battements de cœur peuvent également être planifié pour vérifier régulièrement qu’une machine donnée est active. Il est également possible de surveiller l’état des connexions entre les machines du réseau.

Par exemple, l’outil ping (pour Packet INternet Groper) envoie à une machine ciblée une demande d’accusé de réception à travers le réseau. Dès la réception du message, la machine ciblée retourne l’accusé à la machine source, ce qui permet de savoir si la machine ciblée est accessible et quel est le temps nécessaire à un paquet pour transiter d’une machine à l’autre. L’outil traceroute retrace quant à lui le chemin pris par un paquet entre deux machines. Cela permet de connaître la liste des routeurs traversés, le temps pris par un paquet pour passer d’un routeur à un autre ainsi que la quantité de paquets perdus pendant la mesure.

Analyse de logs

Les trois problèmes que sont la détection d’anomalies, l’analyse de causes racines et la prédiction de pannes peuvent être résolus de manière plus spécifique sur des logs. Si tout événement présent dans un log est a priori anormal, certains le sont moins que d’autres, voire habituels. Même dans un système sain, des événements sont régulièrement relevés. La détection d’anomalies revient donc à isoler les portions du log les plus critiques. L’analyse de causes racines correspond quant à elle à la transformation d’une suite d’événements dont les liens de causalité sont inconnus a priori (un log) en une explication de la panne basée sur ces liens trouvés a posteriori.

Enfin, la prédiction de pannes se résume à la prédiction d’événements traduisant un comportement anormal du réseau. L’analyse de logs est cependant difficile car ces fichiers sont verbeux et bruités du fait de la complexité inhérente aux réseaux. La verbosité se traduit notamment par un flux volumineux de données. Ainsi, Kafka [kaf, 2017] est une solution générique pour la manipulation de flux de données en temps réel. En particulier, ces flux peuvent avoir un haut débit et Kafka permet leur ingestion et leur traitement. Cette solution est pertinente pour la gestion de réseau dans la mesure où un grand nombre de mesures est émis à une fréquence élevée.

Des outils comme grep [Thompson, 1968] et ElasticSearch [ela, 2020] servent à extraire des informations conformes à une recherche étant donné un volume conséquent de données. Dans un contexte d’analyse de logs, ils aident les administrateurs réseaux à rechercher des motifs d’erreurs dans des fichiers de trace volumineux. Plus spécifiquement, grep est un outil générique pour l’extraction de motifs dans un fichier texte à partir d’expressions rationnelles. Quant à ElasticSearch, il permet d’indexer et fouiller de manière distribuée des données en temps réel parmi des documents de tout type. 

Formation et coursTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *