Les communications numériques présentent une grande diversité de caractéristiques, en termes de nature des informations, de volumes des données, d’exigences en temps réel, d’exigences en taux d’erreur, d’exigences en pertes d’information pour ne citer que les plus importantes. Par ailleurs les canaux de transmission étant de capacité limitée et devant être accessible au plus grand nombre d’utilisateurs, une compression importante du volume des données est en général indispensable. Les techniques de compression ont beaucoup progressé depuis une décennie, et continuent à progresser afin de prendre en compte toutes la diversité des exigences citées plus haut. Selon la nature des informations véhiculées (texte, image fixe, image animée, son, contenus mixtes, …) et également compte tenu de la nature du réseau de transport et de la technologie d’accès les besoins ne sont pas les mêmes.
GENERALITES SUR LE CODAGE DE LA PAROLE
L’accroissement des demandes au niveau des réseaux de communications numériques a provoqué d’importantes recherches. Des méthodes de traitements du signal sont apparues dans le but de réduire le nombre de bits nécessaires à la représentation du signal de parole et à la transmission des informations tout en maintenant un niveau de qualité suffisant et une complexité.
Le but du codage de la parole est de transformer un signal vocal en général analogique, en un signal numérique d’un débit et d’une qualité donnés. Le débit binaire du signal numérisé est alors égal au produit de la fréquence d’échantillonnage par le nombre d’éléments binaires nécessaire à la représentation de toutes les valeurs discrètes du signal. Pour réduire ce débit, des algorithmes vont permettre de supprimer les redondances inutiles du signal.
Bande d’audition
L’oreille ne peut pas percevoir que certains sons. La bande d’audition est comprise entre les fréquences 20 Hz et 20000 Hz. En pratique une telle largeur de bande n’est conservée que pour un codage de très haute fidélité. Selon la nature du signal à coder, on filtre le signal en sélectionnant soit la bande téléphonique, suffisante pour la parole, soit une bande plus large pour traiter des sons plus complexes.
Classification des méthodes de compression
Il existe deux types de compression
• La compression sans perte
• La compression avec perte .
Compression sans perte
Dans le cas de la compression sans perte, le signal décodé est identique au signal original. L’avantage de cette technique est qu’il n’introduit aucune perte de qualité même après plusieurs étapes de codage décodage. Les méthodes utilisées dans ce type de compression procèdent seulement à une réduction de la redondance. A cause du critère de fidélité strict, le codage ne peut pas réduire le débit autant que les codeurs avec pertes. La compression sans perte a donc des performances de compression limitées.
Compression avec pertes
Elle engendre une perte ou une altération de l’information. Le signal de parole reconstruit étant donc dégradé par rapport à l’original. Elle consiste dans un premier temps à supprimer, par filtrage, toutes les fréquences que l’oreille ne peut pas entendre, puis à procéder à la réduction de redondance.
Suite à la suppression d’information, il n’est plus possible de reconstituer le signal original avec exactitude. Le signal reconstruit ne pourra plus reprendre donc sa qualité originale. Il y a eu suppression de l’information de manière irréversible. Ce type de compression possède des performances de compression importantes.
Bande passante du signal à coder
Bande étroite
La bande étroite ou la bande téléphonique correspond à la plage de fréquences 300Hz3400Hz. Cette bande est utilisée par la téléphonie et concerne essentiellement les signaux de parole. Elle permet de garantir la conservation de l’intelligibilité du langage ainsi les paramètres propres au locuteur. Une transmission de parole en bande étroite est en mesure de communiquer fidèlement les phénomènes voisés et de donner une impression de bruit pour les phénomènes non voisés. L’intelligibilité correspond à la possibilité d’établir un sens au message transmis avec l’ensemble des phénomènes du message. Mais la bande étroite ne permet pas de transmettre l’intégralité des fréquences présentes dans un signal de parole. Par exemple, il est très difficile de différencier un « s » d’un « f » prononcé seul, lors d’une conversation téléphonique.
Bande élargie
La transmission en bande élargie correspond à l’élargissement de la bande passante utilisée pour la transmission du signal de parole. En effet, la bande passante utilisée en téléphonie va de 300Hz à 3400Hz, or la bande élargie permet la transmission de la voix de 50Hz jusqu’à 7000Hz. La compression de la parole en bande élargie permet une importante amélioration de la qualité, en particulier au niveau de la restitution des composantes vocales graves et aigues de sorte que la netteté de la parole, son caractère naturel et son intelligibilité sont considérablement améliorés par rapport à la compression de la parole en bande étroite.
Bande large
La bande large appelée aussi bande High-Fidelity (Hi-Fi) occupe la plage de fréquences 20Hz – 20KHz. Cette bande est utilisée dans les systèmes permettant de transmettre le son avec haute fidélité. Les codeurs de musique utilisent cette bande de fréquence car cette dernière permet de transmettre les composantes basses fréquences et les hautes fréquences constituantes la musique.
Numérisation du son
Le principe de la numérisation reste identique quel que soit la nature du signal d’origine (audio, vidéo, …). La numérisation des signaux s’explique pour plusieurs raisons. De fait, un ordinateur travaille exclusivement avec les données numériques. En outre, on traitera plus facilement des signaux numériques. Grâce aux processeurs de traitement de signal modernes, traiter un signal numérique est aussi facile. Enfin, pour le stockage et la reproduction, les signaux numériques offrent une meilleure résistance au bruit, ce qui ne se traduit pas une augmentation du rapport signal à bruit. Ainsi, il est plus facile de régénérer un signal numérique d’un signal analogique.
La numérisation du signal audio analogique est la première étape dans l’opération de codage numérique du son. Elle s’effectue en trois étapes :
• échantillonnage
• quantification
• codage .
INTRODUCTION |