Format Audio


Format Audio

Format audio

Un format audio est un format de données utilisé en informatique pour représenter des sons, de la musique ou des voix sous forme numérique. De nombreux standards existent; certains s'appliquent mieux que d'autres au stockage de types particuliers de signaux audio.

Sommaire

Caractéristiques des formats audio

Chaque format audio présente des caractéristiques découlant de l'algorithme de compression/décompression, ou codec, qu'il utilise. Après la numérisation du son, le format utilisé est inscrit dans l'extension du fichier de données qui en stocke la transcription.

Dans un format donné, les fichiers sont déclinés en plusieurs taux de compression ou format de données (p. ex. codées sur 8, 16 ou 24 bits) avec différentes fréquences d'échantillonnage (p. ex. 22.05, 44.1 ou 48 kilohertz), qui induisent des niveaux de qualité sonore et des taille de fichier très différents. De manière générale, pour un codec donné, plus le taux de compression est bas, plus le fichier est volumineux, mais plus la qualité sonore du fichier comprimé s'approche de la celle du fichier non comprimé. Par contre, plus le taux de compression est haut, plus le rendu sonore perd de sa qualité (ceci est valable uniquement pour les codecs avec pertes).

Formats de numérisation du son

CDA (Compact Disc Audio)

Le CDA est le format des pistes des CD audio, telles qu'elles apparaissent lorsqu'elles sont insérées dans le lecteur CD-ROM. Les CD audio du commerce répondent à la norme professionnelle "Red Book". La technique d'échantillonnage du son utilisée pour les disques compacts est la modulation d'impulsion codée (en anglais PCM, pour Pulse Coded Modulation).

Pour le calcul de la taille d'une piste: 44.1kHz*2B*2*t

où t est la durée en secondes de la piste. 44.1kHz est la fréquence d'échantillonage, 2B (2 bytes ou 2 octets) équivalent à 16 bits sont la taille d'un échantillon, et le fait qu'un CD soit stéréo (deux pistes audio) introduit le facteur 2.

Exemple : un morceau d'une durée de 00:04:22 = 262s ; la taille des données est 44100Hz*2B*2*262=46216800B=46.2MB (=44.08 MiB).

Le suffixe des fichiers créés est .cda

Pour Non comprimé, forcément qualité CD
Contre Volumineux, Pas de gestion de Tag (certains CD sont CD text)

RAW

RAW est un format audio utilisé pour représenter les données de son en modulation d'impulsion codée sans en-tête ni métadonnées.

WAV (Waveform Audio Vector)

Le format WAV mono ou stéréo, mis au point par Microsoft et IBM, est l'un des plus répandus. Le format "Disque compact" 44.1 kHz, 16 bits et stéréo nous servira de référence pour le calcul du poids et ratio des autres formats.

Pour le calcul du poids : 44100*2(2octets=16bits)*2(stéréo)*60(secondes)+ en-têtes = 11 300 kilooctets/minute

Le suffixe des fichiers créés est .wav

Pour Non comprimé (pour la version PCM)
Contre Pas de gestion de Tag (certains CD sont CD text), limité à 2 Go

Ogg Vorbis

Le format Ogg Vorbis est un format libre, fruit de la fondation Xiph.org. Vorbis se différencie des MP3, WMA et autre AAC par son algorithme. Il segmente les sources audio en paquets successifs, l'algorithme de compression agissant dans un premier temps sur chaque paquet indépendamment des autres. Cela lui permet d'avoir très peu de faiblesses sur certaines fréquences et de conserver la même qualité quel que soit le type de musique.

Le suffixe des fichiers créés est .ogg ou parfois .oga.

Par abus de langage, on appelle 'fichier Ogg' des fichiers musicaux compressés par l'algorithme Vorbis. Ceci peut être particulièrement dérangeant à l'ère des baladeurs numériques supportant audio et vidéo. En fait, Ogg est un conteneur qui peut contenir des pistes sonores (Vorbis), audio sans perte (FLAC), audio parlées (Speex) et vidéo (Theora). Un 'fichier Ogg' peut donc contenir l'un ou l'autre (ou une combinaison) de pistes. Pour être plus clair, nous devrions parler de fichier Ogg Vorbis lorsque nous mentionnons un fichier .ogg qui ne contient qu'une piste sonore au format Vorbis.

Pour Comprimé, meilleure qualité que le MP3, open source, très bon pour le streaming, supporte 255 canaux
Contre long à l'encodage


iKlax

Le format Iklax est un format numérique d'écoute active développé par la société iKlax Media et le LaBRI. Ce format de fichier de type conteneur permet d'organiser la musique en différents groupes et de leur appliquer des contraintes. Le format Iklax est le premier format audio multipiste interactif (lancé début 2008).

Le format a bénéficié d'une parution scientifique lors de l'ICMC 2008 (Internation Computer Music Conference) à Belfast.

FLAC (Free Lossless Audio Codec)

Le format flac est un format libre de compression audio sans perte. Maintenu par la fondation Xiph.org, il est apprécié pour conserver la qualité des fichiers sonores originaux en alternative aux formats de compression avec perte type mp3.

Pour Pas de perte de qualité, open source.
Contre Plutôt volumineux


AIFF (Audio Interchange Format File)

L'AIFF est un format de stockage de sons sur les ordinateurs de Apple. C'est l'équivalent du format WAV dans le monde Macintosh.

Les résolutions 8, 16, 20, 24 et 32 bits (à virgule flottante) sont acceptées.

Le suffixe des fichiers créés est .aif

Pour Non comprimé,
Contre Très volumineux, une variante l'AIFF-C permet de comprimer la taille jusqu'à 6x.

AAC (Advanced Audio Coding) ou MPEG-2 AAC

L'AAC est une extension du MPEG-2 et a été amélioré en MPEG-4, MPEG-4 Version 2 et MPEG-4 Version 3. Il a été reconnu fin avril 1997.

Il fait partie des successeurs du MP3.

Le suffixe des fichiers créés est .aac, .mp4, .m4a

Pour Très bon codec destructif (mieux que MP3 et WMA), pas de trous (Gapless), mode 5.1 ou plus.
Contre Durée d'encodage importante

Apple et l'AAC : Apple l'a choisi comme codec privilégié, on le retrouve dans son iPod et son logiciel iTunes. Pour la vente musicale en ligne iTunes Music Store, la norme AAC ne proposant pas de système de gestion des droits numériques (DRMs), Apple a développé son propre système, appelé FairPlay. Il est lisible sur Mac OS et Windows, uniquement avec le logiciel iTunes.

MP3 (MPEG-1 Layer III)

Star incontestée des formats audio, MP3 est l'abréviation de MPEG Audio Layer 3. Cet algorithme de compression prend naissance en 1987. L'ISO en fera un standard dans les années 92-93. La couche (Layer) III est la couche la plus complexe. Elle est dédiée à des applications nécessitant des débits faibles d'où une adhésion très rapide du monde Internet à ce format de compression. Les taux de compression (ratio) sont d'ordinaire de 1 pour 10 (1:10) (1:4 à 1:12). Très rapide à l'encodage. Des royalties importantes sont à payer pour exploiter la licence MP3. Utiliser l'encodeur MP3 LAME dernière version, encodé à 130 Kib/s (V5) permet d'obtenir une qualité comparable au AAC (Advanced Audio Coding) encodé à 48 kbit/s. [1]

Le suffixe des fichiers créés est .mp3

Type de compression : constant ou variable (VBR)

Pour Grande compatibilité, gestion des tag ID3.
Contre Compression destructive avec problèmes dans les aigus, lors d'un ré-encodage on passe par un fichier .wav .

mp3PRO

Le format mp3PRO, fruit de la collaboration entre Thomson Multimédia et l'Institut Fraunhofer, combine l'algorithme MP3 et un système améliorant la qualité des fichiers comprimés appelé SBR pour Spectral Bandwidth Replication.

Ce format a été publié à la fin de 2001 ; un fichier MP3pro 64 Kbit/s a un poids deux fois plus petit qu'un fichier MP3 à 128 Kbit/s, mais pour une qualité similaire, voire meilleure !

Le suffixe des fichiers créés est .mp3

Pour Gain de place.
Contre Doit obligatoirement être relu avec un lecteur mp3pro. Un fichier 64 Kbit/s relu avec un mp3 classique équivaut à un fichier mp3 de 60 Kbit/s (coupure à 11 kHz). Moins bon que le mp3 (coupure avant 16kHz). - 64 Kbit/s, qualité moyenne due à l’écrasement des pics, moins bon que l'ACC+, le seul encodeur gratuit supportant le MP3 Pro ne code qu'en 64 Kbit/s, lors d'un réencodage on passe par un fichier .wav . Altération définitive des fichiers codés.

VQF ou TwinVQ (Transform-domain Weighted Interleave Vector Quantization)

Le format TwinVQ a été développé par NTT Cyber Space Laboratories et soutenu par Yamaha. Dans le même esprit que le MP3, il comprime encore plus et avec une meilleure qualité. On regrettera une durée d'encodage un peu trop longue, près de 10 fois plus lente que le MP3. De plus, arrivé bien plus tard, et distribué sous une licence très restrictive, il a eu peu d'adeptes et est plus ou moins abandonné.

Le suffixe des fichiers créés est .vqf, .vql ou .vqe

WMA (Windows Media Audio)

Le format WMA, créé par Microsoft à partir des recommandations MPEG-4 en 1999, est utilisé par le logiciel Windows Media Player. Ce format est lié à une gestion pointue des droits d'auteurs (Gestion numérique des droits, en anglais Digital Right Management ou DRM) qui permet de définir par exemple une durée de vie limitée pour les fichiers ou d'interdire les possibilités de gravure.

Il existe plusieurs versions du codec (wma7.1, wma9, wma pro).

Le suffixe des fichiers créés est .wma

Pour Bonne compatibilité, gestion des tag, meilleure compression que le MP3.
Contre Souvent illisible sur lecteurs portables, à cause de la gestion des droits et des restrictions dans le format wma.

AU

Le format AU est assez bien répandu grâce à Unix et Linux. La fréquence d'échantillonnage est comprise entre 1 kHz et 200 kHz. Mais les applications de rendu audio ne lisent principalement que trois fréquences d'échantillonnage : 8012.821 (codec entré), 22050 et 44100 hertz.

Le suffixe des fichiers créés est .au

Pour
Contre

Les résolutions 8, 16, 20, 24 et 32 bits (flottant) sont acceptées.

ASF Advanced Streaming Format

ASF est un format conteneur de Microsoft servant au streaming audio et vidéo.

Pour
Contre Conteneur propriétaire très fermé (Microsoft)

AA Audible

AA est un format utilisé par Apple.


Pour
Contre )

Choix de la norme pour l'archivage d'un enregistrement

Choix de la norme pour la diffusion d'un enregistrement

Norme appliquée à un support

Norme appliquée au streaming

Au-delà de la qualité CD

Aujourd'hui, la norme CD a prouvé ses limites, tant au niveau de sa fréquence d'échantillonnage que dans sa définition de 16 bits. Aidé par les nouveaux supports informatiques, le son peut être numérisé en 24 bits, voire 32 bits. La fréquence quant à elle est passée à 88.2, 96, 176.4, ou 192 kHz. Cette avancée permet d'avoir un son plus dynamique et plus détaillé dans les transitoires donc d'être plus proche de l'oreille humaine.

Le DVD-Audio est un exemple de qualité supérieure, mais ce type de média ne semble pas attirer le grand public. Sony a également tenté d'imposer son SACD (SuperAudio CD), qui a l'avantage d'exister en version hybride : il est lisible à la fois selon la norme CD Audio classique, sur tous les lecteurs, et en SACD sur un lecteur dédié. Une fois de plus, ce format ne semble pas attirer l'attention du grand public. Le problème ne vient donc pas des solutions, mais du grand public trop conquis par les formats compressés et ne laissant pas de chance aux nouvelles solutions.

Avant la numérisation

Un filtre passe-bas analogique "anti-alias" (c.a.d. anti-repliement de spectre) est appliqué au signal analogique. Son rôle est de supprimer toutes les fréquences supérieures à la moitié de la fréquence d'échantillonnage. Sans ce filtre, toute fréquence (indésirable) de valeur Fs/2 + a est restituée à la fréquence Fs/2 - a ce qui donne un spectre erroné. C'est comme un phénomène stroboscopique, tel que les roues de voitures vues au cinéma : une fois elles tournent dans le "bon sens", puis dans le "mauvais sens". Exemple : avec le format CD audio, Fs = 44.1kHz et Fs/2, la fréquence maximale reproductible, vaut 22.05 kHz. Exemple de filtre typique choisi pour cette fonction en raison de son excellente réponse en fréquence : le filtre de Butterworth à -18 dB/octave.

Choix et origine de l'étrange fréquence 44.1kHz

http://fr.wikipedia.org/wiki/Cd#L.27.C3.A9chantillonnage

Les supports

Références

  1. (en)Gabriel Bouvigne for MP3'Tech - www.mp3-tech.org, « 48 kbit/s AAC public test », June 2007

Voir aussi

Liens internes

  • MOS : abréviation de Mean Opinion Score, ou Note d'opinion moyenne. Il s'agit d'une note donnée à un codec audio pour caractériser la qualité de la restitution sonore. La note peut varier entre 0 (très mauvais) et 5 (excellent, comparable à la version d'origine)
  • A2DP : Advanced Audio Distribution Profile est un profil Bluetooth.
  • SBC : Low Complexity Subband Codec est un codec de compression audio et vidéo spécialement conçu pour les applications audio et vidéo de Bluetooth
  • Encodage : ou codage, il consiste à transformer une source vidéo ou audio en un format informatique déterminé, à l'aide de codecs. Le terme de codage est un terme plus général, mais l'usage veut que encodage désigne plus particulièrement les données multimédias.
  • G.711 : est une norme de compression audio utilisée pour la visioconférence en H.323 et H.320.
  • G.723 : il faisait autrefois référence à une norme de codec audio de type ADPCM… G.723.1 désigne une autre norme de codec audio de type vocodeur.
  • G.726 : encore un codec pour le téléphone
  • SHN : diminutif de shorten (« court » en anglais), c'est un format audio sans perte de qualité.
  • VBR : Variable bit rate, terme anglais que l'on peut traduire en français par : « taux d'échantillonnage variable »
  • CBR : Constant bit rate, terme anglais que l'on peut traduire en français par : « taux d'échantillonnage fixe »

Liens externes

Ce document provient de « Format audio ».

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Format Audio de Wikipédia en français (auteurs)

Regardez d'autres dictionnaires:

  • Format audio — Un format audio est un format de données utilisé en informatique pour représenter des sons, de la musique ou des voix sous forme numérique. De nombreux standards existent; certains s appliquent mieux que d autres au stockage de types particuliers …   Wikipédia en Français

  • RAW (format audio) — Pour les articles homonymes, voir RAW. RAW (Real Audio Wrapper) est un format audio brut, sans aucune compression. Comparable aux fichiers WAV ou AIFF en taille, le fichier RAW ne contient aucune information d en tête (métadonnées). Le fichier… …   Wikipédia en Français

  • AMR (Format Audio) — Adaptive Multi Rate L Adaptive Multi Rate (AMR) ou Adaptive Multi Rate narrow band (AMR NB) est un format de compression audio de faible qualité normalisé par l ETSI. Le format AMR est souvent utilisé dans la technologie des téléphones mobiles.… …   Wikipédia en Français

  • AMR (format audio) — Adaptive Multi Rate L Adaptive Multi Rate (AMR) ou Adaptive Multi Rate narrow band (AMR NB) est un format de compression audio de faible qualité normalisé par l ETSI. Le format AMR est souvent utilisé dans la technologie des téléphones mobiles.… …   Wikipédia en Français

  • Amr (format audio) — Adaptive Multi Rate L Adaptive Multi Rate (AMR) ou Adaptive Multi Rate narrow band (AMR NB) est un format de compression audio de faible qualité normalisé par l ETSI. Le format AMR est souvent utilisé dans la technologie des téléphones mobiles.… …   Wikipédia en Français

  • Audio Interchange File — Format AIFF Extension de fichier .aif, .aiff, .aifc Type MIME audio/x aiff, audio/aiff Développé par Apple Type de format Format audio Extension du …   Wikipédia en Français

  • Format de fichier au — AU Extension de fichier .au, .snd Type MIME audio/basic Développé par Sun Microsystems Type de format Format audio Conteneur de fichiers …   Wikipédia en Français

  • Format Vidéo — Un format vidéo décrit comment un dispositif envoie des images d une vidéo à un autre dispositif, de la même manière qu un lecteur de DVD envoie des images à un téléviseur, ou un ordinateur à son moniteur. Plus formellement, le format visuel… …   Wikipédia en Français

  • Format video — Format vidéo Un format vidéo décrit comment un dispositif envoie des images d une vidéo à un autre dispositif, de la même manière qu un lecteur de DVD envoie des images à un téléviseur, ou un ordinateur à son moniteur. Plus formellement, le… …   Wikipédia en Français

  • Format de fichier audio — Un format de fichier audio est un format de données utilisé en informatique pour stocker des sons, (de la musique, des voix, etc.) sous forme numérique. De nombreux standards existent; certains s appliquent à la production, au stockage et à la… …   Wikipédia en Français


Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”

We are using cookies for the best presentation of our site. Continuing to use this site, you agree with this.