ESSENTIALS
Audiodatenkompression
AUDIOFORMATE UND DATENKOMPRESSION
Weniger
ist Mehr
A U D I O D AT E N R E D U K T I O N V E R S T E H E N U N D R I C H T I G N U T Z E N
Dank drastisch gesunkener Preise für Festplatten und andere
Speichermedien lassen sich mittlerweile Terabytes an Audiodaten
ohne Qualitätsverlust bequem im heimischen Rechner abspeichern.
Spannend wird es jedoch, wenn ihr unterwegs seid und trotzdem
eure Lieblingssongs oder Projekt-Mixes mit begrenztem
Speicherplatz ohne Qualitätseinbußen auf Abruf dabeihaben wollt.
Foto: Wilschewski
RecMag stellt euch nachfolgend die wichtigsten Formate für die
Datenkompression vor und erläutert die technischen Hintergründe.
recording magazin 1/10
36
© by PPVMEDIEN 2010
Die meisten Audioformate wie WAV oder AIF basieren
auf dem PCM-Verfahren (Pulse Code Modulation).
Hierbei werden Amplituden (Pegel) des Audiosignals
in Bit/6dB dargestellt. Je mehr Bits, desto höher
die Dynamik und damit auch die originalgetreuere
Auflösung des Signals. So besitzt eine Aufnahme mit
8 Bit noch etwa den Charakter von Mittelwellenradio,
während 16 Bit Audio in der gewohnten CD-Qualität
abbildet. Ein speicherplatzintensiver Nachteil dieser
Digitalisierungsmethode ist allerdings, dass dieses
Verfahren keinen Unterschied in der Erfassung der
Amplitude macht; heißt, alle Signale werden mit der
gleichen Bit-Auflösung erfasst, ob mit geringem oder
hohem Pegel spielt hierbei keine Rolle. Es wird al-
so nicht dynamisch auf die tatsächliche Signalstärke
eingegangen, was dazu führt, dass leise Passagen
ebenso viel Datenplatz „verschwenden“ wie laute.
www.recmag.de
37
ESSENTIALS
Audiodatenkompression
© by PPVMEDIEN 2010
PCM-kodierte Audiodateien belegen in 16 Bit
Auflösung, 44,1 kHz Abtastrate und Stereo
circa 10 MB pro Minute Material.
Mittlerweile gibt es aber Formate, die we-
sentlich weniger Platz einnehmen.
Während
der letzten beiden Jahrzehnte hat gerade
die Verbreitung von Musik über das Internet
stark dazu beigetragen, dass viele solche
Audio-Codecs auf breiter Ebene verfügbar
sind. Und so ist auch der mobile Hörgenuss
aufgrund schicker und leis tungsfähiger
Handys und wes tentaschengroßer Player
mittlerweile kein Problem mehr. Aufgrund
des begrenzten Speicherplatzes machen
sie aber den Einsatz von digitalen Kom-
primierungsverfahren nötig.
Das Ziel und gleichzeitig Kunststück der
Audiodatenreduktion ist es, den Datenstrom
ohne hörbaren Qualitätsverlust zu minimie-
ren.
Denn bei der Reduktion der Daten kann –
Mittels cleverer Daten-
kompression bekommt man viel
Musik in guter Qualität auf den
mobilen Player.
Verlustbehaftet (Lossy)
Viele Kompressionsverfahren funktionieren
nicht ohne Datenverlust, weswegen man
sie auch verlustbehaftete Datenreduktion
nennt. MP3-kodierte Audiodaten in 128
kbps belegen beispielsweise nur ein Zehntel
der Originaldaten bei identischer Auflösung,
Die Kodierung mit variablen Bitraten (VBR)
lässt sich in diesem Beispiel klar nachvoll-
ziehen. Erst hohe Pegel nutzen die volle
Bitauflösung aus, während bei geringen
Pegeln die Auflösung ohne Qualitätseinbußen
reduziert werden kann und somit weniger
Speicherplatz benötigt wird.
muss aber nicht – Information verloren gehen.
In diesem Fall wären dann die Ausgangsdaten
des Verschlüsselungsprozesses (Encoding) und
die aus der komprimierten
Datei beim Decoding er-
zeugten Daten nicht iden-
tisch. Die hohe Kunst des
Encodings besteht nun
darin, dass zwar Audioinformationen signifikant
reduziert werden, hierbei jedoch das datenre-
duzierte Audiosignal genauso klingen soll wie
das Ausgangsmaterial. Dafür gibt es zwei Wege,
die sich grundsätzlich unterscheiden:
Beim VBR-Encoding werden
dynamische Inhalte flexibel erfasst.
Bittiefe und Kanalanzahl. So können auf ei-
ner handelsüblichen CD statt 74 Minuten
über 740 Minuten Daten gespeichert und
etwa auf jedem MP3-Player wiedergegeben
werden. Entsprechende Audiocodecs nutzen
die Erkenntnis, dass das menschliche Gehirn
gleiche oder benachbarte Frequenzbereiche
bei unterschiedlichen Pegeln nur sehr ein-
geschränkt wahrnehmen kann. Gleiches
gilt für sehr hohe und tiefe Frequenzen
im menschlichen Hörbereich von 20 bis
20.000 Hz. Deshalb wird die Kodierung
unter Berücksichtigung dieser psychoakusti-
schen Vorgänge als wahrnehmungsbezogene
Audiokodierung (Perceptual Audio Coding)
bezeichnet.
Verlustbehaftet
MP3 (MPEG-1, Audio Layer 3)
WMA (Windows Media Audio)
AAC (Audio Advanced Codec)
AC-3/ Dolby Digital
Ogg Vorbis
Real Audio
Coherent Acoustics
ATRAC-3 (Adaptive Transform Acoustic Coding)
Datenendung
.mp3
.wma
.aac, .mp4
.ac3
.ogg
.rm, ra
(für DTS)
(Für MD-Player)
Datenendung
.wma
.m4a, mp4
.flac, fla
(für DVD-Audio)
Max. Auflösung
16 Bit/ 48 kHz
24 Bit/ 96 kHz
24 Bit/ 96 kHz
24 Bit/ 48 kHz
16 Bit/ 48 kHz
16 Bit/ 48 kHz
24 Bit/ 96 kHz
20 Bit/ 48 kHz
Max. Auflösung
24 Bit/ 96 kHz
24 Bit/ 96 kHz
24 Bit/ 96 kHz
24 Bit/ 192 kHz
Verlustfrei (Lossless)
Moderne Audioformate wie WMA Lossless
oder FLAC hingegen analysieren das Audio-
signal auch im Hinblick auf die tatsächlichen
Pegel und reduzieren die Bitauflösung ent-
sprechend, ohne dabei die Frequenzen zu
beschneiden oder zu reduzieren. Besitzen
beispielsweise leise Passagen maximal 48
recording magazin 1/10
Verlustfrei
WMA Lossless
Apple Lossless
FLAC (Free Lossless Audio Codec)
MLP (Meridian Losslesse Packaging)
38
© by PPVMEDIEN 2010
hem Pegel. Resultat: Geringer Speicherplatz.
Konstante Bitraten (CBR) sind immer dann
von Bedeutung, wenn die Datenrate einen
bestimmten Maximalwert (zum Beispiel:
Auslesegeschwindigkeit
während
eines
Podcasts) nicht überschreiten darf. Nachteil:
Bei dieser Methode spielt die Komplexität
des Audiosignals keine Rolle. Ob leise oder
laute Passagen, es wird mit konstanter
Bitrate encodiert und so bei leisen Passagen
Speicherplatz „verschwendet“.
Besonderheiten ergeben sich bei der Bear-
beitung komprimierten Audiomaterials.
Auf-
dB, kann die Bitauflösung auf 8 Bit redu-
ziert werden (48 dB / 6dB = 8 Bit). Laute
Passagen mit 96 dB werden dagegen mit 16
Bit gespeichert (96 dB / 6 dB = 16 Bit). Auf
diesem Wege lassen sich bis zu 50 Prozent
Daten ohne Qualitätseinbußen einsparen.
Die Begriffe VBR (variable bit rate) und
CBR (constant bit rate) beschreiben die
Art, wie die Kompressionsmethode die
Mediadaten mit einer bestimmten Datenrate
speichert.
Beim VBR-Encoding können dyna-
grund des geringen Speicherplatzbedarfs
er freuen sich verlustbehaftete Audiodaten
beispielsweise im MP3- oder AAC-Format
großer Beliebtheit bei Webradios oder
Liveaufnahmen. Kein Wunder, klingen diese
doch nahezu wie das unkomprimierte, große
Original. Im Gegensatz zu PCM-erzeugten
Originaldaten lassen sich aufgrund der Frame-
basierten Datenstruktur solche Daten nicht
so ohne weiteres bearbeiten. Dabei habt ihr
zwei Optionen:
Re-Konvertierung:
Hierbei wird beispiels-
recmag
wissen
Quick & Dirty
Vermeidet wenn möglich die
Neukonvertierung von verlustbehaf-
teten Daten mit niedriger Datenrate.
Das Klangbild und die räumliche
Abbildung leiden aufgrund der
ohnehin reduzierten Datenmenge.
Codecs wie MP3, AAC oder AC3
sollten deshalb ganz am Ende eurer
Produktionskette nach dem Mastering
stehen.
mische Inhalte flexibel erfasst werden. Hierbei
werden Passagen mit geringem Pegel mit
weniger Bits aufgelöst als Passagen mit ho-
weise eine MP3-Datei im Audioeditor tem-
porär in eine unkomprimierte WAV oder AIF-
Datei umgewandelt. In diesem Format wird
die Datei auch editiert, letztendlich aber als
MP3-Datei exportiert. Bei diesem Vorgehen
kann es jedoch zu Qualitätseinbußen kom-
ARC-Kit
ESSENTIALS
Audiodatenkompression
men. Beispielsweise arbeiten Steinbergs
Cubase und Wavelab, sowie Apples Logic
nach diesem Prinzip.
Bearbeitung
ohne
Neukompression.
Es gibt einige Audioeditoren, die auf die
Bearbeitung von MP3- Dateien spezialisiert
sind. Hierbei können jedoch nur einge-
schränkt Parameter wie Lautstärke, harter
Schnitt und das Zusammenfügen mehrer
MP3-Dateien ohne Neukonvertierung und
damit ohne Qualitätsverlust ausgeführt wer-
den. Möglich wird dies unter anderem durch
die Bearbeitung der Meta-Daten, also den ge-
speicherten Informationen über Lautstärke,
Länge, etc., welche jede MP3-Datei zusätzlich
zu den Audiodaten abspeichert.
Wird Datenrate zu sehr reduziert geht dies
mit einem massiven Höhenverlust einher.
Oben seht ihr das Original-File, unten eine
64 kBit- Version. (Diese Grafiken wurden uns
freundlicherweise zur Verfügung
gestellt von den Dreamscape-Studios:
www.dreamscape-studios.de)
Überall dort, wo ihr mit geringen Speicher-
platz und Datenraten auskommen müsst,
bieten sich verlustbehaftete Datenformate
an.
Aber nicht jedes Format eignet sich auch
Teures Pult vs. MP3 auf Mobiltelefonen.
Es gilt bei der Datenreduktion das richtige
Verfahren für den richtigen Zweck zu wählen.
klang technisch schlechter ab als beispielswei-
se AAC oder Ogg Vorbis, besitzt jedoch einen
wichtigen Vorteil: MP3 kann auf nahezu allen
Plattformen wiedergegeben werden, seien
es Handys, Autoradios, CD- bzw. DVD-Player
oder die unzähligen MP3-Player. Wollt ihr eu-
re Musiksammlung ohne Qualitätseinbußen
und unnötigen Verbrauch von Terabytes an
Speicherplatz genießen,
sind verlustfreie Codecs
wie Apple, WMA Lossless
oder FLAC geeignete
Kandidaten.
Immerhin
lassen sich damit eure Dateien auf 50% der
ursprünglichen Größe reduzieren. Aktuelle
Mediaplayer wie iTunes oder der Windows
Media Player können mit verlustfreien
Codecs umgehen und die Daten für eine
ungetrübte Wiedergabe auf geeignete Geräte
übertragen.
Bei Formaten wie beispielsweise MP3
und AAC können in jede encodierte Datei
Metadaten eingebettet werden.
Dank dieser
für die hochwertig klingende Wiedergabe
eurer Songs. Wollt ihr beispielsweise eu-
re Produktionen im Internet einem breiten
Publikum präsentieren oder sogar Live-Events
wie Podcasts im Web durchführen, bieten
Vergesst nicht die User mit
analogem Modemzugang.
sich Streaming-fähige Formate an, die bereits
bei geringen Datenraten eine noch passable
Klangqualität ermöglichen.
Hiermit wird gewährleistet,
dass selbst Interessierte
mit antiquiertem analogem
Modemzugang Streams ab-
spielen können.
Audiocodec:
So wird RealAudio bei-
spielsweise sehr häu-
fig
im
Sprachbereich
für Live-Reportagen ver-
wendet,
während AAC fes-
So funktioniert
… ein verlustbehafteter
Der beispielsweise bei Dolby Digital eingesetzte Algorithmus AC-
3 nutzt die psychoakustische Erkenntnis, dass Frequenzen unter
einem bestimmten Pegel für Menschen nicht wahrnehmbar sind.
Werden beispielsweise zwei simultan auftretende Audiosignale
im gleichen Frequenzbereich mit unterschiedlichem Pegel er-
zeugt, wird nur das lautere Signal wahrgenommen. Das leisere
Signal wird von dem lauteren überlagert oder „maskiert“ (sog.
Frequency Domain Masking) und kann somit vernachläs sigt
werden. AC-3 unterteilt hierzu das Audiosignal in sehr schma-
le Frequenzbänder und ermittelt anschließend diejenigen
Frequenzen, welche oberhalb der menschlichen Hörschwelle lie-
gen. Alle anderen Frequenzen werden beim Encoding nicht mehr
berücksichtigt und – Tataa! – trotz reduzierter Datenmenge neh-
men wir keine Qualitätseinbußen des Audiosignals wahr!
ter Bestandteil von Apples
Q u i c k t i m e -Te c h n o l o g i e
ist, auf der wiederum der
erfolgreiche iTunes Store
basiert. MP3 als eines der
ältesten, daher am weites-
ten verbreiteten Formate
schneidet gerade in Hinblick
auf geringe Datenraten
Metadaten können zusätzliche Informationen
über Künstler, Titel und Länge übermittelt
werden. Damit diese auch angezeigt wer-
den, müssen Player über entsprechende
Features verfügen. Billige Vertreter dieser
Zunft verfügen meist jedoch über ein sehr
kleines Display, welches die Metadaten nur
verkürzt und damit teilweise kryptisch dar-
stellt. Außerdem wird aufgrund der geringen
Produktionskosten gerne auf einen schnellen
Speicher verzichtet. Solange ihr nur wenige
Audiodateien unterwegs wiedergeben wollt,
recording magazin 1/10
40
© by PPVMEDIEN 2010
Am Beispiel von Tönen mit 250 Hz und 4 kHz bei 60 dB Pegel erkennt man die
Frequenzbereiche, welche unterhalb der Hörschwelle liegen. Die Töne „verdecken“
also naheliegende Frequenzbereiche unter 60 dB, welche deshalb vom mensch-
lichen Gehör nicht wahrgenommen werden können. Außerdem ist an Hand der
Hörschwelle im Ruhezustand gut erkennbar, dass das Gehör tiefe und sehr hohe
Frequenzen erst bei hohen Pegeln wahrnehmen kann. Diese psychoakustischen
Erkenntnisse bilden die Basis für die verlustbehaftete Datenkompression.
ist dieser Umstand nicht weiter tragisch. Habt
ihr jedoch eure komplette CD-Sammlung di-
gitalisiert, ist eine schnelle Suche gewünsch-
ter Titel nicht möglich. Klärt vor dem Encoding
eurer Daten das benötigte Format ab, um
spätere, zeitaufwändige Konvertierungen
zu vermeiden. So kann beispielsweise das
Musikverwaltungsprogramm iTunes keine
WMA-Dateien speichern, sondern konvertiert
diese automatisch in AAC-Dateien. Aktuelle
Nokia Handys unterstützen wiederum WMA,
jedoch kein AAC. Achtet deshalb auch beim
Kauf von Wiedergabegeräten auf die unter-
stützten Audioformate. Nicht alle Geräte kön-
nen das von euch benötigte Format wie z. B
Ogg Vorbis wiedergeben. Zwar gibt es mittler-
weile eine Reihe von Konvertierungsprogram
men, die eure Dateien von einem Format in
ein anderes wandeln. Nicht alle Programme
verfügen jedoch über einen leistungsfähigen
Batch-Modus, der automatisch all eure Daten
ohne Qualitätsverlust konvertieren kann.
Der Autor
Nikolas
Kaan
... arbeitet als freier Autor und
Studioberater, ist Musiker und leid-
geprüfter Computerfachmann für
AV-Workstations.
recmag
tipp
Quick
& Dirty
Das Encodieren von Audiomaterial
mit variabler Bitrate ist die beste
Möglichkeit, eure Audiodateien
möglichst klein zu halten. Probiert
verschiedene Datenraten aus und hört
euch das Ergebnis vor der Weitergabe
am besten in unterschiedlichen Pegeln
an. Denn Files mit 96 kbit/s klingen
einfach anders als bei 160 kbit/s.
Merke: Je geringer die Datenrate, des-
to flacher und dumpfer das Klangbild.