Dieses Kapitel beschäftigt sich nicht mehr allgemein mit Kompressionstechniken, sondern mit konkreten digitalen Formaten für Video und Audio. Allerdings betrachten wir nur die wichtigsten, denn eine komplette Liste aller aktueller Audio- und Videoformate würde für sich ein ganzes Buch füllen.
MPEG ist eine Abkürzung und steht für Moving Picture Experts Group (nicht Motion Picture Experts Group, wie oft zu lesen ist), ein Gremium, das verschiedene Standards zur Codierung von digitalem Video, Audio und den dazugehörigen Ergänzungen (z.B. Containerformate, Interaktivität) erarbeitet.
MPEG-1 (ISO/IEC 11172) ist der älteste Standard, in der ersten Version 1993 verabschiedet. Der Videoteil ist im Part 2 definiert. Die bekanntesten Anwendungen sind sicherlich die Video-CD und frühe Online-Videos. MPEG-1 stellt beim Abspielen nur sehr geringe Anforderungen an die Rechenleistung und ist höchst kompatibel, da praktisch jeder Computer serienmäßig einen MPEG-1-Decoder an Bord hat. Nachteil ist die geringe Kompressionsleistung, d.h. die schlechte Qualität bei kleinen Dateigrößen.
Da die Video-CD schon längst die geringsten Anforderungen an die Qualität nicht mehr erfüllen kann und v.a. durch Flash auch im Internet bessere Formate allgemein verbreitet sind, versinkt MPEG-1 immer mehr in die Bedeutungslosigkeit.
Seit 1994 existiert MPEG-2 (ISO/IEC 13818). Der Video-Teil ist im Part 2 definiert. Die Kompressionsleistung ist deutlich höher als bei MPEG-1. Was die Verbreitung angeht, steht MPEG-2 seinem Vorgänger nicht nach. Schließlich sind DVDs in diesem Format codiert. Auch auf Blu-ray-Discs ist MPEG-2-Video erlaubt.
Der Untertitel dieser Anleitung sagt es schon: MPEG-4 (offiziell ISO/IEC 14496) ist unser Zielformat. Der Video-Teil ist hier in zwei Bereiche aufgeteilt:
Gegenüber MPEG-2 lässt sich in der gleichen Dateigröße noch einmal deutlich mehr Qualität unterbringen, wobei AVC wiederum bessere Ergebnisse liefert als ASP. Deshalb können wir einen Film meistens ohne erhebliche Verluste auf 1∕3 bis 1/2 DVD-5 (normaler Rohling mit 4,37 GB Kapazität) eindampfen.
MPEG-4 bitte nicht mit MP4 verwechseln. Das erste ist die Bezeichnung des kompletten Standards, das zweite die Dateiendung des MPEG-4-Containerformats (MPEG-4 Part 14).
Die MPEG-Standards allein bringen uns dem codierten Video noch nicht näher. Das MPEG-Gremium programmiert keine Codecs, sondern definiert nur, wie ein gültiger Videostream der entsprechenden MPEG-Version auszusehen hat. Daraus ergibt sich auch grundsätzlich, welche Methoden beim Encoding angewendet werden können und welche nicht. Die Details der Codierung bleiben dann der Phantasie der Codec-Programmierer überlassen. Alle Tricks sind erlaubt, solange das Endergebnis den Vorgaben der verwendeten MPEG-Version entspricht.
Diese Tatsache führt dazu, dass z.B. Xvid und DivX zwei unabhängige und verschiedene Codecs sind, die aber beide Videos nach dem MPEG-4 Advanced Simple Profile erzeugen. Deshalb interessiert sich ein guter Decoder auch nicht dafür, welcher Codec nun das Video erstellt hat (inzwischen funktioniert das auch praktisch in dieser Form). Denn das Format des Bitstroms ist bei beiden dasselbe. Probleme können höchstens Decoder bereiten, die MPEG-4 ASP nicht vollständig unterstützen; z.B. mehrere B-Frames hintereinander nicht korrekt erkennen. Solche Einschränkungen existieren am Computer kaum, sind allerdings bei Wohnzimmerplayern recht wichtig.
Das wichtigste Audioformat der DVD wird von der Firma Dolby entwickelt und ist unter vielen Namen bekannt. Am meisten verbreitet sind die Bezeichnungen Dolby Digital (der von Dolby verwendete Marketingname) und AC-3 (Abkürzung für Adaptive Transform Coder 3, der Name des verwendeten Bitstream-Formats). Kaum jemand kennt dagegen den offiziellen Namen, den das ATSC-Gremium bei der Normierung vergeben hat: ATSC A/52.
Dolby Digital ist ein verlustbehaftetes Format, das mit konstanter Bitrate arbeitet. In der Regel werden für Stereo-Tonspuren 192 kbit/s verwendet, für Mehrkanalton 384 bzw. 448 kbit/s. AC-3 unterstützt bis zu sechs Kanäle, wobei der sechste als zusätzlicher Basskanal ausgelegt ist. Die normalen Bässe stecken in den fünf vollständigen Kanälen, der sechste enthält die zusätzlichen Basseffekte, die die Wände wackeln lassen. Da er eigentlich kein vollständiger Kanal ist, hat es sich eingebürgert, ihn extra anzugeben. Daher kommt die Schreibweise »5.1«, d.h. fünf vollständige Kanäle (vorne links und rechts, vorne Mitte, hinten links und rechts) und ein zusätzlicher Basskanal (LFE: Low Frequency Effects).
Beliebt ist auf der DVD auch DTS, das genauso wie AC-3 ein verlustbehaftetes Format ist, allerdings mit deutlich höheren Bitraten arbeitet und noch mehr Kanäle unterstützt (bis zu 6.1). Die schier endlose Diskussion, ob AC-3 oder DTS besser wäre, ist größtenteils Unfug. Beide Encodingverfahren sind technologisch auf demselben Niveau.
Die MPEG entwickelt, wie oben schon erwähnt, nicht nur Video-, sondern auch Audioformate. Hier sind die drei wichtigsten, alles verlustbehaftete Formate:
MPEG-1 Part 3 Layer 3. Dieses Format kennt wohl jeder als MP3. (Hat nichts mit MPEG-3 zu tun!) Unterstützt wird Mono- oder Stereoton. Zusätzlich existiert seit Herbst 2004 auch eine Spezifikation für Surround-Ton, die in der Praxis jedoch keine Bedeutung hat, denn für Multikanalton existieren bessere und breiter unterstützte Formate.
MPEG-4 Part 3. Wird oft als offizielles MP3-Nachfolgeformat bezeichnet und dürfte vielen unter dem Namen Advanced Audio Coding (AAC) bekannt sein. Multikanalton gehört natürlich zum Funktionsumfang, genauso wie eine Reihe von Codiertechnologien, die je nach Situation verwendet oder deaktiviert werden können. Damit lässt sich AAC sehr flexibel einsetzen.
Xiph.org entwickelt Vorbis als alternatives verlustbehaftetes Audioformat, das komplett frei von patentierten Technologien sein soll und so eventuelle rechtliche Probleme mit den Patentinhabern vermeidet.
Als allein stehende Audiodatei ist Vorbis grundsätzlich in den Ogg-Container verpackt (daher der Doppelname Ogg Vorbis), als Sound eines Videos liegt die Vorbis-Tonspur ohne Ogg-Hülle im Container des gesamten Films.
Vorbis unterstützt natürlich Mono- und Stereoton. Auch ein Multikanal-Modus existiert, der allerdings noch wenig ausgereift ist und für gute Qualität AC-3-ähnliche Bitraten benötigt.
Pulse Code Modulation ist das Standardformat, um unkomprimierten, verlustlosen Ton zu speichern. Es ist auf der DVD mit bis zu acht Kanälen erlaubt. Wegen seiner enormen Größe wird aber auf der DVD kaum und im fertigen Encoding nie eingesetzt. Wenn es uns doch einmal über den Weg läuft, dann meistens in Form einer Wave-Datei (Dateiendung .wav).