Anamorphes Quellvideo

In diesem Abschnitt beschäftigen wir uns mit ein bisschen Theorie und hauptsächlich mit dem Bild der DVD, das uns als Quelle dient. Zu wissen, wie genau die DVD Video speichert, ist zentral, um nicht zum Schluss mit Eierköpfen im Encoding dazustehen.

Was ist eigentlich ein Pixel?

Im Computeralltag gehen wir ohne nachzufragen davon aus, dass ein Pixel ein fest definiertes Etwas ist. Das stimmt auch soweit, dass es sich dabei um die kleinste ansprechbare Einheit eines Bildschirms oder Pixelbildes handelt. Was nicht so klar ist und den Grund für das Anamorph-Problem bildet, ist die Form eines Pixels.

Für die Computerwelt gilt heutzutage, dass Pixel immer quadratisch sind. Für die DVD dagegen gilt, dass Pixel niemals quadratisch sind, sondern meistens breiter als hoch. Da wir die Welt aus Sicht des Computerpixels sehen, ist das Bild auf der DVD in verzerrter Form gespeichert. Wenn wir es in seiner ursprünglichen Auflösung unverändert anzeigen, hat das Eierköpfe zur Folge.

Da auch unser Zielformat MPEG-4 mit unterschiedlich geformten Pixeln arbeiten kann, reicht die Frage nach der Auflösung des Bildes nicht aus. Wir müssen gleichzeitig immer auch nach der Form der Pixel fragen. In den Details kann das in Stress ausarten, wie wir gleich sehen werden.

Begriffsdefinitionen

So staubig und lästig es sein mag: Um nicht rasant in größte Verwirrung zu stürzen, müssen wir uns über eine Reihe von Begriffen klar zu werden.

Seitenverhältnis
Im Englischen Aspect Ratio, woher die typische Abkürzung AR stammt. Beschreibt die Form eines Videobilds oder Pixels als Verhältnis von Breite zu Höhe, das entweder in der Notation b:h (z.B. 16:9) oder x:1 (z.B. 1,78:1) angegeben wird. Oft sieht man auch die reine Kommazahl ohne den Zusatz :1. Es gibt mehrere Arten von Seitenverhältnissen.
Display Aspect Ratio (DAR)

Das DAR beschreibt das Seitenverhältnis des kompletten Bildes, stellt also das Verhältnis von horizontaler Auflösung (Breite) zu vertikaler Auflösung (Höhe) dar. Was genau »komplettes Bild« bedeutet, ist nicht festgelegt.

Beispiel: Ein Bild mit der Auflösung 1920×1080 und quadratischen Pixeln (z.B. das original Blu-ray-Bild) hat ein DAR von 1920:1080, was gekürzt 16:9 bzw. 1,78:1 entspricht.

Die Xvid-VfW-Oberfläche hat das DAR früher »Picture Aspect Ratio« genannt. Das ist schon lange korrigiert, kann aber in Uralt-Anleitungen noch auftauchen. Bitte davon nicht verwirren lassen.

Pixel Aspect Ratio (PAR)

Das PAR beschreibt das Seitenverhältnis eines einzelnen Pixels. Dieser Wert ist nicht identisch mit dem DAR. Unser 1920×1080-Beispiel von oben hat ein PAR von 1:1 – die Pixel sind exakt quadratisch.

Das PAR ist unser Seitenverhältnis der Wahl, mit dem wir beim Encoding tatsächlich arbeiten.

Sample Aspect Ratio (SAR)

Hierbei handelt es sich im eine alternative Bezeichnung für das PAR, die aus dem H.264-Standard stammt. Außer dem Namen gibt es keinen Unterschied zwischen PAR und SAR.

Aus der MPEG-2-Welt stammt eine andere Definition von SAR als Storage Aspect Ratio. Damit ist schlicht und einfach das Verhältnis von horizontaler zu vertikaler Auflösung des gespeicherten Bilds gemeint. Es handelt sich also um eine Variante des DAR. Fürs Encodingwissen spielt diese Definition keine Rolle, aber wenn der Begriff irgendwo anders auftaucht, schaut genau hin, was wirklich damit gemeint ist.
Anamorphes Video

Es gibt zwei Definitionen für den Begriff »anamorph«, die wir leider beide kennen müssen.

  • Digitale Definition: Jedes verzerrt gespeicherte Videobild ist anamorph. Das trifft auf alle Videos mit einem PAR ungleich 1:1 (d.h. nicht-quadratischen Pixeln) zu. Die Stärke der Verzerrung spielt keine Rolle.
  • Analoge Definition (aus der analogen Videotechnik stammend): Nur genau eine Variante der Verzerrung heißt »anamorph«, nämlich das, was auf der DVD mit »16:9 anamorph« bezeichnet wird.

Für unser digitales MPEG-4-Endprodukt ist die analoge Definition Unsinn, weil nur die Frage »quadratisch oder nicht« relevant ist. Entsprechend hat sich dafür der Begriff »anamorph« in der digitalen Definition eingebürgert. Für die DVD wird aber sehr verbreitet die analoge Definition verwendet. Das führt dazu, dass eine 4:3-DVD »nicht-anamorph« heißt, obwohl sie trotzdem keine quadratischen Pixel hat.

In freier Wildbahn werden die beiden Definitionen wild durcheinander gewürfelt. Deswegen sollten wir uns immer zuerst darüber klar werden, was im jeweiligen Zusammenhang gemeint ist. Für das Encodingwissen gilt ausschließlich die digitale Regel, d.h. jedes Video mit nicht-quadratischen Pixeln heißt »anamorph«. Bei DVDs spreche ich passend dazu nicht von anamorphen und nicht anamorphen Filmen, sondern immer von 16:9 und 4:3. So lässt sich die Begriffsverwirrung hoffentlich in Grenzen halten.

Sinn des verzerrten Bildes

Wenn es so viele Probleme verursacht, warum wird das Video dann überhaupt verzerrt gespeichert? Zum einen ist das natürlich der langen Historie der Videotechnik geschuldet, zum anderen hat anamorph technische Vorteile. Um die Implementierung in Hardware einfach zu halten und klare Verhältnisse zu schaffen, ist die Auflösung der DVD fest vorgegeben, egal welches Seitenverhältnis der Film tatsächlich hat. Für die PAL-DVD bedeutet das ein DAR von 1,25. Für die meisten Kinofilme, die in der Region zwischen 1,78 und 2,35 liegen, ist das ein extrem ungünstiger Wert. Bei unverzerrter Speicherung könnte im schlechtesten Fall nur etwa die Hälfte der verfügbaren vertikalen Auflösung ausgenutzt werden, um nicht links und rechts einen Teil des Bildes abschneiden zu müssen. Das Bild verzerrt zu speichern, bietet die Möglichkeit, eine große Vielfalt von Seitenverhältnissen in der DVD-Auflösung unterzubringen und trotzdem so wenig wie möglich Auflösung an schwarze Balken zu verschwenden.

Das Bild der DVD

Das Bild einer PAL-DVD ist mit einer Auflösung von 720×576 gespeichert. Für NTSC gelten 720×480. Die Auflösung ist fix, egal welchen Film wir darin verpacken. Wir können nur zwischen zwei Arten der Verzerrung wählen: 4:3 (wenig verzerrt) und 16:9 (stark verzerrt, entsprechend der analogen Definition von »anamorph«). Daraus ergibt sich: Mit einer DVD als Quelle müssen wir immer eine Verzerrung berücksichtigen, denn das Bild hat nie das richtige Wiedergabe-Seitenverhältnis.

Betrachten wir das Bild der DVD etwas mehr im Detail. Als Beispiel nehmen wir Die fabelhafte Welt der Amélie. Der Film ist mit einem Seitenverhältnis von 2,35 gedreht, muss aber mit dem vorgegebenen 1,78 einer 16:9-DVD auskommen. Die ungenutzte Auflösung wird einfach mit schwarzen Balken aufgefüllt, so dass ein komplettes Frame so aussieht (alle folgenden Screenshots sind verkleinert):

DVD-Frame horizontal gestaucht: 720x576 mit je 70 Pixel Balken oben und unten.

Möglich wäre es auch, das gleiche Bild in einer 4:3-DVD unterzubringen. Das würde weniger Verzerrung, größere Balken und weniger wertvolle vertikale Auflösung bedeuten. In der Anfangszeit der DVD wurden solche Sünden häufiger begangen (z.B. die erste Ausgabe von Titanic). Heutzutage begegnet man so etwas auf professionellen DVDs zum Glück nicht mehr.

Beim Abspielen muss nun das Video entzerrt werden. Dazu streckt der Decoder das Bild horizontal so weit, bis das Seitenverhältnis passt. Für eine 16:9-PAL-DVD ergeben sich 1048 Pixel in der Horizontalen. Unser Amélie-Beispiel sieht dann so aus:

Entzerrtes Frame 1048x576 (Höhe: 436 Pixel Bild plus schwarze Balken

Für Filme, die nicht im Widescreen-Format gedreht sind, sieht die Sache ähnlich aus. Nehmen wir die Simpsons als Beispiel, die lange Zeit passend für den traditionellen Fernseher mit einem AR von 1,33 produziert wurden. Dieses Verhältnis kommt der Auflösung der DVD (AR 1,25) recht nahe und wird deshalb mit der 4:3-Verzerrungsvariante gespeichert. Das sieht dann so aus:

DVD-Frame horizontal gestaucht: 720x576 (keine Balken)

Schwarze Balken gibt es bei 4:3-Material, wenn überhaupt, nur minimal. Im Beispiel sind nur die Ränder des Bildes ein wenig unsauber.

Falls jemand ins Grübeln kommt. Das Bild stammt aus Season 4: Maggies Mission-Impossible-Einlage in A Streetcar Named Marge.

Bei der Wiedergabe passiert das gleiche wie im 16:9-Fall. Der Decoder streckt das Bild auf die korrekte Breite.

Entzerrtes Frame 786x576

Im Vergleich zur Amélie muss man die beiden Maggie-Versionen schon genauer unter die Lupe nehmen, um den Unterschied zu sehen. Am deutlichsten wird die Verzerrung an den Augen, die simpsonstypisch kreisrund sein müssen.

Zentrale Bedeutung des PAR

Nun stellt sich die Frage, wie man die richtige horizontale Auflösung ermittelt. Dafür ist das Pixel Aspect Ratio zuständig. Erinnern wir uns: das PAR beschreibt die korrekte Form eines einzelnen Pixels zum Zeitpunkt der Wiedergabe. Man könnte auch sagen, das PAR beschreibt, wie rechteckig die Pixel sein müssen. Es gibt nur vier Werte. Für PAL und NTSC je einen für 16:9 und 4:3.

PAR nach MPEG-4
  PAL NTSC
4:3 12/11 10/11
16:9 16/11 40/33

Mit dem richtigen Wert aus dieser Tabelle lassen sich die Pixel des Bildes so weit in die Breite ziehen, dass das Seitenverhältnis passt. Allerdings kann ein Computermonitor ausschließlich quadratische Pixel darstellen. Anstatt also die Form der Pixel zu verändern, erhöhen wir in der Horizontalen die Anzahl der Pixel, um den gleichen Entzerrungseffekt zu erhalten.

Die passende horizontale Auflösung auszurechnen, ist anhand der Tabelle sehr einfach. Wir müssen nur den zur DVD passenden Wert ablesen und in diese Formel einsetzen:

hor. Wiedergabeauflösung = hor. DVD-Auflösung × PAR

Für die Amélie müsste die Rechnung dem Beispiel oben zufolge 1047 Pixel ergeben. Und das tut sie auch.

hor. Wiedergabeauflösung = 720 × 16/11 ≈ 1047,27

Wer aufmerksam mitrechnet, dürfte spätestens jetzt die Stirn runzeln. Unsere Zielauflösung enthält 1048×436 Pixel echtes Bild (ohne Balken), was einem Seitenverhältnis (hier das Display Aspect Ratio, DAR) von 2,40 entspricht. Trotzdem heißt es oben, der Film wäre in 2,35 gedreht?

Das stimmt auch. Der Unterschied entsteht, weil wir mit den Werten in der PAR-Tabelle dem MPEG-4-Standard folgen (der sich wiederum sehr eng an ITU-R BT.601 anlehnt). Dieser fordert ein etwas breiteres Bild als die weithin bekannten Werte. Die folgende Tabelle bietet einen Vergleich von ITU/MPEG-4-DAR und allgemein bekanntem »Standard-DAR«.

Generisches und MPEG-4-PAR
bekanntes DAR DAR nach MPEG-4
1,33 (4:3) 1,36
1,78 (16:9) 1,82
1,85 1,89
2,35 2,40

Wie genau die einzelnen PARs zustande kommen und welche Bedeutung das generische Nicht-ITU-PAR hat, damit beschäftigt sich das Kapitel zur ITU-R BT.601 ausführlich. Für das DVD-Backup bringen uns diese Details keinen unmittelbaren Nutzen, weshalb ich das Kapitel eher als Bettlektüre hinterher vorschlage.

Kaffeepause

Die eine Hälfte des Anamorph-Themas ist geschafft. Im nächsten Kapitel beschäftigen wir uns damit, ob und wie wir das verzerrte Bild im encodierten Film beibehalten. Und obwohl das etwas leichtere Kost ist als dieses Kapitel, ist eine Kaffeepause an dieser Stelle eine gute Idee. Immerhin gehört die Anamorph-Thematik neben Interlacing zum schwierigsten, was digitales Video zu bieten hat.

Kommentare