Die Bedeutung der ITU-R BT.601 für das PAR

Das Anamorph-Kapitel hat es bis hierhin schon in sich, wenn man zum ersten Mal damit in Kontakt kommt. Die Hintergründe und die Diskussion um die verschiedenen Pixel Aspect Ratios dort auch noch anzusprechen, würde den Rahmen deutlich sprengen. Deswegen beschäftigen wir uns jetzt in einem eigenen Abschnitt damit.

Dieses Kapitel ist für Nerds, die auch noch das allerletzte Haar spalten wollen. Pragmatiker dürfen es getrost ignorieren. Die Auswirkungen der verschiedenen PAR-Berechnungen sind so gering, dass wir sie in der Praxis vernachlässigen können. – So, nachdem das geklärt ist: Setzt Kaffee auf, stellt das Telefon ab, legt euch Papier und Bleistift bereit und los geht’s! ;-)

Das Problem: unklares DVD-Seitenverhältnis

Was ist eigentlich das Problem? Nun, die DVD ist nicht besonders genau bei der Angabe des Seitenverhältnisses, was auf den MPEG-2-Videostream zurückgeht. Der MPEG-2-Standard definiert Seitenverhältnisse als Display Aspect Ratios (abgesehen von quadratischen Pixeln, die auf der DVD nicht vorkommen) . Das führt dazu, dass die DVD nur die Information »16:9« oder »4:3« enthält. Nun sollte man meinen, das hieße schlicht und einfach: wir strecken bzw. stauchen das komplette DVD-Bild horizontal so weit, bis es genau 16:9 bzw. 4:3 entspricht.

Leider funkt die analoge Fernsehtechnik dazwischen, genauer gesagt die von der ITU, Abteilung »Radiocommunication«, herausgegebene Empfehlung Nummer BT.601 (früher »CCIR 601«). Die hat mit der DVD zunächst gar nichts zu tun, sondern definiert, wie ein analoges Fernsehsignal in digitale Pixelbilder umzurechnen ist. Die Auflösung, die dabei herauskommt, liegt zwar sehr dicht an der DVD-Auflösung, entspricht ihr aber nicht exakt. Gleichzeitig ist die ITU-R BT.601 eine Art »Naturgesetz« der analogen Videowelt.

Und weil’s so schön ist, hat MPEG-4 das PAR gleich noch einmal neu definiert. Zum Glück sind sich wenigstens ASP und AVC einig. Letztendlich haben wir es mit vier PAR-Varianten zu tun:

  • Generisches PAR nach MPEG-2,
  • PAR nach MPEG-4,
  • PAR nach ITU-R BT.601,
  • diverse ungenaue Berechnungsmethoden, die sich trotzdem verbreitet haben.

Das MPEG-2-Pixel ist am schmälsten, die MPEG-4-Variante ist etwas breiter und ITU erzeugt das breiteste Pixel. Wie die Berechnungen funktionieren, sehen wir uns jetzt nacheinander an.

Analog/Digital-Wandlung mit der ITU-R BT.601

Die analoge Fernsehtechnik hängt eng mit dem Röhrenmonitor zusammen. Dieser baut das Bild mit einem Elektronenstrahl auf, der wie in der folgenden Abbildung über den Monitor streicht.

PAL: 574 Scanlines + je 1/2 Scanline oben und unten. NTSC: 484 + je 1/2 Scanline oben und unten.

Der Elektronenstrahl setzt oben in der Mitte an und zeichnet die erste Zeile (rote durchgezogene Linie), wird abgeschaltet und zum Anfang der nächsten Zeile versetzt (graue gestrichelte Linie), wo er wieder aktiv wird und die nächste Zeile zeichnet. Das geht immer so weiter, bis ganz unten in der Mitte das Ende erreicht ist. Die vertikale Bewegung passiert dabei während der Elektronenstrahl aktiv ist. D.h. die Zeilen eines Fernsehbildes sind leicht schräg nach unten geneigt.

Diese Darstellung ist vereinfacht und entspricht nicht ganz der Realität. Ein analoges Bild ist immer interlaced, d.h. es setzt sich aus zwei Halbbildern zusammen, die unabhängig voneinander gezeichnet werden. Deswegen bitte die Abbildung von oben nicht als die exakte praktische Arbeitsweise eines TV-Monitors missverstehen!

Das europäische Fernsehformat PAL arbeitet mit 574 ganzen Zeilen (Scanlines) pro Bild. Dazu kommt die halbe Scanline oben und die halbe unten. Das amerikanische NTSC funktioniert genauso mit 484 vollständigen Scanlines plus zwei halbe.

Vertikale A/D-Wandlung

Für die digitale Welt benötigen wir diskrete, d.h. abzählbare, Werte, die sich als eine Anzahl von Pixeln darstellen lassen. In der vertikalen Dimension haben wir mit den Scanlines schon analog eine solche Unterteilung. Es liegt nahe, Zeilenanzahl mit Pixelanzahl gleichzusetzen, und genau so erfolgt auch die vertikale Analog/Digital-Konvertierung.

Unschön sind lediglich die beiden halben Scanlines, die aus zwei Gründen nicht so recht ins digitale Konzept einer rechteckigen Auflösung passen wollen.

  • Die unbenutzte Hälfte der Zeilen enthält keine Information und damit ist das Bild genau genommen nicht rechteckig, sondern hat oben links und unten rechts eine kleine Kerbe.
  • Da die Scanlines leicht schräg stehen, ist eine halbe Scanline auch nur halb so hoch wie eine ganze.

Gelöst wird das ganz pragmatisch, indem man die digitalen halben Zeilen einfach als vollständig behandelt und die jeweils fehlende Hälfte mit Schwarz auffüllt.

Ganz exakt entspricht die Höhe des analogen Bilds also 574 + 2×½ = 575 Pixel für PAL und 484 + 2×½ = 485 Pixel für NTSC. Diese Werte sind nachher für die PAR-Berechnung wichtig. Für das digitale Bild werden daraus durch das Auffüllen der halben Scanlines 576 Pixel für PAL und 486 Pixel für NTSC.

Horizontale A/D-Wandlung

Die horizontale Auflösung lässt sich nicht so einfach und eindeutig wie die vertikale ermitteln, denn eine analoge Scanline ist eine Wellenform von einigen Mikrosekunden Dauer und ohne jede offensichtliche Unterteilung. Um diskrete (digitale) Werte zu erhalten, müssen wir das analoge Signal in bestimmten Zeitabständen abtasten und den ermittelten Wert als Pixel speichern. Das nennt man Sampling. Die Geschwindigkeit der Abtastung heißt Samplingrate und wird in Hertz (Hz = Abtastungen pro Sekunde) gemessen. Dabei gibt es kein absolutes Richtig oder Falsch. Prinzipiell können wir eine Scanline in beliebig viele Pixel unterteilen, ob das nun 10 oder 10.000 sind.

Um ein TV-Bild sinnvoll zu digitalisieren, sind auf jeden Fall mehrere Millionen Samplingvorgänge pro Sekunde (Megahertz, MHz) nötig. Die ITU-R BT.601 sagt uns, dass wir eine Scanline mit 13,5 MHz abtasten müssen. Das gilt sowohl für PAL als auch NTSC. Diese einheitliche Rate erzeugt für beide Fernsehnormen eine DVD-nahe Auflösung und vereinfacht es, universelle Hardware-A/D-Wandler zu bauen, was wohl der Hintergedanke der ITU-Empfehlung war.

Leider passt der Wert nicht exakt auf die 720 horizontalen Pixel der DVD. Der Elektronenstrahl eines PAL-Fernsehers benötigt 52 µs Zeit, um eine Scanline zu zeichnen. Mit der ITU-Samplingrate von 13,5 MHz erhalten wir 52 µs × 13,5 MHz = 702 horizontale Pixel, was insgesamt einer aktiven Auflösung von 702×575 Pixeln entspricht. Aktiv heißt, das komplette Bild, wie es einmal im analogen Signal vorhanden war, liegt innerhalb dieser 702 Pixel.

Die Situation für NTSC stellt sich ähnlich dar. Eine NTSC-Scanline ist 52+59/90 µs lang und wird mit 13,5 MHz ITU-Samplingrate abgetastet. Damit erhalten wir 52,656 µs × 13,5 MHz = 710,85 horizontale Pixel. Die gesamte aktive Auflösung ist also 710,85×485.

Anwendung der ITU-R BT.601

PAR-Berechnung für PAL

Die Auflösung einer PAL-DVD ist auf 720×576 Pixel festgelegt. Zwar erlaubt der Standard auch ein paar andere Varianten, die praktisch aber nur geringe Bedeutung haben. Unser aktives Bild mit 702×575 Pixeln ist also kleiner als die DVD-Auflösung. Grafisch stellt sich die Situation wie in der folgenden Abbildung dar. Die graue Fläche ist die DVD-Auflösung, die dünne rote Linie kennzeichnet das aktive ITU-Bild.

horizontal: 702 aktiv, 720 gesamt; vertikal: 575 aktiv, 576 gesamt

Wir müssen nun 702×575 aktive Pixel in 720×576 DVD-Pixeln unterbringen. Vertikal kein Problem: Da die vertikale D/A-Wandlung die beiden halben Scanlines oben und unten zu ganzen Zeilen erweitert, ergeben sich vertikal 576 Digital-Pixel und die Auflösungen stimmen exakt überein. Horizontal dagegen bleiben 18 ungenutzte Pixel übrig. Der Einfachheit halber zentrieren wir das ITU-Bild innerhalb der DVD-Auflösung, so dass links und rechts jeweils ein 9 Pixel breiter Balken entsteht, den wir mit Schwarz auffüllen.

Interessant wird es bei der Wiedergabe, denn jetzt kommen die verschiedenen Pixelformen ins Spiel. Was wir nun erarbeiten wollen, lässt sich auf zwei Arten ausdrücken. Wir benötigen

  • eine Angabe über die Form eines DVD-Pixels oder
  • einen Multiplikator, mit dem wir eine unverzerrte Wiedergabeauflösung mit quadratischen Pixeln erzeugen können.

Das sind zwei verschiedene Sichtweisen auf ein und dasselbe Problem, d.h. es ist egal, welchen Standpunkt wir einnehmen. In jedem Fall ist der gesuchte Wert das so genannte Pixel Aspect Ratio, kurz PAR (alternativ bekannt als Sample Aspect Ratio, SAR). Im Bild unten sehen wir die nötige Entzerrung für eine 16:9-PAL-DVD.

(Quelle: 702×576 bzw. 720×576) - Entzerrung mit PAR 16:9 PAL - (Ziel: 1022×576 bzw. 1048×576)

Wie kommen die gezeigten Werte zustande? Wir kennen die Auflösung, die genau dem aktiven analogen Signal entspricht: 702×575. Genauso wissen wir, dass diese Auflösung exakt einem 16:9- bzw. 4:3-DAR entspricht. Die Form eines einzelnen Pixels erhalten wir dann mit dieser Formel:

PAR = (aktive Höhe × DAR) / aktive Breite

Für PAL bedeutet das konkret:

16:9-PAR = 1024/702 = 512/351 = 1,4587; 4:3-PAR = 768/702 = 128/117 = 1,0940

Diese Werte können wir entsprechend den zwei Sichtweisen von oben verschieden interpretieren.

  • Die Pixel einer 16:9-PAL-DVD sind ca. 1,46 mal so breit wie hoch.
  • Das Bild einer 16:9-PAL-DVD muss für die unverzerrte Wiedergabe auf ca. 146% in die Breite gezogen werden.

Beide Sichtweisen führen zu absolut identischen Ergebnissen.

Um beim Abspielen die richtige Breite zu erhalten, multiplizieren wir die DVD-Breite mit dem PAR. Aber Achtung! Auch wenn nur 702 Pixel aktiv sind, hat die DVD trotzdem eine Auflösung von 720 Pixeln. Auch die 18 nicht aktiven Pixel müssen gestreckt werden.

16:9-Breite = 720 × 4600/3159 ≈ 1048,43 Pixel
4:3-Breite = 720 × 1150/1053 ≈ 786,32 Pixel

Damit sollte klar werden, warum nach ITU-Norm das Bild ein wenig breiter als die Standard-DARs 4:3 oder 16:9 ausfällt. Das sind genau die 18 nicht aktiven Pixel, die in gestreckter Form die Abweichung zum Standard-DAR ergeben (24,43 bzw. 18,32 Pixel). Der aktive Teil der endgültigen Auflösung entspricht dem 16:9- bzw. 4:3-DAR.

Eine Miniabweichung bleibt wegen des Höhenunterschieds zwischen den 574 + 2×½ analogen Scanlines und den 576 Pixeln der DVD. Das aktive digitale 16:9-Bild ist also nicht absolut exakt 16:9 ≈ 1,778, sondern 575:324 ≈ 1,775: ca. 1,8 Pixel schmäler.

PAR-Berechnung für NTSC

Für die NTSC-DVD gilt eine Standardauflösung von 720×480. Horizontal besteht also kein Unterschied zu PAL, denn unser 710,85×485 großes ITU-Bild lässt sich in der Breite problemlos in den 720 vorhandenen DVD-Pixeln unterbringen. Unschöner sind die 480 vertikalen DVD-Pixel, die für die 485 aktiven Pixel nicht ausreichen. Wir stehen grafisch also vor folgender Situation. Die graue Fläche stellt wie oben bei PAL die DVD-Auflösung dar, der rote Rahmen den aktiven ITU-Bereich.

horizontal: 710,85 aktiv, 720 gesamt; vertikal: 485 aktiv, 480 gesamt

Prinzipiell wäre es möglich, vertikal ähnlich zu verfahren wie horizontal, also 485 aktive Pixel in 480 DVD-Pixel zu quetschen und zusätzlich zum horizontalen mit einem vertikalen PAR zu arbeiten. Das ist genauso lästig wie es klingt, deswegen hat man sich für ein einfacheres Verfahren entschieden. Was nicht passt, wird passend gemacht! Wir schneiden ganz einfach oben und unten je drei Pixel ab und gut ist. Drei? Ja, denn auch bei NTSC erweitert die D/A-Wandlung die beiden halben Scanlines oben und unten, was auf 486 digitalisierte Pixelzeilen hinausläuft.

Natürlich bringt das Cropping eine kleine Abweichung des DAR mit sich, die aber fürs Abspielen unwichtig ist. Die digitale Wiedergabe ist zu jedem beliebigen Seitenverhältnis fähig und am analogen Fernseher müssen während der Digital/Analog-Wandlung so oder so die fehlenden Zeilen ergänzt werden, um ein gültiges NTSC-Signal zu erzeugen.

Damit befinden wir uns tatsächlich in einer Situation, die derjenigen bei PAL entspricht. Die vertikale Auflösung stimmt und horizontal berechnen wir das PAR als Verzerrungsfaktor. Sehen wir uns die nötige Entzerrung an der folgenden Abbildung an.

(Quelle: 710,85×480 bzw. 720×480) - Entzerrung mit PAR 16:9 NTSC - (Ziel: 862×480 bzw. 873×480)

Wir kennen die digitale Auflösung, die genau dem aktiven analogen Signal entspricht: 710,85×485. Daraus muss exakt ein 16:9- bzw. 4:3-DAR werden. Wie schon bei PAL rechnen wir mit dieser Formel:

PAR = (aktive Höhe × DAR) / aktive Breite

Das ergibt folgende NTSC-PARs:

16:9-PAR = 864/710,85 = 5760/4739 = 1,2154; 4:3-PAR = 648/710,85 = 4320/4739 = 0,9116

Beim Abspielen multiplizieren wir wieder die horizontale DVD-Auflösung mit dem PAR.

16:9-Breite = 720 × 155200/127953 ≈ 873,32 Pixel
4:3-Breite = 720 × 38800/42651 ≈ 654,99 Pixel

Auch hier entsprechen die gestreckten nicht-aktiven Pixel dem Unterschied zum Standard-DAR.

Die NTSC-Abweichung zwischen analog und digital fällt größer aus als bei PAL, da wir es nicht nur mit der Differenz zwischen 484 + 2×½ analogen Scanlines und 486 digitalisierten Pixelzeilen zu tun haben, sondern das Bild auf 480 Pixelzeilen croppen. Das aktive digitale 16:9-Bild des NTSC-DVD ist also nicht exakt 16:9 ≈ 1,778, sondern 97:54 ≈ 1,796: ca. 8,9 Pixel breiter.

Zusammenfassung und mehr Zahlen

Fassen wir zusammen: PAL und NTSC unterscheiden sich nicht wesentlich, lediglich hantieren wir bei NTSC mit unschöneren Zahlen. Beide Formate ergeben nach ITU ein etwas breiteres Bild als vom Standard-DAR gewohnt, was an den verbleibenden nicht aktiven Pixeln liegt. Für die korrekte Wiedergabe sorgen je nach Format vier PAR-Werte.

PAR nach ITU-R BT.601
  PAL NTSC
4:3 1150/1053 38800/42651
16:9 4600/3159 155200/127953

Die Tabelle enthält die rigoros exakten Werte, so wie sie sich aus der ITU-Empfehlung und den Eigenschaften des analogen Signals ergeben.

Wahrscheinlich. ;-) Ich war mir schon mehrmals sicher, die Sache komplett verstanden zu haben – nur, um das Kapitel irgendwann doch wieder anpassen zu müssen.

Es gibt zwei weit verbreitete »Fehlberechnungen«.

  • Die meisten Seiten einschließlich der Wikipedia und des oft zitierten Artikels von Jukka Aho berücksichtigen die Sache mit den zwei halbhohen Scanlines nicht, rechnen also mit vollen 576 bzw. 486 Zeilen.
  • Zusätzlich wird gerne NTSC mit 711 anstatt 710,85 Pixeln Breite gerechnet.

Praktisch sind solche Ungenauigkeiten unwichtig. Sie liegen nicht nur weit unter Grenze, ab der eine Verzerrung wahrnehmbar wird, sondern sogar innerhalb der offiziell definierten Toleranzgrenzen für analoge Signale.

Damit haben wir die ITU-R BT.601 endlich vollständig abgehandelt. Die restlichen PAR-Varianten sind dagegen leichte Frühstückskost.

Die PAR-Tabelle nach MPEG-4

Der aufmerksame Leser wundert sich bestimmt schon längst. Die ITU-PAR-Tabelle stimmt doch mit der Tabelle aus dem Anamorph-Kapitel nicht überein! Die sieht nämlich so aus:

PAR nach MPEG-4
  PAL NTSC
4:3 12/11 10/11
16:9 16/11 40/33

Das ist das PAR nach MPEG-4-Definition, in der H.264-Spezifikation zu finden in Tabelle E-1. MPEG-4 Visual definiert die gleichen Werte in Tabelle 6-12. So unterschiedlich die Brüche auf den ersten Blick anmuten: wenn man sie ausdividiert, kommt bei ITU- und MPEG-4-Tabelle fast das Gleiche heraus. Die Abweichung liegt im Bereich von 1 Pixel zum ITU-PAR.

Bleibt die Frage, warum die Zahlen überhaupt abweichen. Das kann letztendlich nur die MPEG beantworten. Ich schätze, die krummen Werte des ITU-PARs waren – Video-Naturgesetz hin oder her – doch ein bisschen zu viel des Wahnsinns. Also hat man sich für eine Alternative mit so geringer Abweichung entschieden, dass sie für alle praktischen Anwendungen mit den exakten ITU-Werten gleichgesetzt werden kann. Außerdem arbeitet sie mit glatt durch 16 (Größe eines Makroblocks) teilbaren Auflösungen, und die PARs sind einfach zu merken.

Perfekt! Was müssen wir tun?

Das MPEG-4-PAR definiert eine aktive Bildfläche von 704×576 Pixeln (PAL) oder 704×480 (NTSC). Diese Auflösungen entsprechen exakt 16:9 bzw. 4:3. Keine halben Scanlines, keine abgeschnittenen Pixel. Simpel! Sogar so nett, dass die 704er-Auflösungen auf der DVD offiziell erlaubt sind.

Die PAR-Berechnung unterscheidet sich nicht von dem, was wir bei der ITU-Variante ausführlich erkundet haben. Am Ende steht die obige Tabelle.

Generisches PAR nach MPEG-2

Das generische PAR ist die einfachste und aus digitaler Sicht die eingängigste Variante. Implizit definiert wird es durch DVD und MPEG-2. Implizit deshalb, weil beide Spezifikationen gar keine Pixelformen (PAR) festlegen, sondern die Form des gesamten Bildes (DAR). Nur weil die DVD eine feste Auflösung hat, lässt sich daraus ein eindeutiges PAR ermitteln.

Die generische Berechnung sieht die volle Auflösung der DVD als aktiv an. Das heißt, der Film füllt die 720×576 Pixel der PAL-DVD vollständig aus, genauso wie die 720×480 Pixel der NTSC-DVD. Beim Abspielen verzerren wir das Bild horizontal so weit, dass ein genaues 16:9- bzw. 4:3-Verhältnis entsteht. Dafür gilt unsere gewohnte PAR-Formel genauso wie für MPEG-4 oder ITU.

PAR = (aktive Höhe × DAR) / aktive Breite

Für PAL bedeutet das konkret:

16:9-PAR = (576 × 16:9) / 720 = 64/45 ≈ 1,42222; 4:2-PAR = (576 × 16:9) / 720 = 16/15 ≈ 1,06667

Und NTSC sieht so aus:

16:9-PAR = (480 × 16:9) / 720 = 32/27 ≈ 1,18519; 4:2-PAR = (480 × 16:9) / 720 = 8/9 ≈ 0,88889

Beim Abspielen werden daraus fast immer schöne runde Auflösungen, nämlich für PAL:

16:9 = 720 × 64/45 = 1024 ⇒ 1024×576 Pixel,
4:3 = 720 × 16/15 = 768 ⇒ 768×576 Pixel,

und für NTSC:

16:9 = 720 × 32/27 = 853,33 ⇒ 853×480 Pixel,
4:3 = 720 × 8/9 = 640 ⇒ 640×480 Pixel.

Zur Übersicht hier das generische PAR in der gewohnten Tabelle:

Generisches PAR
  PAL NTSC
4:3 16/15 8/9
16:9 64/45 32/27

Glaubenskrieg: Generisch vs. ITU/MPEG-4

Seit Jahren tobt nun ein mit religiöser Hingabe geführter Streit darum, welche PAR-Rechnung der absolute Schluss der Weisheit wäre: ITU oder generisch.

Mit ITU-PAR meine ich im Folgenden gleichzeitig die MPEG-4-Werte, denn um die geht es eigentlich. Niemand ist wahnsinnig genug, ernsthaft das ITU-PAR in voller Exaktheit verwenden zu wollen. Das ist praktisch gar nicht möglich, da sich viele der krummen Brüche überhaupt nicht in die Bitstreams von ASP- und H.264-Video schreiben lassen.

Eine analoge Fernsehkamera am Anfang der Verarbeitungskette ist der Grundgedanke hinter der ITU-R BT.601, denn nur dann haben wir es mit der Art Quelle zu tun, auf die sich die Empfehlung bezieht: ein analoges NTSC- bzw. PAL-Signal. Schon auf analoge Kinofilme mag die BT.601 nicht mehr so richtig passen, und in der modernen Welt mit digitalem Quellmaterial verliert sie völlig ihren Sinn.

Hintergedanken von ITU-PAR und Generischem PAR
  ITU-PAR Generisches PAR
vorgesehene Quelle analoge TV-Kamera digitale Quelle
Verbreitungsmedium digital (z.B. DVD, DVB) digital (z.B. DVD, DVB)
typisches Abspielgerät analoger Fernseher digital/analog gleichermaßen
Verhältnis zur DVD-Auflösung aktiver Bereich kleiner als DVD-Auflösung aktiv ist gesamte DVD-Auflösung

ITU steht also voll in der langen Tradition der analogen Videotechnik. Das generische PAR dagegen ist genauso eindeutig ein Kind des digitalen Zeitalters, in dem analoge Besonderheiten keine Rolle mehr spielen. Darüber sind sich die Verfechter sämtlicher Lehren auch einig. Aber nur so weit, und kein bisschen weiter.

Entscheidend: Produktions-PAR

Die große Frage beim DVD-Backup besteht nun darin, welches PAR wir benutzen sollten. Der Streit darum wird heftig geführt, bleibt nicht immer ganz sachlich und geht meistens am Kern des Problems vorbei. Erst einmal müssen wir zwei Dinge klarstellen, mit denen in Diskussionen immer wieder argumentiert wird.

  • Das Generische PAR ist nicht auf jeden Fall falsch. Genauso ist das ITU-PAR nicht auf jeden Fall richtig.
  • Die Art der Wiedergabe (am Computer, TV, sonstwo) spielt keine Rolle.

Immer unter der Voraussetzung, dass wir das ursprüngliche Seitenverhältnis so exakt wie möglich wieder herstellen wollen, existiert genau ein entscheidender Faktor, der über das richtige PAR entscheidet:

Mit welchem PAR arbeitet die jeweilige DVD?

Eigentlich ist die Überlegung so simpel, dass überhaupt keine Diskussion entstehen sollte. Wenn Person A einen Film horizontal auf die Hälfte staucht und Person B das ursprüngliche Bild wieder herstellen will, dann muss Person B den Film auf 200% auseinander ziehen. Und wenn Person A einen anderen Film auf drei Viertel seiner Breite quetscht, dann muss Person B diesen Film auf 133% auseinander ziehen. Im zweiten Fall stur auf 200% zu beharren, wäre Unfug.

Genau so verhalten sich aber sowohl die Hardcore-Verfechter des ITU-PAR als auch die Hardcore-Verfechter des Generischen PAR. Da wird seitenlang gestritten und am eigentlichen Kern des Problems geradeaus vorbeidiskutiert.

Das richtige PAR ist dasjenige, das im Produktionsprozess benutzt wurde.

An dieser Stelle sollte eine sinnvolle Diskussion ansetzen, denn so klar die Grundaussage auch ist, die praktische Umsetzung bereitet Probleme. Da das exakte PAR nirgendwo auf der DVD vermerkt ist, existiert keine Möglichkeit, den richtigen Wert einfach abzulesen. Genauso unmöglich erscheint es bei kommerziellen DVDs, sämtliche Techniker der kompletten Verarbeitungskette vom ursprünglichen Quellmaterial bis hin zur fertigen Disc ausfindig zu machen und nachzufragen. Es bleibt also nur die Trial-and-Error-Methode: Wir entzerren das Bild mit den verschiedenen PARs und messen nach, ob Kreise auch wirklich rund erscheinen.

Größe der Abweichung

Lohnt sich ein solcher Aufwand oder überhaupt der ganze Glaubenskrieg? Das tut er dann, wenn zwischen den PAR-Varianten ein zweifelsfrei sichtbarer Unterschied besteht. Um die Encodingpraxis nicht zu ignorieren, müssen wir MPEG-4-PAR und Generisches PAR vergleichen. Nehmen wir PAL 16:9 als Beispiel, bei den anderen drei Fällen ist das Ergebnis identisch.

Abweichung = MPEG-4-PAR / Generisches PAR = z.B. 16:11 / 64:45 ≈ 2,3%

Das MPEG-4-Bild fällt also gut zwei Prozent breiter aus als das generische Bild. Besorgniserregend ist das nicht. Früher, als wir noch Xvid-AVIs mit kleinskalierter Mod16-Auflösung erstellt haben, galten bis zu ca. 2,5% Verzerrung als unbedenklich.

Es leuchtet mir nicht ein, warum ein anamorphes Bild mit ähnlich großem potenziellen »Aspect Error« weniger unproblematisch sein sollte. Fehler dieser Größenordnung sind nur im direkten Vergleich oder mit genauen Messungen spürbar. Auf die normale Wiedergabe haben sie keine nennenswerte Auswirkung.

Daumenregeln

Da wir über Nuancen reden, die ohne genau hinzusehen unsichtbar bleiben, und Kreise nachzumessen in der Praxis zu kompliziert, zeitaufwändig und fehleranfällig ist, stellt eine sinnvolle Daumenregel uneingeschränkt die beste Lösung dar. Dabei gehen wir immer davon aus, dass es DVDs mit ITU-PAR und DVDs mit Generischem PAR gibt.

Um diese Eckpunkte herum liegt ein großer Graubereich. Denn es gibt keinen Grund anzunehmen, dass für jede DVD in sämtlichen Verarbeitungsschritten konsistent die selbe PAR-Variante verwendet wird.
Daumenregel 1: für Pragmatiker
Unser übliches Zielformat ist MPEG-4, also verwenden wir das PAR nach MPEG-4-Definition. Die Werte sind einfach zu merken und praktisch jede MPEG-4-Software arbeitet von Haus aus damit.
Daumenregel 2: für Enthusiasten

Diese Regel nimmt das Bild der DVD als Indikator für die PAR-Variante, genauer gesagt das Vorhandensein von schwarzen Balken.

  • Für DVDs mit vertikalen Balken erscheint es ungewöhnlich, Generisches PAR anzunehmen. Aus welchem Grund sollte jemand zwar 720 Pixel als aktiv ansehen, dann aber trotzdem nicht die volle Breite ausnutzen? Zudem liegt die Balkendicke oft verdächtig genau im Bereich der nicht aktiven Pixel. Solche DVDs entzerren wir also nach MPEG-4.
  • DVDs, die die komplette DVD-Auflösung ausnutzen, entzerren wir der gleichen Logik folgend mit dem Generischen PAR.

Keine der Daumenregeln ist der Weisheit allerletzter Schluss. Wir müssen uns schlicht und einfach damit abfinden, dass absolute Exaktheit beim Seitenverhältnis ein unerreichbares Ideal bleibt. Und diese Erkenntnis ist aus meiner Sicht auch das Ende der Diskussion.

Die hochauflösenden Formate wie Blu-ray oder HDTV sind von der ganzen Problematik nicht betroffen. Da denen von Anfang an ein digitales Szenario zugrunde liegt, ist das Generische PAR die einzig sinnvolle Wahl. Zudem verwendet die große Mehrheit der HD-Quellen die Standardauflösungen 1280×720 oder 1920×1080, die sich beide durch quadratische Pixel auszeichnen: PAR 1:1 ohne jeden Zweifel.

Kommentare