© Monkey Business Images, Familie sieht fern

3-D-Fernsehen ohne Brille

FORSCHUNG
26.05.2010

Der Konsum von 3-D-Filmen und -Fernsehbildern wird künftig auch ohne Brille möglich sein. Während verschiedene Hersteller an der Weiterentwicklung von dafür notwendigen autostereoskopischen Displays arbeiten, wird an der TU Wien eine Konvertierungssoftware entwickelt, die es ermöglichen soll, dass 3-D-Bilder aus verschiedenen Perspektiven geräteunabhängig und kopfschmerzfrei betrachtet werden können.

Die Einführung von 3-D-Fernsehen im Home-Entertainment-Bereich kommt langsam, aber sicher in die Gänge. Erste 3-D-TV-Geräte sind in Österreich erhältlich, mit "Grand Canyon Adventure" wird auch die erste europäische 3-D-Blu-ray-Disc Ende Juni in den Handel kommen.

Bei den 3-D-fähigen TV-Geräten, die derzeit auf dem Markt erhältlich sind, handelt es sich um Geräte, die mit der Shutterbrillentechnik arbeiten, um ein künstliches 3-D-Bild wiederzugeben. Um in den Genuss dieser Bilder kommen zu können, müssen die Konsumenten allerdings spezielle Brillen tragen.

Margrit Gelautz ist außerordentliche Professorin am Institut für Softwaretechnik und Interaktive Systeme an der Technischen Universität (TU) Wien. Sie ist Projektleiterin der Forschungsgruppe, die sich mit 3-D-Systemen für Film und Fernsehen beschäftigt.

"Vorgang ist dem menschlichen Sehen näher"

An der TU Wien wird jedoch bereits am nächsten technologischen Schritt gefeilt. In absehbarer Zeit soll 3-D-Fernsehen ohne den Einsatz einer Brille massentauglich sein. Margrit Gelautz, die mit ihrem mehrköpfigen Team bereits seit geraumer Zeit an der Erforschung von 3-D-Verfahren arbeitet, erklärt gegenüber ORF.at die wichtigsten Probleme, die dabei gelöst werden müssen.

"Um brillenlos künstlich generierte 3-D-Bilder zu sehen, müssen wir wie bei den anderen eingesetzten Verfahren zwei Bilder darstellen und auf das rechte und linke Auge bringen", erklärt Gelautz gegenüber ORF.at. "Dieser Vorgang ist dem ursprünglichen menschlichen Sehen allerdings ähnlicher, weil wir hier zur Trennung der Bilder nur ausnützen, dass die zwei Augen räumlich leicht versetzt sind."

Displays mit Linsen und leichter Rasterung

In der nächsten Generation des 3-D-Fernsehens kommen autostereoskopische Displays zum Einsatz, an denen bereits seit mehreren Jahren bei verschiedenen Herstellern gearbeitet wird. Um einen dreidimensionalen Eindruck zu erreichen, werden die einzelnen Bildschirmspalten so aufgeteilt, dass abwechselnd eine Spalte dem linken Bild und eine Spalte dem rechten Bild entspricht. "Vor die einzelnen Pixel am Bildschirm werden Linsen gelegt, die es schaffen, durch ihre optischen Eigenschaften die Bildinformation aus der betreffenden Spalte genau auf das passende Auge zu lenken", erklärt Gelautz die Funktionsweise von autostereoskopischen Displays.

"Bei dem Display, das wir im Labor haben, kann man eine leichte Rasterung erkennen. Die Bildauflösung wird dadurch in natürlicher Weise etwas reduziert. Durch die zwischengeschalteten Linsenelemente lassen sich die Geräte derzeit nicht in voller Auflösung als normale Fernseher verwenden", so Gelautz, die auch gleich auf den derzeitigen Nachteil entsprechender Geräte eingeht.

Betrachtungskonfiguration entscheidend

Um ein scharfes, den Ansprüchen der menschlichen Wahrnehmung gerechtes 3-D-Bild mit gutem Tiefeneindruck ohne störende Effekte zu bekommen, reicht die Verwendung eines autostereoskopischen Displays alleine zudem nicht aus. "Das eigentliche Problem entsteht dadurch, dass die menschlichen Augen einen bestimmten Abstand haben und man dadurch eine gewisse Konfiguration hat. Daher ist es wichtig, dass die dargestellten Bilder genau an die Betrachtungskonfiguration angepasst werden", erklärt Gelautz.

Ein 3-D-Bild, das für die Darstellung auf einer großen Leinwand im Kino optimiert wurde, würde auf einem kleinen Display im Wohnzimmer durch störende Effekte Kopfschmerzen auslösen. Wer mit 3-D-Material umgeht, sollte also im Vorhinein wissen, in welchem Raum und auf welchem Display ein 3-D-Film erscheinen soll, um die Kameras bereits beim Dreh entsprechend positionieren zu können. Das wiederum ist umständlich und teuer.

Software als Ergänzung für Tiefeneindruck

Dieses Problem lässt sich allerdings mit einer entsprechenden Stereokonvertierungssoftware umgehen, der die Technik der Stereoanalyse zugrunde liegt. Eine solche Software wurde an der TU Wien entwickelt. Sie dient dazu, aus den ursprünglichen zwei Ansichten, die einem gewissen Kameraabstand entsprechen, künstliche Ansichten herzustellen, die andere Abstände zwischen den Kameras simulieren. "Die Software generiert aus den ursprünglichen Ansichten ein Tiefenbild, das jedem Pixel im Bild 'sagt', wie weit der betrachtete Punkt von der Kamera entfernt war. Das ist im Prinzip das, was das menschliche Tiefensehen ausmacht", erzählt Gelautz. Aus diesen Informationen lässt sich mit der Software eine "Tiefenkarte" erstellen, die als Grundlage für die Darstellung der 3-D-Inhalte bei deren Wiedergabe dient.

Das Verfahren der Stereoanalyse wird an der TU Wien seit rund sieben Jahren erforscht und überall dort eingesetzt, wo es darum geht, Entfernungen abzuschätzen. "Das kann etwa im Bereich der Robotik sein, wo ein Roboter gezielt irgendwo hingreifen und sehen muss, in welcher Entfernung sich das Objekt befindet, oder auch bei Rollstühlen, die autonom navigieren und Hindernisse erkennen sollen", so Gelautz.

Exakte Lokalisierung der Objektkonturen

Doch anders als bei einem Rollstuhl, der für die autonome Navigation die Umrisse des Objekts nicht ganz genau erkennen muss, müssen bei der Anwendung der Stereoanalyse für 3-D-Fernsehen die Konturen von Objekten genau lokalisiert werden. "Wenn die Tiefe leicht verschoben ist, passt der Tiefeneindruck nicht mehr mit dem Bildinhalt zusammen, und man würde das Bildmaterial sofort als ungeeignet zurückweisen", sagt Gelautz.

Am Institut für Softwaretechnik und Interaktive Systeme verfeinert man entsprechende Rechenverfahren für den Einsatz bei Film und Fernsehen. Dadurch wird es erst möglich, dass die Berechnungen schnell genug für den Produktionseinsatz durchgeführt werden. Denn die Umrechnung ist sehr aufwendig. Ziel sei es, einen Videoclip von fünf Minuten Länge in ein bis drei Stunden umrechnen zu können, um höchste Qualität zu erreichen, so Gelautz. Derzeit würden noch die letzten Anpassungen vorgenommen, um das Verfahren speziell für 3-D-Fernsehen zu optimieren. An einen Live-Einsatz des Systems ist derzeit aufgrund der langwierigen Berechnungsvorgänge allerdings nicht zu denken.

Erweiterung der Perspektiven als Herausforderung

"Unsere derzeitige Herausforderung ist es, künstliche Ansichten zu generieren, die über den ursprünglichen Kamerastereowinkel hinausgehen. Dabei muss man Bildinformationen einfügen, die in den ursprünglichen Bildern gar nicht vorhanden sind. Wir haben auch hier bereits gute Ansätze und erwarten uns in den nächsten Monaten schöne Ergebnisse", so Gelautz.

Im Rahmen eines Forschungsprojekts, das vom Wiener Wissenschafts-und Technologiefonds (WWTF) unterstützt wird, wird zudem in Kooperation mit Microsoft Research in Cambridge (GB) die Rekonstruktion der Objektkonturen untersucht. "Dabei versuchen wir bei gemischen Pixeln die Teilinformation möglichst exakt zu extrahieren, damit man bei künstlichen Ansichten auch einen neuen Hintergrund hinzufügen kann", erklärt Gelautz.

Tiefenkarte als Basis für Displays

Abseits der Grundlagenforschung wurde von Institutsmitarbeitern zudem ein Start-up namens Emotions3D gegründet, das die Stereokonvertierungssoftware kommerziell auf den Markt bringen möchte. Eine Schwierigkeit dabei ist derzeit allerdings, dass jeder Hersteller von autosteroskopischen Displays auf andere Standards setzt. Während Philips beispielsweise als Input ein Bild und die Tiefenkarte - auch 2D+Depth genannt - verlangt, und die virtuellen Ansichten vom System auf Grundlage dieser Daten selbstständig generiert werden, setzen andere Display-Hersteller darauf, dass in einem kompatiblen Film von jedem Einzelbild vier bis acht verschiedene Ansichten bereits vorliegen. Doch auch für dieses Verfahren dient eine Tiefenkarte als Vorlage. "Emotions3D möchte eine herstellerunabhängige Schnittstelle entwickeln, die es uns erlaubt, auf die Anforderungen der einzelnen Hersteller einzugehen."

Durch die zusätzlichen Perspektiven ist es einerseits möglich, dass mehrere Nutzer mit Multi-User-Displays das 3-D-Bild aus unterschiedlichen Perspektiven sehen können, anderseits kann man als Einzelnutzer das dargestellte Objekt auch aus mehreren verschiedenen Perspektiven deutlich betrachten, weil das System statt nur einem gleich mehrere optimale Beobachtungspunkte (Sweet-Spots) erlaubt. "Man wechselt dabei von einem Sweet-Spot in den nächsten", beschreibt Gelautz.

Werbung mit Überraschungseffekten

Interesse an der 3-D-Visualisierung besteht unter anderem auf dem Markt für Medizintechnik, wo diese Systeme in der Lehre Einsatz finden könnten, etwa bei der Darstellung von Operationstechniken. Auch die Werbeindustrie hat ein besonderes Interesse an der Weiterentwicklung der brillenlosen 3-D-Technik. "Man kann damit an exponierten Stellen wie Einkaufszentren 3-D-Werbedisplays installieren, um noch eindringlicher für Produkte zu werben. Mit den Tiefenkarten kann man leicht Bildeffekte und andere Objekte hinzufügen und somit Überraschungseffekte generieren", so Gelautz.

Doch nicht jeder Mensch kann die mit diesem Verfahren dargestellten 3-D-Bilder gleich gut wahrnehmen, beispielsweise können bestimmte Formen von Hornhautverkrümmung dazu führen, dass die Darstellungsverfahren nicht mehr wirken. "Es gibt einen kleinen Prozentsatz von Leuten, die 3-D-Bilder aus physiologischen Gründen nicht gut wahrnehmen können. Die werden von dieser Darstellung nicht profitieren", so Gelautz. Die TU-Professorin glaubt zudem, dass noch viel daran geforscht werden müsse, um die verschiedensten Einflussquellen zu berücksichtigen. "Oft ist es weder für Laien noch für Experten offensichtlich, ob ein Tiefeneindruck, der einem nicht ganz kohärent vorkommt, vom Display oder von der Auswahl der Blickwinkel kommt, die nicht optimal gewählt sind. An diesem Bereich muss noch gearbeitet werden."

Mehr zum Thema:

(futurezone/Barbara Wimmer)