Die 3D-Audioproduktion für Virtual Reality – was man dazu wissen muss!

3D Audio VR dreidimensionaler Sound
3D-Audioproduktion für Virtual Reality: So gehts | © Illustration: Pavel Sokolov

Werden wir heute mit Begriffen wie Virtual Reality, Gear VR oder Playstation VR konfrontiert, denken die Allermeisten von uns an visuellen Inhalt. Nur eine Minderheit denkt dabei an die akustische Kulisse, Spatial Audio und die 3D-Audioproduktion für den dreidimensionalen Raum.

Diese Zeilen basieren auf Erfahrungen, welche ich im letzten Jahr auf diesem Gebiet sammeln durfte. Sie stammt aus Virtual Reality Projekten, bei welchen ich als Sound Designer beteiligt war, aus vielen Stunden, welche ich in Internet-Foren für 3D-Audioproduktion und -technologie verbracht habe sowie aus zahlreichen 360°/VR-Produkten, welche ich mir angesehen und angehört habe. Darum handelt dieser Beitrag von 3D-Audio, Spatial Audio, Responsive Audio und Konsorten.

1Der akustische 3D-Raum

Drei Dimensionen verlangen bei der Virtual Reality nach drei Achsen (x, y und z). Man kann ein Geräusch also links/rechts (x), oben/unten (y) oder vorn/hinten (z) platzieren. Dabei kann ein Sound nicht nur an einem Ort im Raum ertönen, er kann sich auch über Zeit zwischen verschiedenen Punkten bewegen.

Der absolute USP bei der 3D-Audioproduktion ist die Möglichkeit, die Geräuschkulisse in Echtzeit an Bewegungen zu koppeln. Somit garantiert dieses Sounddesign ein „Mittendrin-statt-nur-dabei-Erlebnis“ der Spitzenklasse.

Zudem existiert eine weitere Achse, ‚w’ genannt. Sie dient dazu, sog. omnidirektionale, also von Bewegung unabhängige Inhalte wiederzugeben. Dabei handelt es sich zum Beispiel um Musik oder um eine Offstimme. Elemente, deren Klangeigenschaften nicht an die Bewegungen des Betrachters gebunden sind.

Kurzer AV-Crashkurs

Zuerst einmal: AV-Medien sind bekanntlich audiovisuelle Medien, bestehend aus einer sichtbaren und einer hörbaren Komponente. Also steuert jede Komponente 50 % zum Gesamterlebnis bei. Ob im zwei- oder dreidimensionalen Raum, ist dabei erst mal egal. Dieser Fakt ist unabhängig von Dimensionen und zeigt auf, welches Potenzial der akustische Content tatsächlich hat.

TV, Kino (auch 3D-Kino, mit den lustigen Papier-Brillen) und Web waren bis dahin visuell in 2D (Kinoleinwand, Bildschirm) genießbar. Audio-technisch hieß dies in den meisten Fällen Stereo-Wiedergabe. Diese ist eine Audiodatei mit zwei Kanälen (links/rechts). Also eigentlich einer „1D“-Audiowiedergabe (links-rechts) und einer 2D-Bildwiedergabe (links/rechts, oben/unten).

2Virtual Reality: Mehr als nur Stereo (oder Dual Mono)

Im Kino kommt die Mehrkanalwiedergabe, wie z. B. 5.1, dazu. Dabei handelt es sich um ein System mit drei Lautsprechern vor dem Betrachter, (links, rechts und Mitte), zwei hinter dem Betrachter (links und rechts) sowie dem Lautsprecher eigens für die ganz tiefen Frequenzen, für welches das ‚.1’ in der Bezeichnung steht. Dabei handelt es sich also dann um eine Art 2D-Klangwiedergabe, nämlich links/rechts und vorn/hinten.

Die 3D -Audiowiedergabe über Lautsprechersysteme im (Wohnzimmer- und) Kinoformat hat sich bisher noch nicht kommerziell durchgesetzt. Aus verständlichen Gründen: Sie ist noch zu Hardware-intensiv, zu komplex. Die Dolby-Technologie hierfür existiert jedoch, ist in rasanter Weiterentwicklung und nennt sich „Atmos“. Hierbei handelt es sich um ein Format, welches theoretisch über eine unbegrenzte Anzahl an Kanälen verfügt. Möglich sind z. B. 128 Tonspuren mit 64 Ausgängen. Also 64-fachen Stereo oder 64.1. Die Lautsprecher werden in einer Kugelform‚ um den Betrachter herum’ aufgebaut.

Ich glaube, dass man mit der fortschreitenden Technik aufregende Klänge herstellen kann. Stichwort 3D-Soundsysteme
Boris Blank, YELLO

Dieses Erlebnis für Virtual Reality muss unter den richtigen Gegebenheiten ‚mind blowing’ sein.

Bis heute sind es wenige Kinos und Audiopost-Studios weltweit, welche mit dieser Technologie für 3D-Audioproduktion ausgestattet und zertifiziert sind. Der kanadische Musiker und Produzent Joel Zimmermann (Deadmau5), ließ sich in Toronto eines der ersten Dolby Atmos-zertifizierten privaten Tonstudios auf den Leib schneidern. Ja … warum auch nicht?

Oder doch nur Stereo?

Zurück zu den kommerziell und materiell realistischen Möglichkeiten im Bereich des 3D-Audio und der 3D-Audioproduktion für Virtual Reality. Egal, ob mit Smartphone, Gear oder Desktop-Computer: 360°-Filme mit einer dafür geschaffenen Klangkulisse sind unbedingt mit Kopfhörern zu genießen.

Kopfhörer

Kopfhörer sind Geräte für die Stereo-Wiedergabe. Also nur links/rechts.

Wie bitte soll denn damit der dreidimensionale Raum klanglich reproduziert werden? Die Antwort liefert uns unser Körper selbst. Denn unsere Ohren funktionieren ja nach dem Stereo-Prinzip. Eines auf der linken und eines auf der rechten Seite. Und trotzdem ermöglicht es uns, die Geräusche räumlich und zeitlich einzuordnen. Genau dieser Prozess wird im 3D-Audio simuliert.

Dabei arbeitet man für die 3D-Audioproduktion jedoch mit Audiodateien, welche acht Tonspuren aufweisen. Also 8.0. Viermal Stereo resultiert daraus eine Stereo-Spur für jede Achse (w, x, y und z). Diese Datei (am besten ein .wav mit einer Samplerate von 48kHz und einer 24 Bit-Auflösung) beinhaltet zudem alle Metadaten zu den Geräuschen und deren räumlichen Position, welche für die Echtzeitanpassung der Klangkulisse verantwortlich sind.

Ein sog. ‚responsive’ Website, passt sich auf das jeweilige Gerät an. Den Begriff finde ich treffend, um die das AV-Erlebnis bei Virtual Reality/360°-Produktionen zu beschreiben. Denn Bild und Ton reagieren auf die Bewegungen des Betrachters, sind also ‚responsive’. Die Klangkulisse soll sich also mit einer möglichst geringen Latenz stetig anpassen und der perfekten räumlichen Klangerfahrung, wie wir sie alle ‚analog’ im Alltag erleben, nahekommen.

33D-Audioproduktion: Die Technologie und der Markt

Im dreidimensionalen Sound Design nennt man diese Art von Audio-Wiedergabe real-time binaural audio. Die Kopfbewegungen und die daraus resultierenden akustischen Konsequenzen werden in der Fachsprache unter dem Begriff HRTFs (Head Related Transfer Functions) zusammengefasst.

Sogenannt ‚binaurale’ Audiodateien, welche eben alle diese HRTF-Informationen als Metadaten enthalten, haben sich im sog. B-Fomat mit den beiden leicht unterschiedlichen Typen AmbiX und FuMa’etabliert. Techgiganten wie Samsung, Facebook oder Google samt YouTube und Android, unterstützten (und wie wir weiter unten lesen werden: entwickeln) diese Audio-Technologien. Vimeo funktioniert (noch) nicht mit Spatial Audio. Ich hoffe hierbei natürlich auf ein baldiges Upgrade

A Produktion

Am Set und in der Post arbeite ich für die 3D-Audioproduktion häufig mit der Crew von Avocado360 rund um Urs Wyss sowie dem DOP Christian Mühlhauser zusammen. Leute, welche zum Glück eine hervorragende Kenntnis über die Audio-Technologie und deren Relevanz im Film aufweisen, sowie Virtual Reality/360-People der ersten Stunde sind.

Langsam aber sicher wissen wir, wie es etwa gehen kann, bei der Produktion von Virtual-Reality-Content. Einer neuen Art der audiovisuellen Medien. Dies spart Zeit und Nerven. Über einen gewissen Pioniergeist zu verfügen, hilft sicherlich auch dabei.

Drei Kategorien

Grundsätzlich unterteile ich den akustischen Inhalt in drei Kategorien: Ambi (Nebengrund), Nebengeräusche (Hintergrund) und Hauptgeräusche (Vordergrund). Genau diese Elemente werden dann entweder am Set aufgezeichnet oder in der Post durch bereits vorhandene Elemente hinzugefügt.

Ich arbeitete bis jetzt stets ohne 3D-Mikrofone (Sennheiser AMBEO etc.), sondern habe Stimmen und Geräusche via Funk oder Richtrohr in normalem Stereo oder Mono (.wav, 48kHz/24 Bit) aufgezeichnet. Festgehalten habe ich die Aufnahmen stets mit einem Fieldrecorder (Zoom H4 und H5) oder einem USB-Interface direkt in den Laptop.

Synchronisation für die 3D-Audioproduktion

Zuerst werden Kamera und Ton für jedes Take synchronisiert. Dies geschieht durch eine laute und deutliche Ansage der Szene und des Takes mit dem anschließenden Klappenschlag. Das kameraeigene Mikrofon ist dabei eingeschaltet und der Eingangspegel so weit aufgerissen, dass die Ansage und der Schlag der Filmklappe deutlich zu hören sind.

Das Audio direkt in die Kamera aufzunehmen, erweist sich im 360°-Bereich als Problem. Denn man kann keine Kabel hinter (ja wo ist denn jetzt hinten?) der Kamera verstecken. Und die (manchmal zahlreichen)Funkempfänger der Lavaliermikrofone würden für Chrigu mühsames Retuschieren in der Post bedeuten. Sowieso heißt es für alle nicht-schauspielernden Crew-Members stets, in Deckung, resp. mehr oder weniger aus dem riesigen Aufnahmefeld des Kamerasystems zu gehen.

B Postproduktion

Sobald wir uns in der Postproduktion befinden, wird das Bild mit dem ‚richtigen’ Ton unterlegt und im Premiere Pro geschnitten. Als nächster Schritt, erhalte ich vom Cutter eine .omf-Datei, welche ich dann in meiner DAW (Digital Audio Workstation) samt dem Filmmaterial öffne. Also bisher nichts Besonderes.

In der DAW – in meinem Falle ProTools HD – findet dann die ‚Transformation’ von normalem Mono- oder Stereomaterial in Spatial Audio statt. Möglich ist es natürlich auch, ein Sound Design vorzunehmen, bei welchem alle Geräusche erst in der Postproduktion hinzukommen.

Jeder Typ Geräusch hat sein Klangverhalten

Das Ziel ist es, jeden Sound bestmöglich im Raum zu platzieren. Dabei ist es wichtig, an die verschiedenen Geräuschtypen und ihr Klangverhalten zu denken: Atmo ist alles umschließend und eher unauffällig, während die sonstigen Geräusche im Vordergrund stehen und räumlich und zeitlich sehr spezifisch reagieren. Bei meiner Arbeit in der Audiopostproduktion habe ich gemerkt, dass sich der Prozess bei der 3D-Audiobearbeitung grob in vier Fälle unterteilen lässt.

Dabei geht es darum, wie sich Betrachter und Umgebung beeinflussen können. Dazu gibt es folgende Tricks:

  • Ich bleibe an Ort und Stelle, die Objekte bewegen sich um mich herum.
  • Ich bewege mich, die Objekte um mich herum bewegen sich nicht.
  • Oder ich bin in Bewegung und die Objekte bewegen sich auch.
  • Varianten eins, zwei und drei kombiniert.

3D-Audioproduktion und Spatial Audio

Auf die ganz technischen Details der akustischen Postproduktion für Spatial Audio, möchte ich an dieser Stelle nicht eingehen. Nur so viel soll gesagt sein: Die Technik, mit seiner ganzen Komplexität soll nur dazu beitragen, dass die akustische Seite des AV-Produkts 50 % des Gesamterlebnisses ausmacht. Ich sehe dies viel mehr als eine künstlerische, als eine technische Herausforderung. Denn niemand wird sich den Film ansehen und sagen: «Wow, der dynamische EQ auf dem HMF-Band im Masterbus ist ja klasse. Vor allem auf der z- und y-Achse …».

Ein interessantes Detail:

Die Software (360 Spatialiser) der Firma Two Big Ears, welche mir ein Sound Design sowie die Tonmischung in 3D-Audio ermöglicht, wurde vor einiger Zeit von Facebook aufgekauft. Dabei entschied man sich, die Software gratis ins Netz zu stellen und sie für drei verbreitete DAWs (ProTools, Reaper und Nuendo) freizugeben.

Im dafür geschaffenen Facebook-Forum tauschen sich zurzeit über 4000 Sound Designer, Toningenieure und sonstige Audio-Nerds aus der ganzen Welt über die Audioproduktion im 3D-Bereich aus. Betrieben wird das Ganze natürlich von den verantwortlichen Entwicklern und Product Manager höchstpersönlich. Facebook gewinnt dadurch natürlich einen enorm praxisbezogenen Input über das Produkt. Win-win.

Video: Avocado360 Showreel. 360° Spatial Sound Design und Mix von Neil Raouf. Um den 360-Sound-Effekt zu erleben, beim Ansehen des Videos bitte Kopfhörer benutzen!

avocado360 Showreel 2017

 

4Verwendungszwecke von VR 360 mit 3D-Audioproduktion

Ein unglaubliches Potenzial sehe ich für die 3D-Audioproduktion und Virtual Reality vorwiegend im Marketing-Bereich. Stell dir vor, du gehst als Aussteller an eine Messe und hast einen tollen VR-Film im Gepäck. Im besten Fall hast du auch noch fünf oder sechs (Samsung) Gear VR-Sets (ausgestattet mit Kopfhörern!) mit dabei. Damit lädst du die Besucher deines Standes ein, deine Botschaft mit einem Messevideo dreidimensional aus nächster Nähe zu erleben. Dies gilt für eine Tourismusregion genauso, wie für ein Unternehmen aus der Techbranche.

Jedoch kann dasselbe Szenario auch bei einem Verkaufsgespräch stattfinden: Potenziellen Investoren oder Partner, kann somit eine Idee auf einer emotional neuen Ebene verkauft werden: mittendrin, statt nur dabei.

Ein anderes Kapitel sind Videospiele sowie Spiel- und Kurzfilme für Virtual Reality. Ich hoffe, bald auch in diesem Bereich aktiv zu werden. Jedoch muss vorwiegend im Filmbereich hauptsächlich das Konzept Storytelling völlig neu überdacht werden. Denn seit wir unsere Geschichten auf Kalksteinwände von Höhlen malen oder mit der Kamera einfangen, sind wir uns an zwei Dimensionen gewohnt. Man gibt dem Betrachter das Blickfeld vor und leitet somit auch die Dramaturgie. Was ist sichtbar/unsichtbar, hörbar/unhörbar?

3D-Audioproduktion: Einsatz in sozialen Medien

Lädt man die 360-Produktion auf YouTube oder Facebook, würde ich dazu raten, den Betrachter im Beschrieb oder via Thumbnail explizit zum Gebrauch von Kopfhörern aufzufordern. Denn 3D-Audio funktioniert nun wirklich nicht gut über die Lautsprecher vom iPhone. Verbindet man es jedoch mit den Kopfhörern, kann man sich das Video bequem via YouTube oder Facebook-App ansehen, resp. anhören. Einfach Vollbild-Modus einschalten und das Smartphone (oder Tablet) bewegen. Schon funktioniert das responsive AV-Erlebnis in seiner ganzen Pracht.

Jetzt bedanke ich mich, dass du bis zu dieser Stelle gelesen hast. Spannend, womit uns die Technologie wieder einmal auf Trab hält. Dabei sind wir visuell im Bereich Virtual Reality (VR) erst am Anfang (in der 3D-Audioproduktion ohnehin). Doch mit jedem Projekt werden wir, die Technologie und auch die Zuschauer besser.

Das musst du wissen

  • Der Raum ist dreidimensional. Darum gibt es auch beim akustischen 3D-Raum drei Achsen: die X-, Y- und Z-Achsen. Sie kennzeichnen die räumliche Platzierung links oder rechts, oben oder unten und vorn oder hinten.
  • 3D-Raumwiedergabe fordert die Hardware. Darum hat sie sich (noch) nicht in der Consumer-Industrie durchgesetzt.
  • Eine dreidimensionale Tonwiedergabe mit Kopfhörer ist möglich. Sie funktioniert nach demselben Prinzip wie unsere zwei Ohren, die aus dem Stereoton um uns herum ein Raumgefühl erzeugen können.
  • Audio für 3D-Sound direkt mit dem Kameramikrofon aufzunehmen ist bei VR nicht empfehlenswert.

Mehr zum Thema 3D-Audioproduktion

Ganz anders und trotzdem dieselbe Thematik: 3D ist auch für Games ein Thema. Mehr dazu findest du im Artikel 3D Spiele für Xbox & Playstation.

Fehler gefunden? Jetzt melden
Dieser Artikel wurde erstmals publiziert am 22.08.2017

Neil Raouf 11 Artikel
Neil ist Sound Designer und Komponist. Er lebt mit seiner Familie in der Nähe von Zürich. Kontakt: neil@mera.film

Teile jetzt deine Erfahrungen

Kommentar hinterlassen

E-Mail Adresse wird nicht veröffentlicht. Links zu Werbezwecken werden ausgefiltert.


*