Headphone Surround: räumliches Hören auf Kopfhörer simuliert
Themen wie 3D-Audio und Surround Sound über Kopfhörer sind ganz aktuelle und wir möchten mit diesem Beitrag eine Übersicht zum Thema Surround Sound über Kopfhörer vermitteln. Tom Ammermann, der sich intensiv mit dem Thema auseinandergesetzt hat, berichtet für uns über seine Erfahrungen und seine eigenen Entwicklungen in diesem Bereich.
Wie alles begann
Knapp 80 Jahre ist es her, da haben sich ein paar Tonmenschen kleine Mikrofone in die Ohren gesteckt in der Annahme, dass so eine Aufnahme doch auf Kopfhörern identisch wiedergegeben werden muss, also genau dort wo auch aufgenommen wurde und wo auch unsere Ohren aufnehmen, genauso klingen, wie räumliches Hören. So war es denn auch. Begriffe wie Surround und 3D-Ton waren im Bereich der Tonschaffenen noch Fremdwörter. Aus diesem Versuchserfolg entwickelte sich logischerweise der Bedarf dies auch handlicher, also in Form eines Mikrofonsystems zur Verfügung zu bekommen und so entstand das Kunstkopf-Mikrofonsystem.
Durch dieses Mikrofonsystem wurde erstmals Audio mit den psychoakustischen Effekten aufgezeichnet, welche als Basis aller Simulationen von räumlicher Wahrnehmung bei Kopfhöreranwendung ist. Die Illusion also, ein Audioereignis in unserem räumlichen Umfeld lokalisieren oder eine plastische Raumathmosphäre wahrnehmen zu können. Diese Effekte werden vornehmlich durch die Außenohrübertragungsfunktionen (HRTF= head related transfer functions) verursacht. Vereinfacht gesagt ist damit die charakteristische Beeinflussung unseres Kopfes und Außenohr unter anderem von Pegel, Laufzeit und Frequenzübertragungsbereich des Schalls der Audiosignale unseres Umfelds gemeint. Ein Signal, welches sich zum Beispiel rechts von uns befindet würde durch unsere Kopfform und den Abstand unserer Ohren entsprechend charakteristisch beim linken Ohr leiser, dumpfer und später ankommt.
Will man also räumliche Wahrnehmung für Kopfhöreranwendung simulieren, muss man diesen durch unseren Kopf verursachten charakteristischen Bezug, vor allem für die genannten Parameter für unser linkes und rechtes Ohr, wiederum in Bezug zur Position die man simulieren will, herstellen. Um zum Beispiel also eine virtuelle Lautsprecherposition in zwei Meter Abstand zu simulieren, muss man die Audioquellen mit den genannten Parameter entsprechend für das linke und rechte Ohr beeinflussen und man nimmt den Klang dann so wahr, als käme er von dieser Position.
Wie es weiter ging
Meine erste Erfahrung mit dieser Technologie machte ich vor ca. zehn Jahren mit dem BRS-System von Studer. Bis heute habe ich nichts Besseres gehört - doch leider ging es nie in Serie. Vermutlich war die Zeit noch nicht reif doch für mich war ab da klar, diese Technologie wird in der Zukunft eine sehr wichtige Rolle unter Anderem in der Unterhaltungselektronik spielen. Vom IRT, welches an der Entwicklung des Studer Systems beteiligt war, gibt es das BRS noch als Software Plug-in.
Etwa zeitgleich hörte ich auch Dolby Headphone, welches für den Endverbraucher gedacht ist und hinter dem sich ein Verfahren der Firma Lake Technologie verbarg, was sich meines Wissens bis heute auch nicht geändert hat. Lake hatte das Verfahren ursprünglich für Architekten entwickelt um Räume, die noch gar nicht gebaut waren schon mal auf Klang und akustische Eigenschaften überprüfen zu können. Dolby Headphone existiert meines Wissens nicht in einer dezidierten Software sondern wird lizensiert und ist somit in verschiedenen Produkten als Extra zu finden. Ähnlich hält es DTS, die ihr Verfahren in ein Gesamtbundel integriert haben welches Surround Sensation heißt.
Es gibt recht viele mehr oder weniger gute Software-Simulationen für professionelle und Endverbraucher-Anwendungen auf dem Markt, zum Beispiele auch von Frauenhofer das MP3D-Format.
Für einen Test im Stern habe ich vor einigen Jahren auch mal verschiedene Hardware-Lösungen für den Endverbrauschermarkt unter anderem von Sennheiser, Sony und AKG überprüft, welche mich aber alle nicht überzeugen konnten. Ich glaube auch, dass diese fast alle nicht mehr erhältlich sind. Seit etwa vier Jahren gibt es nun aber eine weitere Hardware-Lösung von Beyerdynamik, das Headzone.
In diesem professionellen Audiogerät wird ein Algorithmus von sonic emotion (von ehemaligen Studer-Mitarbeitern gegründet) verwendet, welcher mich nach dem Studer-BRS-System das erste Mal wieder Ergriff. Mit ein Grund dafür, dass dies Gerät überzeugte, ist ein integrierter Head-Tracker, welcher auch das große Plus des Studer BRS-Systems war.
Mit diesem werden horizontale Kopfbewegungen, die wir mehr oder weniger unbewusst eigentlich permanent machen, kompensiert. Hört man also ein Signal vor sich und dreht den Kopf nach links wandert das Signal nach rechts. Hier wird ein Effekt genutzt, welchen wir auch beim alltäglichen Hören nutzen. Durch diese permanenten Kopfbewegungen nehmen wir Audiosignale in unserer Umgebung jeden Moment etwas anders war als noch einen Moment zuvor, nämlich immer in Bezug zur jeweiligen Kopfposition. Unser Gehirn bekommt also mehr Informationen, die aber alle in Bezug zu den verschiedenen Kopfpositionen ein und dieselbe Signalposition bestätigen und somit einen realeren Höreindruck erschaffen. Diesen Effekt mit einbeziehend sind also alle Simulationen, welche diesen nutzen, immer besser als statische. Auf vergangenen Tonmeistertagungen hörte ich noch ein weiteres Head-Tracking verwendendes System, das Phoenix 5.1 von EMT, welches aber ebenfalls die BRS-Algorithmik zu verwenden scheint.
Letztes Jahr nun kam ein weiteres Gerät mit Headtracking für professionelle Anwendungen auf den Markt, das hier bei proaudio.de auch schon vorgestellt wurde, der Realiser von Smyth. Dies zieht für mich hinsichtlich der Simulationsqualität nun dem Studer BRS-System gleich. Es ist wirklich überzeugend, da es nicht nur das Head-Tracking sehr souverän simuliert sondern ebenfalls individuelle HRTFs ermöglicht. Da jeder Kopf ein bisschen anders geformt ist sind auch die HRTFs von jedem Menschen ein bisschen unterschiedlich. Die schon erwähnten charakteristischen Bezüge von Parametern sind also von Mensch zu Mensch unterschiedlich. Demzufolge wird eine Simulation also überzeugender, wenn man nicht nur mit Standard-HRTFs hört sondern mit seinen eigenen hören kann. Diese elementare Notwendigkeit für realistischste Simulationen berücksichtigt der Realiser in dem er in einem individuellen Messverfahren mittels entsprechender Mikrofone im eigenen Gehörgang beliebig viele Abhörsituationen erfassen lässt, ein echtes Plus dieses Gerätes.
Weshalb nun Surround für Kopfhörer
Vordergründig betrachtet rührt das Bedürfnis im professionellen Audiobereich natürlich daher, unter Bedingungen die entsprechende Lautsprecheranwendungen nicht erlauben wie mobil, live oder in der kleinen Edit Suite dennoch Surround abhören zu können, sei es nun für Mischungen oder zur Kontrolle von Sendungen. Hier finden vornehmlich hardware-gestützte System wie das BRS, Headzone und der Realiser Anwendung, da sie nicht zuletzt durchs Head-Tracking am überzeugendsten jedoch auch am kostspieligsten sind. Im Endverbraucherbereich steht natürlich Surround Entertainment, ebenfalls in Situationen die keine Lautsprecheranwendungen ermöglichen wie mobil, nachts oder wenn man kein entsprechendes Lautsprechersystem besitzt beziehungsweise sich nicht leisten kann oder will, im Vordergrund. Hier sind vornehmlich, sicher auch aus Kostengründen, software-basierte Verfahren wie Dolby Headphone, DTS Surround Sensation und MP3D im Einsatz. Für Endverbraucher, professionelle Audioproduktion sowie sicher auch noch andere Bereiche ist also ein klares Bedürfnis aus zu machen, welches meiner Auffassung nach jedoch erst am Anfang steht. Am Ende steht das Bedürfnis in jeder Lebenslage Audioreproduktionen ebenso natürlich war zu nehmen als wäre es Teil unserer Realität.
Diesem Bedürfnis nach zu kommen begann mit Stereo. So wurde Audioreproduktion 2D und wir erfuhren mehr Emotion durch natürlichere Reproduktion als mit mono, womit keineswegs die Mischungen gemeint sind sondern lediglich das wahrnehmen von Klängen aus unterschiedlichen Richtung vor uns. Surround ist lediglich der logische Schritt in die gleiche Richtung, weiterhin aber 2D, welcher Filmvergnügen nun noch einmal realistischer also emotionaler machte durch hinten und vorne Lokalisation. Kopfhörer sind also auch in Zukunft eine extrem solide Basis für Audioreproduktion und Innovation.
Meine Rolle dabei
Seit ich das Studer BRS System gehört hatte, war ich von der Technologie überzeugt und machte mich daran meinen Weg zu finden. Dieser mündete 2002 in der Erschaffung meines Verfahrens in diesem Bereich, welches ich schon damals headphone-surround nannte und wofür ich seither eine eingetragene Marke und Logo besitze.
Mein Verfahren unterscheidet sich in einem Punkt grundsätzlich von allen Anderen. Währen alle anderen Anwender Hard- oder Software-Lösungen anbieten, welche beliebige Inhalte mit vorgegebenen Einstellungen virtualisieren, war mein Verfahren immer ein Service und somit für den Endverbraucher immer sofort mit handelsüblichen Kopfhörern zu genießen. Ich habe mir also Infrastruktur und Erfahrung angeeignet mittels derer ich beliebiges Audiomaterial auf Bestellung so bearbeitet habe, dass ein möglichst guter räumlicher Effekt entstand der für die entsprechenden Quell natürlich immer von Vorteil war. Spezialbehandlung mit feinster Studioinfrastruktur und kompetenter Einstellung und Überwachung, etwas was eine Hard- oder Softwaren natürlich nicht leisten kann. Also immer wenn irgendwo headphone-surround drauf steht wie zum Beispiel bei T2, Mr. & Mrs. Smith und Million Dollar Baby bedeutet es, dass es sich um eine Kopfhörer-Surround optimierte Mischung von mir handelt. Diese Mischungen, welche immer als extra anwählbare Audiospuren integriert sind, simulieren zum Beispiel das Hören der 5.1-Filmmischungen über ein 5.1-Lautsprechersystem im heimischen Wohnzimmer.
Foto: Tom Ammermann
Aktuell ist es nun so, dass ich schon seit letztem Jahr diese Mischungen in einem klanglich noch verbesserten Verfahren und auch in 3D mache wofür es ab jetzt auch das neue Logo gibt. Ich nenne und schreibe es nun HEADPHONE SURROUND 3D kürze es gern auch HPSR 3D ab und es handelt es sich in der Tat um Mischungen, die Audioereignisse von zum Beispiel oben erklingen lassen und die Schaffung von noch plastischeren Räumen ermöglichen.
Mit 3D ist der Schritt hin zu realistischer Wahrnehmung nun abgeschlossen, bleibt nur noch diese Simulation immer überzeugender zu machen, was nicht zuletzt auch sehr von ambitionierten Mischungen abhängt. Von Sony Music Entertainment sind bereits zwei Projekte mit HEADPHONE SURROUND 3D-Mischungen von mir im Handel, welche auf meiner Website inklusive Samples auch zu finden sind. Dies Jahr folgt mindestens noch eins und ich arbeite derzeit ebenfalls an einer Software-Lösung, welche selbstverständlich auch durch meine lange Erfahrung in diesem Bereich geprägt sein wird. Schon zum Jahresende wird es hier sicher mehr zu berichten und schreiben geben.