Voyage Audio Spatial Mic mit USB- oder Dante-Interface
Autor und Fotos: Peter Kaminski
Immersive Audio oder 3D-Audio wird immer interessanter und auf immer mehr Medien und Verbreitungswegen angeboten. Der Aufwand Mikrofonen-Aufnahmen für Immersive Audio zu machen ist hoch. Abhilfe versprechen hier Mikrofone, die das Ambisonics-Format nutzen, da sie sehr kompakte Lösungen darstellen. Der amerikanische Hersteller Voyage Audio präsentierte Anfang 2020 mit seinem Spatial Mic ein neues Ambisonics-Mikrofon vor.
Ambisonics Basics
Bevor wir uns aber mit dem Mikrofon selbst beschäftigen, noch ein paar Worte und Grundlagen zum Thema Ambisonics, um im Laufe des Beitrags verwendete Begrifflichkeiten vorab zu erläutern und die Grundlagen ggf. nochmal aufzufrischen. Wer mit dem Thema Ambisonics vertraut ist, der kann den Abschnitt getrost überlesen. Das Thema Ambisonics ist technisch durchaus anspruchsvoll und sehr viel auch mit der Mathematik verbunden. Ich möchte die Dinge hier möglichst einfach und zum Teil daher auch stark simplifiziert darstellen.
Ambisonics ist kein neues Verfahren sondern existiert schon seit Ende der 60er Jahren. Viele Grundlagen wurden an der Oxford University in England entwickelt. Da mit dem Verfahren quasi ein Schallfeld beschrieben wird, wurde der Begriff "Soundfield" eingeführt und verwendet. Von Ambisonics sprach man erst später. 3D-Audio-Formate wie Auro 3D und Dolby Atmos sind, vereinfach gesagt, auf Stereo basierend erweiterte Formate mit mehr Lautsprechern und entsprechend mehr Kanälen. Die Aufzeichnung bietet Richtungsinformationen in allen drei Ausdehnungsdimensionen inklusive der Höhe, bzw., Elevation. Letzteres gilt auch für Ambisonics, aber es ist eben kein Verfahren, das eine Lautsprecheraufstellung abbildet, sondern es wird Intensität und Richtung einer Schallquelle aufgezeichnet. Für die Wiedergabe muss Ambisonics daher über ein Rendering in das gewünschte Zielformat, wie zum Beispiel 7.1.2 oder 5.1.5 für Lautsprecher oder auch Binaurale-Ausgabe für Kopfhörerwiedergabe, konvertiert werden.
Bei den Verfahren die sich an der Lautsprecher-Wiedergabeausstellung orientieren ist eine genauere Ortung, bzw. Abbildung der Schallquelle im Raum durch Verwendung einer höhere Anzahl von Lautsprechern und demzufolge auch über die Verwendung von mehr Audiokanälen möglich. Das ist prinzipiell auch bei dem Ambisonics-Verfahren so. Bei Ambisonics unterscheidet man zwischem dem A-Format, das sind die Signale die die Mikrofone liefern, sozusagen Raw-Mikrofon-Audiosignale und dem B-Format, was zur Beschreibung des Schallfeldes im Weiteren bei der Aufzeichnung sowie bei der Bearbeitung genutzt wird.
In der kleinsten Variante kommen bei Ambisonics vier Kanäle zum Einsatz und zwar einer für den Summenschalldruck W und drei für die Richtungsinformationen der X-, Y- und Z-Achsen. Dies nennt man dann Ambisonics erster Ordnung (1st Order Ambisonics, Abk. häufig FOA). Leider gibt es unterschiedliche B-Formate, mit unterschiedlichen Pegeln und Kanalreihenfolgen. Am weitesten verbreitet ist das B-Format AmbiX mit der Kanalabfolge W, Y, Z, X und allen Kanäle mit gleichem Gain. Das ältere FuMa (Furse Malham) hat die Kanalfolge W, X, Y, Z und der W-Kanal hat ein Gain von -3 dB.
Von nativen Ambisonics-Mikrofonen spricht man, wenn das Ambisonics-Mikrofonformat (A-Format) dem des Ausgangs/Verarbeitungsformat entspricht. Das heißt also, in unserem Fall des B-Formats mit den Parametern W, X, Y, Z müsste man ein Druckemfänger (Kugel) für W und drei Druckgradienten-Empfänger für die Richtungsinformation verwenden, die möglichst an einem Punkt angeordnet sein sollten. Das bedeutet auch, dass die räumliche Ausdehnung des Mikrofons Grenzen hat. In Praxis ist der obere Frequenzbereich nicht unkritisch und die Anordnung und Größe der Mikrofonkapseln und deren Anordnung hat hierauf Einfluss.
In der Regel sind aber das Mikrofonformat und das Ausgangsformat unterschiedlich. Man nutzt in der Regel für ein Ambisonics-Mikrofon erster Ordnung vier Mikrofonkapseln mit Achter-Richtcharakteristik, aus denen man über eine Matrix die vier virtuellen Mikrofone für die Kanäle W, X, Y und Z generiert.
Bei Ambisonics zweiter Ordnung (2nd Order Ambisonics) kommen neun Kanäle zum Einsatz und bei Ambisonics dritter Ordnung (3rd Order Ambisonics) schon 16. Übrigens spricht man bei Ordnungen von größer als 1 von Higher Order Ambisonics (Abk. HOA). Die Formel für die Anzahl der Ambisonics-Kanäle lautet (n + 1)² wobei n die Ordnungszahl ist. Beim Mischen in der Workstation arbeitet man in der Regel mit Ambisonics mindestens dritter Ordnung, sehr anspruchsvolle Produktion mit bis zur 7. Ordnung, was immerhin 64 Audiokanäle pro Bus voraussetzt. Auf der Mikrofonseite beschränkt man sich auf die Anwendung von geringeren Ambisonics-Ordnungen. Es gibt sehr viele Mikrofone erster Ordnung sowie mittlerweile auch zweiter Ordnung und einige sogar auch dritter Ordnung.
Vier Kanäle für Ambisonics erster Ordnung lassen sich noch relativ einfach aufzeichnen. Bei Ambisonics zweiter Ordnung ist es aber so, dass in der Praxis Achtkanal-Recorder bereitstehen aber Ambisonics zweiter Ordnung neun Kanäle erfordert. Die meisten Field-Recorder bieten aber lediglich acht Aufnahmekanäle. Man hat also daher ganz pragmatisch auch Mikrofonanordnungen entwickelt, die mit acht Mikrofonen auskommen.
Wer sich weiter über Ambisonics-Mikrofontechnik informieren möchte der wird bei in der AES-Bibliothek (nur für Mitglieder) mehr als fündig. Wer sich allgemein mit dem Thema Ambisonics beschäftigen möchte, dem sei zum Beispiel das Buch "Ambisonics" vom Springer-Verlag ans Herz gelegt, welches als PDF oder E-Book kostenlos heruntergeladen werden kann: https://link.springer.com/book/10.1007%2F978-3-030-17207-7
Konzept und Technik
Und somit möchten wir nun wieder zum Produkt dem Spatial Mic zurückkommen. Es handelt sich dabei um ein Ambisonics-Mikrofon zweiter Ordnung. Es kommen acht selektierte 14-mm-Electret-Kondensaor-Mikrofonkapseln mit fester Vorspannug zum Einsatz. Es gibt eine Veröffentlichung (Convention Paper 8728) von der 133. AES Convention in San Fransisco aus dem Jahr 2012, die diese spezielle Mikrofonkapsel-Anordnung, die auch beim Spatial Mic umgesetzt wurde, vorstellt. AES-Mitglieder können diese unter folgendem Link abrufen: https://secure.aes.org/forum/pubs/conventions/?elib=16470.
Für den W-Kanal (richtungsunabhängiger Summenschalldruck) ist bei der Anordnung bis zu sehr hohen Frequenzen eine Kugel-Richtcharakteristik gewährleistet, was bei frühere Anordnungen nicht der Fall war. Dort war meist schon bei 7 kHz dies nicht mehr gewährleistet, während bei der neuen Anordnung selbst bei 12 kHz nur eine geringfügige Richtwirkung bei dem virtuellen Mikrofon für den W-Kanal vorhanden ist.
Es kommen A/D-Wandler mit einem Störabstand von 110 dB und 24 Bit Wortbreite zum Einsatz. Der maximal zulässige Schalldruck für das Spatial Mic beträgt 131 dB SPL.
Anschlüsse
Das Gehäuse des Spatial Mic besteht im Wesentlichen aus Kunststoff (172 mm Länge, Durchmesser 54 mm) sowie Aluminium und wiegt daher lediglich 245 Gramm. Alle Anschlüsse befinden sich unten im Gehäuse.
Hier ist unter anderem ein Micro-USB-Anschluß vorhanden, der ausschließlich der Spannungsversorgung dient. Damit lässt sich das Mikrofon auch mit USB-Powerbanks im Außeneinsatz betreiben. Des Weiteren gibt es ein USB-C-Anschluss (USB 2.0) für die Bidirectionale-Audioverbindung, das bedeutet Audio wird an den angeschlossenen PC/Mac ausgegeben (8-Kanal A-Format mit 24 Bit und maximal 96 kHz Abtastrate) aber auch vom PC/Mac an das Mikrofon.
Voyage Audio bietet ab dem ersten Quartal 2023 mit dem "Spatial Mic Dante" das Mikrofon auch mit einer DANTE Digital-Audio-Schnittstelle an (s. Abb. oben). Über die MicNet-Steuerungs-App lässt sich auch die Dante-Version fernsteuern. Die Daten-Version ist zudem Power-over-Ethernet-fähig (PoE) und lässt sich so über die Ethernet-Schnittstelle fernspeisen.
Nun aber zurück zur USB-Version, die wir getestet haben. Voyage Audio bietet für das Spatial Mic in der USB-Variante keine Audiotreiber an. Für den macOS benötigt man diese nicht und unter Windows 10 wird ASIO4ALL von Voyage Audio als Lösung empfohlen (min. Version 1703). Die Anbindung via ASIO wird sicherlich im mobilen Betrieb mit Labtop/Macbook zum Einsatz kommen. Es gibt im Mikrofon auch einen Kopfhörerausgang zum Vorhören (130 mW @ 16 Ohm) in Form einer 3,5-mm-Stereo-Klinkenbuchse. Hier kann man das Mikrofonsignal als Ambisonics erster Ordnung binaural (Abtastrate 44,1 oder 48 kHz) mit Google Resonance HRTF (Außenohrübertragungsfunktion) oder als Mid/Side (88,2 oder 96 kHz) abhören.
Im Studio hat man dagegen ja in der Regel schon ein Audiointerface via ASIO in Betrieb. Für diesen Zweck hat man dem Spatial Mic auch noch ein optisches ADAT-Interface spendiert. Eine besonders kluge Entscheidung. Damit kann man das Mikrofon an viele größere, vorhandene Interfaces anschließen und so in die bestehende Studioumgebung integrieren. Es gibt hier keinen Rückkanal, aber den braucht man auch im Studio nicht, da man die Monitorwege ja über die DAW oder das Pult realisiert. Die Abtastrate ist auf 44,1 oder 48 kHz beschränkt.
Handhabung und Lieferumfang
Auf der Rückseite des Mikrofons befindet sich ein Gewinde mit einem Zoll-Gewinde 1/4-20 (s. Abb. oben), ein Gewindeformat was im Kamera-Stativbereich üblich ist. Um Standard-Mikrofonstative nutzen zu können liegt ein bewegliches Adapterstück auf das übliche große 5/8-Zoll-Mikrofongewinde bei (s. Abb. unten).
Damit lassen sich auch Stative mit einem Ausleger sehr gut einsetzen (s. Abb. unten).
Im Lieferumfang befindet sich weiter noch je ein Kabel USB-C auf USB-C und ein USB-C auf USB-A und zwar sehr hochwertige Varianten mit Stoff-Ummantelung. Auch ein Windschutz wird für das Mikrofon mitgeliefert. Optional ist noch eine passende InVision-Spinne von Rycote als elastische Aufhängung für den Studiobetrieb erhältlich.
Auf der Vorderseite des Mikrofons ist ein Druck-/Drehgeber mit einem LED-Kranz sowie drei Status-LEDs verfügbar. Durch mehrmaliges Drücken lässt sich der Bedienmodus von Mikrofon-Eingangspegel (MIC) auf Kopfhörerpegel (HP) oder auch Mischverhältnis Mikrofon/USB-Audio-Rückweg (MIX) umstellen. Mit dem Drehgeber wird der Wert eingestellt und mit dem LED-Kranz angezeigt. Die vierte Betriebsart ist der normale Betriebsmodus, bei dem der LED-Kranz dann als Pegelanzeige genutzt wird.
Software
Für die Steuerung und das Konvertieren gibt es für macOS (ab OS X 10.11) und Windows 10 eine Control-Software sowie ein VST3 oder AAX-Plug-In. Über einen Installer lässt sich die Software und die Plug-In-Formate individuell installieren. Eine Lizenzierung erfolgt nicht.
Die Spatial Mic Control Software (s. Abb. unten) bietet alles, was sich auch am Mikrofon einstellen lässt, wie Mikrofonpegel, Kopfhörer und Mic/USB-In-Mischverhältnis. Zudem lässt sich das Mikrofon stummschalten und das Meter kann auf Mikrofon- oder Monitorpegel umgeschaltet, sowie auch ganz ausgeschaltet werden.
Da ja an den Rechner via USB oder via ADAT an das Audio-Interface das A-Format-Signal geliefert wird, ist eine Überführung in ein B-Format erforderlich, was mit dem Spatial Mic Convert Plug-In erledigt wird (s. Abb. unten).
In dem Plug-In lässt sich unter anderem die Mikrofonorientierung einstellen. Normalerweise zeigt der Bedienknopf am Mikrofon nach vorne und der Mikrofonkorb nach oben. Über den virtuellen Taster "orientation" lässt sich dies aber auch ändern - natürlich auch nach der Aufnahme. So ist umgekehrter Betrieb - also Mikrofonkorb nach unten - sowie auch liegender Betrieb möglich.
Weitere Möglichkeiten sind ein zuschaltbarer Hochpassfilter (Grenzfrequenzen 80, 120 oder 160 Hz), virtuelles Korrigieren der Mikrofonausrichtung, vier Filtertypen für verschiedene Anwendungsschwerpunkte (Mittenbetonung, Low Noise etc.), ein Eingangs-Pegeltrimmer sowie die Wahl des Ausgangs B-Formats. Hier stehen folgende Formate zur Verfügung: ambiX und FuMa, jeweils mit erster oder zweiter Ordnung. Die Ein- und Ausgangspegel werden über Bargraf-Meter angezeigt.
Darüber hinaus lässt sich auch eine Betriebsart "Virtual Mic" anwählen (s. Abb. oben), bei dem aus dem Mikrofon-Array ein virtuelles Mikrofon mit gewählter Richtcharakteristik gerechnet wird.
Hier stehen verschiedenste Mikrofone als Presets (s. Abb. oben) bereit.
Darüber hinaus gibt es auch nach einem Software-Update nun auch noch einen Mid/Side-Modus (s. Abb. oben).
Praxis
Wir haben das Mikrofon zum Test über die ADAT-Schnittstelle an ein RME Fireface UFX+ angeschlossen und das Plug-In als VST3 in Nuendo 10.3 genutzt und binaural über verschiedene Plug-Ins abgehört, auch mit individueller HRTF. Software-Installation und Betrieb war komplett problemlos.
Zunächst einmal zur Monitor-Möglichkeit am Mikrofon selbst. Ich bin persönlich immer sehr sensibel was andere HRTFs angeht aber die implementierte Google HRTF ist zum Vorhören gut geeignet, auch wenn nur Ambisonics erster Ordnung bei der Wiedergabe genutzt wird, so bekommt man schon einmal eine Idee über die räumliche Abbildung, ohne zusätzliche Plug-Ins und Kopfhörereinsatz am Rechner.
Wer einmal Gelegenheit hatte, mehrere Ambisonics-Mikrofone zu vergleichen, der wird durchaus auch bei der Ortung und räumlichen Abbildung Unterschiede feststellen, begründet in verschiedenen Kapselanordnungen und Mikrofonkapsel-Qualitäten. Die Ortung ist dank des Einsatzes des Achtkapsel-Array im Betrieb der zweiten Ambisonics-Ordnung sehr überzeugend. Die räumliche Abbildung ist hörbar feiner aufgelöst als bei Mikrofonen mit lediglich ersten Ordnung. Mikrofone erster Ordnung lassen sich sehr gut für Ambient-Recording nutzen. Das Spatial Mic geht hier deutlich weiter. Insbesondere im Bereich für Gaming-Audio braucht man eine sehr realistische Abbildung der Schallquellen und dafür eignet sich das Spatial Mic sehr gut. Die Mikrofonkapseln bieten für diese Preisklasse ebenfalls eine gute Qualität.
Mit dem virtuellen Mikrofon lassen sich auch im normalen Studioalltag viele interessante Dinge machen. Die nachträgliche Bearbeitung - also nach dem Aufnahmeprozess - der Richtcharakteristik ist ein sehr interessantes Leistungsmerkmal für den Studiobetrieb, was mit dem Spatial Mic in der Praxis im Vergleich zu Mikrofonen mit umschaltbarer Richtcharakteristik auch sehr gut funktioniert.
Wofür lässt sich das Spatial Mic nun einsetzen? Wie schon erwähnt: Ambisonics ist im Gaming-Bereich sehr beliebt sowie auch im Bereich der experimentellen, modernen elektronischen Musik. Mittlerweile bieten eine ganze Reihe von Workstations die Unterstützung von Ambisonics, zumindest bis zur dritten Ordnung, an und auch Plug-Ins für binaurales Kopfhörer-Monitoring gibt es einige. Insofern die richtige Zeit sich jetzt einmal mit 3D-Audio auch im Bereich der Musikproduktioin zu beschäftigen, auch wenn kein 3D-Audio-Lautsprecher-Setup im Studio bereitsteht.
Ambisonics an sich ist, wie ich persönlich finde, prinzipiell für Musikaufnahmen als Hauptmikrofon, zum Beispiel für ein großes Orchester, nur bedingt einsetzbar. Hier würde ich eher Laufzeit-basierende Mikrofonverfahren vorziehen, wie eine gestockte Surround-Anordnung mit 2 x 5 Mikrofonen. Aber die Realität zeigt hier Grenzen auf. Wer hat schon einen entsprechenden Aufnahmeraum und eine entsprechende Anzahl von Mikrofonen verfügbar und eine Orchesteraufnahme ist ja auch nicht für jeden alltäglich. Gerade für in der Ausdehnung kleinere Klangkörper, wie zum Beispiel ein Quartett oder ein Percussion-Setup kann bei entsprechender Aufstellung zu sehr schöne 3D-Audio-Ergebnisse mit dem Spatial Mic führen.
Das Spatial Mic ist natürlich sehr viel kompakter und vor allem auch portabler und lädt daher, nicht nur im Studiobereich sondern auch im Außeneinsatz, zum Experimentieren mit 3D-Audio-Aufnahmen ein. Auch kleinere Projektstudios können sich so einmal mit der Aufnahme von 3D-Audio beschäftigen und sich dem Thema nähern. Auch bei Dolby-Atmos- oder Auro-3D-Produktionen lässt sich das Mikrofon einsetzen, wenn man Konverter-Plug-Ins von Ambisonics zu diesen Formaten nutzt. Insofern ist die Bandbreite der Einsatzszenarien durchaus groß.
Fazit
Der Preis des Voyage Audio Spatial Mic liegt in der getesteten USB-Version bei ca. 1.275 Euro und in der Dante-Version bei ca. 3.600 Euro. Damit kommt das Ambisonics-USB-Mikrofon zweiter Ordnung von Voyage Audio in den Preisbereich, in dem bisher üblicherweise Ambisonics-Mikrofone erster Ordnung liegen. Nennenswerte Vorteile sind die universellen Digital-Anschlussmöglichkeiten mit USB und ADAT oder eben Dante sowie die binaurale Kopfhörer-Monitor-Funktion, die relativ hohe Auflösung durch Ambisonics zweiter Ordnung und die Nutzung als virtuelles Mono/Stereo-Mikrofon mit umschaltbarer Richtcharakteristik. Für kreative und experimentierfreudige Toningenieure wird für diesen Preis also eine ganze Menge geboten.