#Forschungsspecial: Sascha Dick optimiert 3D-Audio
Mit #Forschungsspecial bieten wir Doktorandinnen und Doktoranden unseres Departments die Möglichkeit, ihre Forschungsthemen einer breiten Öffentlichkeit vorzustellen. Zu Ostern besuchen wir Dr. Sascha Dick von den International Audio Laboratories Erlangen (kurz AudioLabs).
Kurzinfo:
Name: Sascha Dick
Lehrstuhl: International Audio Laboratories Erlangen
Forschungsgebiet: Psychoakustische Effekte und Modelle zur Verarbeitung und Codierung von 3-Dimensionalem Audio
Lieber Herr Dick, können Sie uns ein wenig über sich erzählen? Sie haben hier in Erlangen studiert, ist das richtig?
Ja, das stimmt. Ich habe hier Informations- und Kommunikationstechnik (kurz IuK) studiert, also im Prinzip eine Mischung aus Elektrotechnik und Informatik. Nachdem das schon eine Weile her ist, habe ich noch als einer der letzten Studienjahrgänge einen Abschluss als Diplom-Ingenieur gemacht.
Und was hat Ihre Studienentscheidung damals so nachhaltig beeinflusst, dass Sie sich für diesen Studiengang entschieden haben?
Während es bei der heutigen Aufteilung in Bachelor- und Masterstudium ja oft üblich ist, sich nach dem Bachelor neu zu orientieren, war das Diplom noch als ein zusammenhängender Abschluss konzipiert. Da kam mir IuK als interdisziplinärer Studiengang sehr gelegen. Ich hatte mich schon als Schüler für Technik, Computer und Elektronik interessiert. Von daher war mir grundsätzlich schon klar, dass ich einen technischen Studiengang wählen würde. Vor dem Abitur waren wir mit der Schule bei einer Informationsveranstaltung der Erlanger TechFak. Dort wurde unter anderem auch IuK als damals noch recht neuer Studiengang vorgestellt. Ich war sofort fasziniert von der interdisziplinären Mischung aus Informatik und Elektrotechnik, die meine Interessen vereinte. Von da an war mir eigentlich klar, dass ich diesen Studiengang wählen würde.
Wie ging es dann weiter?
Nach dem Abitur habe ich, wie gesagt direkt, mit dem Studium an der FAU begonnen. Nach meinem Abschluss habe ich allerdings erst mal ein paar Jahre am Fraunhofer Institut für Integrierte Schaltungen (IIS) in Tennenlohe in der Forschung und Entwicklung im Bereich Audio- und Medientechnologie gearbeitet, bevor ich wieder an die FAU zurückgekommen bin.
Da ich mich schon lange für Audiothemen interessiert hatte, habe ich bereits meine Diplomarbeit bei den AudioLabs geschrieben. Als gemeinsame Einrichtung der FAU und dem Fraunhofer IIS, gibt es viele Anknüpfungspunkte und ich kam bei meiner Fraunhofer-Arbeit sehr oft mit den AudioLabs in Berührung und habe immer wieder gute Zusammenarbeit erfahren. Das hat dann letztlich dazu geführt, dass ich mich dann Ende 2017 einer Dissertation zugewandt habe und zum Lehrstuhl für Audiocodierung gewechselt bin.
An welchem Thema haben Sie genau geforscht?
Mein Forschungsthema heißt „Psychoakustische Effekte und Modelle zur Verarbeitung und Codierung von 3-Dimensionalem Audio“. Das heißt, ich beschäftige mich mit der Frage, wie genau die menschliche Wahrnehmung von räumlich verteilten Schallquellen funktioniert, und wie sich dieses Wissen für effiziente Verfahren zur Codierung und Verarbeitung nutzen lässt.
Die grundlegenden Eigenschaften des räumlichen Hörens sind ja etwas, was jeder Mensch tagtäglich erlebt und im Alltag meist unbewusst nutzt, um z.B. zu lokalisieren, von wo jemand spricht, ob im Straßenverkehr ein Auto von hinten kommt und so weiter. Deshalb finde ich auch die Grundlagenuntersuchungen spannend, wie sich diese Wahrnehmung und deren Genauigkeit erklären und abschätzen lässt.
Etwas konkreter kann man technische Anwendungen erleben, wenn man z.B. ins Kino in einen Film mit 3D-Audio geht bzw. eine entsprechend ausgestattete Heimkino-Anlage hat, oder Virtual Reality Systeme nutzt, die in der Regel auch räumliche Audio-Wiedergabe beinhalten.
Wie sind Sie denn genau auf Ihr Thema gekommen?
Ich bin selbst leidenschaftlicher Musiker und Musikhörer und interessiere mich deshalb schon lange allgemein für alles, was mit Audio zu tun hat. Moderne Audio-Systeme bieten ja mittlerweile 3D-Klang, das heißt, ein einhüllendes Klangerlebnis von allen Seiten. Für die Übertragung und Wiedergabe stellt dies allerdings einige Herausforderungen dar, an denen ich bereits als Entwickler am Fraunhofer IIS gearbeitet hatte. Daraus ergaben sich für mich einige Forschungsfragen, die dann zusammen mein Dissertationsthema gebildet haben.
Mit der Forschung an meinem konkreten Dissertationsthema habe ich 2017 begonnen, grundsätzlich beschäftige ich mich aber mit dem erweiterten Themengebiet der Wahrnehmung und Codierung von räumlichen Audiosignalen schon seit meiner Diplomarbeit. Das war 2011.
Was ist das übergeordnete Ziel Ihrer Forschung?
Die Wahrnehmung von 3D-Audio besser zu verstehen und insbesondere deren Genauigkeit vorhersagen zu können. Auf dieser Basis können technische Modelle und Verfahren entwickelt werden, die sich unter anderem für eine effizientere Codierung von 3D-Audio nutzen lassen, zum Beispiel, um 3D-Audio Inhalte per Internet ins Heimkino zu streamen.
Was mich am Themengebiet der Audiocodierung insbesondere fasziniert, ist die Verschmelzung von technischen Aspekten mit Aspekten und Eigenschaften der menschlichen Wahrnehmung beim Hören. Es ist eine spannende Herausforderung, sich eben nicht nur auf technische Maße verlassen zu können, sondern immer auch den „Faktor Mensch“ mit in seine Untersuchungen einzubeziehen.
Das hört sich sehr spannend an! Wie muss man sich als Laie denn die Arbeit an Ihrer Dissertation vorstellen?
Die Arbeit umfasst einen weiten Bereich. Während es zum Beispiel für die Wahrnehmung von Stereoton schon seit vielen Jahrzehnten Untersuchungen gibt, ist 3D-Audio noch ein relativ neues Gebiet. Deshalb umfasst die Arbeit auf der einen Seite auch die Durchführung von Grundlagenexperimenten zum menschlichen Hören. Dies bedeutet zum Beispiel Hörversuche, in denen man Testpersonen in ein Schalllabor setzt und mit Tönen aus verschiedenen Richtungen beschallt, um die Lokalisationsgenauigkeit zu untersuchen.
Auf der anderen Seite stehen aber auch datenbasierte Ansätze, bei denen man zum Beispiel aus Messdatenbanken mit Methoden aus dem Bereich des Maschinenlernens versucht, systematische Abhängigkeiten und Modelle abzuleiten.
Besonders spannend finde ich auch hier die interdisziplinäre Arbeit, die Aspekte der klassischen Signalverarbeitung, der Informationstheorie und des Maschinenlernens, aber auch Aspekte aus der Richtung der medizinischen Audiologie vereint.
Lieber Herr Dick, vielen Dank für das spannende Interview!
Preisverdächtige Dissertation
Für seine Dissertation wurde Sascha Dick kürzlich mit dem 2. Hugo-Geiger-Preis ausgezeichnet. Hier geht’s zum Artikel: https://www.eei.tf.fau.de/das-department-gratuliert-dr-sascha-dick-erhaelt-zweitem-platz-des-hugo-geiger-preises/