Kolloquium - Details zum Vortrag
Sie werden über Vorträge rechtzeitig per E-Mail informiert werden, wenn Sie den Newsletter des kommunikationstechnischen Kolloquiums abonnieren.
Alle Interessierten sind herzlich eingeladen, eine Anmeldung ist nicht erforderlich.
Master-Vortrag: Lokalisation von Schallquellen mit Methoden des maschinellen Lernens
Lukas Stich
Montag, 11. November 2019
14:00 Uhr
Hörsaal 4G
In dieser Arbeit wird die Lokalisation von Schallquellen mithilfe von künstlichen neuronalen Netzen in verschiedenen akustischen Umgebungen untersucht. Eine Kombination aus achtkanaligem Mikrofon-Array und Convolutional Neural Networks wird verwendet, um die Position der Schallquelle hinsichtlich ihres Azimutwinkels zu schätzen.
Als Quellsignal werden hierbei Rausch- und Sprachsequenzen eingesetzt, die mit einer Kurzzeit-Fourier-Transformation in den Frequenzbereich überführt werden. Das für die Lokalisation analysierte Merkmal ist die Phase. Es werden drei verschiedene Umgebungen betrachtet, die sich hinsichtlich ihrer akustischen Komplexität unterscheiden.
Die erste Umgebung ist ein Freifeld, das am Computer simuliert wird. Hier hat sich gezeigt, dass der Adam Optimierer dem RMSProp Optimierer vorzuziehen ist und es im Verlauf des Trainings keinen Unterschied zwischen der He-Initialisierung mit Gleichverteilung und Normalverteilung gibt. Der mittlere absolute Fehler ist bei der Lokalisation mit dem neuronalen Netz in Freifeld-Bedingungen kleiner als bei zwei untersuchten Referenzverfahren.
Die zweite Umgebung ist ein Messraum, in dem zum Sammeln von Trainingsdaten umfangreiche Messungen durchgeführt wurden. Bei der Verwendung von Data Augmentation konnte ein kleinerer Generalisierungsfehler festgestellt werden. Die Genauigkeit bei der Klassifizierung der Testdaten ist mit dem neuronalen Netz höher als mit den Verfahren aus der Literatur. Allerdings ist der mittlere absolute Fehler größer.
Die dritte Umgebung ist der Innenraum eines Demofahrzeuges, das mit zusätzlichen Lautsprechern ausgestattet ist. Hier wurde deutlich, dass die Fähigkeit eines neuronalen Netzes, das mit Daten aus dem Messraum trainiert wurde, nicht ohne zusätzliche Anpassungen an die akustische Umgebung im Fahrzeuginnenraum übertragen werden kann.
