Nachrichten, Gerüchte, Meldungen und Berichte aus der IT-Szene

Redaktion: Heinz Schmitz

Bio-inspiriertes Mikrofon zur Spracherkennung

07.05.2023 00:00

Technologisches Herzstück des Mikrofons sind den Haarzellen des menschlichen Innenohrs nachempfundene Biegebalken aus Silizium. (Quelle: Michael Reichel/TU Ilmenau)

Technologien zur Spracherkennung wie Alexa oder Siri haben in den letzten Jahren rasante Fortschritte gemacht. Sie können inzwischen Sprachbefehle zum Beispiel zur Steuerung von Handys, zur Bedienung eines Weckers oder auch unterschiedlichster Smart-Home-Anwendungen sehr gut verstehen. Laute Umgebungen mit vielen verschiedenen Geräuschen wie Bahnhöfe, Restaurants oder Straßen sind jedoch für derzeitige Technologien mit konventionellen Mikrofonen noch sehr problematisch. Das menschliche Gehör ist dagegen in der Lage, die Stimmen einzelner Personen in lauten Umgebungen mit einer Vielzahl an Hintergrundgeräuschen herauszuhören und das Gesagte zu verstehen.

Die Vorzüge des menschlichen Ohrs hat sich nun ein Forscherteam der TU Ilmenau, der Christian-Albrechts-Universität Kiel, des Karlsruher Instituts für Technologie, des University College Cork und des Ilmenauer Fraunhofer-Instituts für Digitale Medientechnologie zunutze gemacht. Dabei bilden die Wissenschaftlerinnen und Wissenschaftler die Funktion des Innenohrs nach, denn das unterstützt beim Menschen das Hörverstehen insbesondere in lauten Umgebungen. Das von ihnen entwickelte bio- inspirierte Mikrofon nutzt drei Eigenschaften des menschlichen Gehörs:

Geräusche, etwa ein gesprochenes Wort oder eine Melodie, bestehen aus verschiedenen Tönen. Sie können von Spracherkennungssystemen erkannt werden, indem die Geräusche in die enthaltenen Töne zerlegt werden. Beim Menschen erfolgt diese Zerlegung nicht erst im Gehirn, sondern bereits im Innenohr. Das besteht aus einer Vielzahl kleiner Haarzellen, die jeweils auf unterschiedliche Töne reagieren. Damit wird verhindert, dass sich die verschiedenen Töne beim Hören beeinflussen und leise Töne durch laute Töne verdeckt werden. Im Unterschied zu herkömmlichen Mikrofonen zerlegt das bio-inspirierte Mikrofon Geräusche schon vor der Umwandlung in ein elektrisches Signal.

Um leise Töne zu verstehen, müssen sie deutlich verstärkt werden. Laute Töne hingegen müssen, damit sie unverzerrt wahrgenommen werden, gedämpft werden. Diese Fähigkeit des Gehörs erlaubt es dem Menschen, Töne zu hören, deren Schalldruck sich um einen Faktor von einer Million ändern. Im Innenohr ist diese, wie Fachleute sie nennen: nichtlineare oder kompressive Verstärkung bereits in den Sensor integriert. So ist es möglich, deutlich größere Lautstärkebereiche zu hören.

In leisen Umgebungen gelingt es dem Menschen relativ leicht, für ihn wichtige Schallsignale wie die Stimme einer einzelnen Person herauszuhören. In lauten Umgebungen ist dies jedoch schwierig und die für den Hörer wichtigen Schallsignale müssen für ein gutes Hörverständnis stärker verstärkt werden als die Umgebungsgeräusche. Um in verschiedenen Umgebungen möglichst gleich gut zu hören, werden daher die Sensoren des Innenohres, die Haarzellen, permanent an die sich verändernden Erfordernisse angepasst. Dies wird dadurch erreicht, dass die relativen Verstärkungsfaktoren für einzelne Töne situationsabhängig verändert werden.

Das Mikrofon könnte helfen, die Spracherkennung zur Steuerung einer Vielzahl von digitalen Anwendungen zu verbessern. (Quelle: Michael Reichel/TU Ilmenau)

Technologisches Herzstück des bio-inspirierten Mikrofons sind den Haarzellen nachempfundene Biegebalken aus Silizium mit einer Länge von einem Drittel Millimeter bis etwas über einen Millimeter. Dieser Längenunterschied bewirkt, dass jeder Biegebalken nur auf einen einzelnen Ton des Schallsignals reagiert (Punkt 1). Eine elektronische Steuerung ermöglicht es, die Eigenschaften jedes Biegebalkens, wie zum Beispiel die Verstärkung, separat zu steuern (Punkt 2) und so an verschiedene, zum Beispiel unterschiedlich laute Umgebungen anzupassen (Punkt 3).

Dank der für jede Tonhöhe separat steuerbaren und automatischen Anpassung an das Schallsignal werden die relevanten Signale hervorgehoben. Dadurch, so die Idee der Forscherinnen und Forscher, ist für die Sprachanalyse weniger Rechenleistung und somit für das Gesamtsystem aus Spracherkennung und Mikrofon weniger elektrische Energie nötig. Vor allem Anwendungen mit begrenzten Energiekapazitäten, etwa Hörgeräte, wären so in der Lage, deutlich komplexere Sprach- und Schallanalysen durchzuführen. Zudem ermöglicht die Herstellung des bio-inspirierten Mikrofons auf Basis von Siliziumtechnologie nicht nur eine mikrometergenaue Fertigung, sondern auch eine kostengünstige Massenproduktion.

Gemeinsam mit den Wissenschaftlerinnen und Wissenschaftlern der Partnereinrichtungen will die TU Ilmenau nun Prototypen des Bio- inspirierten Mikrofons entwickeln. Mögliche Einsatzgebiete sind neben Sprachassistenzsystemen und Hörgeräten auch Technologien zur Überwachung von Maschinen in der Produktion.

Realisiert wurde der Demonstrator des neuen bio-inspirierten Mikrofons im „ForLab Ilmenau für neuromorphe Elektronik“, das durch das Bundesforschungsministerium unterstützt wird. Das ForLab ist am Zentrum für Mikro- und Nanotechnologien der TU Ilmenau angesiedelt.

Originalveröffentlichung:

Claudia Lenk, Philipp Hövel, Kalpan Ved, Steve Durstewitz, Thomas Meurer, Tobias Fritsch, Andreas Männchen, Jan Küller, Daniel Beer, Tzvetan Ivanov & Martin Ziegler: Neuromorphic acoustic sensing using an adaptive microelectromechanical cochlea with integrated feedback; Nature Electronics (2023)

https://www.nature.com/articles/s41928-023-00957-5

Zurück