Disabling hearing loss is prevalent in 5% of the world's population. While hearing aids are widely used, they still often fail to enable users to communicate in noisy situations – for example a family reunion or restaurant visit – because of difficulties to understand speech. Decades of research in denoising systems have only yielded solutions that are confined to specific situations. Here is presented, how deep-learning based denoising systems can improve speech understanding of hearing aid users in noisy situations by a degree only comparable to the most important innovations in hearing aids: the introduction of digital circuits and the beamformer. To achieve this, the complex deep learning-based systems are trained on the equivalent of years of audio data and use evolutionary neural architec-ture searches that are guided by a newly designed speech quality metric. This metric is also deep learning-based and is trained on over 1’000’000 human speech ratings and is essential for optimizing the final denoising system. Using a laptop-based denoising system in live tests with hearing aid users, that range from mild to severe hearing loss, and with a normal hearing control group, it is shown for the first time that single-microphone techniques can recover speech intelligibility of the hearing impaired to levels of the normal hearing listeners in noisy environments. The system presented here is scalable and robust enough to eventually reach the de-sired deployment in a commercial hearing aid. This includes 1) the large variety of thousands of hours of high-quality speech material used for training, and 2) the adapt-ability of the deep learning pipeline, for example the possibility to automatically select better models for specific purposes such as optimizing for sound quality rather than noise reduction or different implementation devices. Deep learning hence can change the design of hearing aids for decades to come and holds the potential to improve the lives of millions of hearing-impaired people.
Etwa 5% der weltweiten Bevölkerung leiden unter einem Hörverlust. Obwohl Hörgeräte weit verbreitet sind, ermöglichen sie es den Benutzern oft nicht, in Situationen mit lauten Störgeräuschen, wie zum Beispiel einem Restaurant oder bei einer Familienfeier, zu kommunizieren. Trotz jahrzehntelanger Forschung im Bereich der Störgeräuschminderung funktionieren existierende Lösungen nur unter sehr spezifischen Bedingungen. In dieser Arbeit wird präsentiert, wie Deep Learning die Störgeräuschminderung in einem Ausmaß verbessern kann, dass dies mit den wichtigsten Innovationen in der Hörgerätetechnik – der Einführung der digitalen Schaltkreise und des Beamforming – vergleichbar ist. Um dies zu erreichen, wird das Deep Learning System auf dem Equivalent von Jahren an Audiodaten mit Hilfe einer evolutionären neuronalen Architektursuche trainiert, welche auf einer neuartigen Sprachqualitätsmetrik basiert. Diese Sprachqualitätsmetrik basiert ebenfalls auf Deep Learning und wurde mit über 1‘000‘000 Sprachbewertungen von Menschen trainiert und ist essenziell für die Optimierung des finalen Systems für Störgeräuschminderung. Auf einem Laptop wird das System für Störgeräuschminderung in einem Echtzeit Setup mit Normalhörenden und Hörgerätträgern,mit mildem bis starkem Hörverlust getestet. Die Ergebnisse zeigen, dass dies das erste System ist, welches mit einem einzigen Mikrophon die Sprachverständlichkeit von Hörgeschädigten auf das Niveau von Normalhörenden heben kann. Das präsentierte System ist skalierbar und robust genug, um in Zukunft eine Implementierung in kommerziellen Hörgeräten zu erreichen. Das beinhaltet 1) die große Vielfalt an Sprachdaten, die für das Training des Störgeräuschminderungsystems verwendet werden, und 2) die Anpassungsfähigkeit der Deep Learning Trainingsprozedur, zum Beispiel automatisch bessere Modelle für spezifische Zwecke auszuwählen, wie die Optimierung für Klangqualität anstatt für Geräuschreduktion, oder Modelle zu selektieren, die besser auf die jeweilige Plattform/ Prozessoren abgestimmt sind. Somit kann Deep Learning das Design von Hörgeräten für die nächsten Jahrzehnte fundamental verändern und hat das Potential, das Leben von Millionen von Menschen mit Hörverlust zu verbessern.