Von mp3 zu PARty: Wie digitale Signalverarbeitung, Psychoakustik und maschinelles Lernen zusammenfinden
* Presenting author
Abstract:
Der Wunsch, Musik digital komprimiert in Hi-Fi-Qualität zu übertragen, läutete vor einigen Jahren das Zeitalter der praktischen Anwendung des Forschungsgebiets Psychoakustik ein. Hörtests wurden das Maß aller Dinge. Auf dieser Basis entstanden erste Audiocodierverfahren. Auch heute noch werden mp3, AAC und auf denselben Ideen aufbauende Verfahren weit verbreitet eingesetzt. Fast alle Nutzer*innen sind mit der so erreichbaren Tonqualität einverstanden.Fast Forward: Nach Jahrzehnten der Forschung wurde immer klarer, dass mit einfacher Optimierung entlang der physikalischen Vorgänge im Ohr die Tonwiedergabe noch nicht vollkommen gelingt. Der Wunsch nach perfekter Illusion und insbesondere guter räumlicher Klangwiedergabe führte dahin, dass der Prozess des Hörens umfassender verstanden werden musste: Die Vorgänge im Gehirn, insbesondere Kognition, sind in ihrer Bedeutung lange unterschätzt worden. Ein wesentliches Forschungsfeld ist heute die Frage, wie über Kopfhörer eine naturgetreue Wiedergabe, aber auch eine Manipulation unserer akustischen Umwelt ermöglicht werden kann. Im Team in Ilmenau wurde dafür das Akronym „PARty“ entwickelt, in Langform: „Personalized Auditory Reality“. Dazu braucht es nicht nur ein verbessertes binaurales Rendering und Informationen über die Akustik des Wiedergaberaums, sondern an verschiedenen Stellen die Hilfe von Verfahren des maschinellen Lernens. Schließlich ist unser Gehirn für Tonereignisse „ein perfekter pattern matcher“, dem wollen wir nacheifern.