Meta Encodec komprimiert mit KI Audio-Dateien deutlich stärker als MP3

// 11:20 Mo, 21. Nov 2022von

Das klingt spannend: Meta / Facebook Research haben einen KI-basierten Audio-Codec namens Encodec vorgestellt, der es (zumindest auf dem Forschungspapier) wahrlich in sich hat. Dieser soll gegenüber MP3-Dateien gerade bei sehr geringen Datenraten bei vergleichbarer Qualität noch einmal eine um den Faktor 10 bessere Kompression erzielen.


Dies würde bedeuten, dass sich hiermit MP3-Audiodateien noch einmal durchschnittlich auf ein Zehntel ihres Datenspeicherbedarfs reduzieren ließen. Dies hätte wiederum enorme Auswirkungen auf offline Speicherung und Audio-Streaming.



Der Aufbau von Encodec erinnert dabei stark an typische VACs/GANs. Der Kompressor erzeugt Samples, die ein folgender Diskriminator als echt oder rekonstruiert klassifiziert. Das Kompressionsmodell modifiziert daraufhin seinen Output so lange, bis der Diskriminator alle Samples für echt hält. Gleichzeitig lernt der Diskriminator auch immer verlässlicher "echt" von "rekonstruiert" zu unterscheiden. Dieses Wechselspiel perfektioniert die Audioqualität anschließend bei minimalem Dateneinsatz im Modell.



Der Aufbau von Encodec (Bildquelle: Meta)
Der Aufbau von Encodec (Bildquelle: Meta)


Laut Meta könne Encodec so Audio mit niedriger Bitrate (64 kb/s) ohne Qualitätsverlust rekonstruieren und habe zudem noch Potenzial für weitere Verbesserungen. So trainierte man zusätzlich ein Transformer-basiertes Sprachmodell, das bei gleichbleibender Qualität weitere 40 Prozent Bandbreite einsparen könnte, wenn die Latenz wie beim Streaming nicht entscheidend sei. Anders gesagt, wenn der Encoder nicht in Echtzeit arbeiten muss, sind für MP3-Audio-Anwendungen noch größere Kompressionsgewinne möglich.



Spezielle Hardware ist für den Einsatz interessanterweise ebenfalls nicht notwendig. Ein einzelner CPU-Kern soll zum En- und Decoding mit dem neuen Verfahren in Echtzeit ausreichen.



Und damit immer noch nicht genug. Meta hat angekündigt, mit KI in einem kommenden Forschungsvorhaben auch Video effektiver komprimieren zu wollen.


Ähnliche News //
Umfrage
  • Was hältst du von den neuen Bild/Video-KIs?





    Ergebnis ansehen
slashCAM nutzt Cookies zur Optimierung des Angebots, auch Cookies Dritter. Die Speicherung von Cookies kann in den Browsereinstellungen unterbunden werden. Mehr Informationen erhalten Sie in unserer Datenschutzerklärung. Mehr Infos Verstanden!
RSS Suche YouTube Facebook Twitter slashCAM-Slash