News: Meta Encodec komprimiert mit KI Audio-Dateien deutlich stärker als MP3

21.11.2022 - 11:20 Uhr

Das klingt spannend: Meta / Facebook Research haben einen KI-basierten Audio-Codec namens Encodec vorgestellt, der es (zumindest auf dem Forschungspapier) wahrlich in sich hat. Dieser soll gegenüber MP3-Dateien gerade bei sehr geringen Datenraten bei vergleichbarer Qualität noch einmal eine um den Faktor 10 bessere Kompression erzielen.

Dies würde bedeuten, dass sich hiermit MP3-Audiodateien noch einmal durchschnittlich auf ein Zehntel ihres Datenspeicherbedarfs reduzieren ließen. Dies hätte wiederum enorme Auswirkungen auf offline Speicherung und Audio-Streaming.

Der Aufbau von Encodec erinnert dabei stark an typische VACs/GANs. Der Kompressor erzeugt Samples, die ein folgender Diskriminator als echt oder rekonstruiert klassifiziert. Das Kompressionsmodell modifiziert daraufhin seinen Output so lange, bis der Diskriminator alle Samples für echt hält. Gleichzeitig lernt der Diskriminator auch immer verlässlicher "echt" von "rekonstruiert" zu unterscheiden. Dieses Wechselspiel perfektioniert die Audioqualität anschließend bei minimalem Dateneinsatz im Modell.

Der Aufbau von Encodec (Bildquelle: Meta)
Der Aufbau von Encodec (Bildquelle: Meta)

Laut Meta könne Encodec so Audio mit niedriger Bitrate (64 kb/s) ohne Qualitätsverlust rekonstruieren und habe zudem noch Potenzial für weitere Verbesserungen. So trainierte man zusätzlich ein Transformer-basiertes Sprachmodell, das bei gleichbleibender Qualität weitere 40 Prozent Bandbreite einsparen könnte, wenn die Latenz wie beim Streaming nicht entscheidend sei. Anders gesagt, wenn der Encoder nicht in Echtzeit arbeiten muss, sind für MP3-Audio-Anwendungen noch größere Kompressionsgewinne möglich.

Spezielle Hardware ist für den Einsatz interessanterweise ebenfalls nicht notwendig. Ein einzelner CPU-Kern soll zum En- und Decoding mit dem neuen Verfahren in Echtzeit ausreichen.

Und damit immer noch nicht genug. Meta hat angekündigt, mit KI in einem kommenden Forschungsvorhaben auch Video effektiver komprimieren zu wollen.

(rudi)

mehr Informationen
Kommentare lesen / schreiben

zur Newsmeldung auf slashCAM

   


die Seite in Desktopansicht

Passende News:

 

Top

AKTUELLE ARTIKEL

AKTUELLE NEWS

28.November 2022 - 11:15 Uhr
Mofage POCO PL nach E/RF/L/Z Mount-Adapter inkl. Drop-In Filter für Vari-ND für 329,- Dollar

27.November 2022 - 10:43 Uhr
UPDATE 3: Noch laufende Black Friday Deals von Dedolight, Sennheiser, Asus, Samyang, Lowepro,...

26.November 2022 - 13:14 Uhr
Sony baut wieder Consumer Monitore: Inzone M3 mit 240 Hz und 99% sRGB

25.November 2022 - 12:44 Uhr
UPDATE 2: Black Friday und Cyber Monday Angebote von Avid, Laowa, Filmconvert, Viltrox und mehr



weitere News: