Kann Chat GPT Bilder besser verlustfrei komprimieren als PNG?

// 10:24 Mo, 2. Okt 2023von Rudi Schmidts

Was passiert eigentlich, wenn man ein Bild verlustfrei komprimiert? Um Daten zu komprimieren, muss man in den Daten wiederkehrende Muster finden. Daraufhin kann man diese speichersparend zusammenfassen. Also statt 10110 10110 10110 schreibt man beispielsweise kürzer 3 x 10110. Hiermit lässt sich in der Regel bereits einiges an Speicherplatz sparen.

Bei einer verlustfreien Kompression muss das komprimierte Bild nach dem "Entpacken" wieder mit dem Originalbild bis auf das letzte Bit übereinstimmen.

Und wie funktioniert ein Large Language Model (LLM) à la ChatGPT? Hier versucht ein KI-Modell, die nächsten Worte in einer Wort-Sequenz zu erraten. GPT kann hiermit immer Sätze so weiterschreiben, wie sie höchstwahrscheinlich in einem Originaltext weitergeführt werden würden. Hierfür muss GPT ebenso Muster im vorgegebenen Text erkannt haben.

Mustererkennung und daraus eine Vermutung anzustellen, wie sich eine Datenfolge weiterentwickelt, verbindet somit die beiden Welten. Doch können große Sprachmodelle und effektive, verlustfreie Bildkompression in der Praxis wirklich viel miteinander zu tun haben?

In dem arXiv-Forschungspapier mit dem Titel "Language Modeling Is Compression" legen Forscher nun einen solchen Zusammenhang nahe. So haben sie erstaunlicherweise entdeckt, dass das DeepMind LLM namens Chinchilla 70B eine verlustfreie Komprimierung von Bildpatches aus der ImageNet-Bilddatenbank auf 43,4 Prozent ihrer ursprünglichen Größe durchführen kann - und damit sogar den bewährten PNG-Algorithmus übertrifft, der dieselben Daten "nur" auf 58,5 Prozent komprimierte. Für Audio komprimierte Chinchilla Samples aus dem LibriSpeech-Audiodatensatz auf nur 16,4 Prozent ihrer Rohgröße und übertraf damit die übliche FLAC-Komprimierung mit 30,3 Prozent. In beiden Fällen handelt es sich um eine verlustfreie Komprimierung (lossless).

Das wirklich Seltsame an den überraschend guten Kompressions-Ergebnissen ist jedoch, dass Chinchilla 70B hauptsächlich für den Umgang mit Text trainiert wurde - und nun trotzdem überraschend effektiv bei der Komprimierung anderer Arten von Daten ist. In den zwei betrachteten Fällen sogar noch besser als Algorithmen, die speziell für diese Aufgaben entwickelt wurden. Damit dürfte wohl feststehen, dass KI-Modelle in Zukunft auch bei der Bild- und Audio-Kompression eine größere spielen werden.

Doch es gibt natürlich auch ein paar kritische Anmerkungen zu dieser Meldung, die gerade in IT- und KI-Kreisen große Wellen schlägt. Erstens ist das Paper noch nicht peer-reviewed, weshalb sich durchaus ein Fehler eingeschlichen haben könnte. So wäre denkbar, dass Chinchilla 70B bei seinem Training irgendwie Zugriff auf die ImageNet-Bilddatenbank sowie auf den LibriSpeech-Audiodatensatz hatte. Und damit die Daten schon durch das eigene Training kannte.

Zudem sollte man nicht die Größe des "Decoders" aus dem Auge verlieren. Um eine PNG-Datei zu dekomprimieren, reicht in der Regel ein sehr kleines Programm mit wenigen KB-Code aus, während ein Chinchilla 70B Modell als Decoder mehrere parallel geschaltete Hochleistungs-GPUs und hunderte GB GPU-RAM benötigt.

Solche KI-Kompressoren sind also keineswegs effizient bezüglich Speicherverbrauch oder Rechenleistung. Und werden es vermutlich auch nicht in absehbarer Zeit sein.

mehr Infos bei
arstechnica.com

Auf Socials teilen:

Leserkommentare // Neueste

dienstag_01 // 14:19 am 2.10.2023

Danke für den Tipp.

Skeptiker // 13:33 am 2.10.2023

Wichtiger Hinweis, vielen Dank für den interessanten Artikel. Da ging's um die Entdeckung 2013, dass Xerox-Kopierer systematisch "Zahlendreher" (bzw. Ersatzzahlen) als...weiterlesen

AndySeeon // 12:33 am 2.10.2023

Bei „Erraten“ fällt mir doch gleich wieder Xerox ein (Stichwort „David Kriesel“). Gruß, Andreas

Im Forum mitdiskutieren >>

Ähnliche News //

News

GPT-4 kommt schon schon nächste Woche: KI für Text, Bild- und Video

Heise hatte bereits am Donnerstag als erster darüber berichtet, dass bei der Microsoft-Veranstaltung "KI im Fokus – Digitaler Kickoff" fast beiläufig erwähnt wurde, dass GPT-4 ...

// 11:03 Sa, 11. Mär 2023von Rudi Schmidts

News

Stockphoto-Portal Shutterstock integriert KI-Bilder und gibt eine Antwort auf die ...

Seit kurzem steht die Frage im Raum, wie Künstler und Stock-Fotodienste überleben können, wenn bildgenerierende KIs wie DALL-E 2, Stable Diffusion oder Midjourney beliebige Bilder ...

// 09:41 Sa, 5. Nov 2022von Thomas Richter

News

Netflix entfernt Bildrauschen, spart 30% Bandbreite - und fügt es wieder hinzu

Der Filmemacher Parker Gibbons hat auf eine sehr interessante Tatsache aufmerksam gemacht: Netflix entfernt vor dem Streaming seiner Filme das Bildrauschen und fügt es beim ...

// 10:00 Do, 21. Jul 2022von Thomas Richter

News

Dramatron: KI erstellt aus Plot-Prompts Drehbücher mitsamt Dialogen

Seit kurzem ist ein neues, auf dem GPT-3 Modell basierendes KI-Tool online, das bei der Erstellung von Drehbüchern helfen soll - ausgehend von einem einfachen Plot-Prompt, welches ...

// 10:36 So, 11. Dez 2022von blip

News

Künstler vs KIs: Neues Tool macht Kunstwerke für KIs unverdaulich

Der Boom bildgenerierender KIs, die per Prompt beliebige Bilder erzeugen, hat bei Künstlern große Ängste ausgelöst, kann doch jeder Kunst- oder Künstlerstil - egal ob Malerei, ...

// 19:51 Mo, 20. Feb 2023von Thomas Richter

zur Newsübersicht >

Generative Video-KI-Funktionen Adobe Firefly für Premiere Pro - Generative Extend, Object removal/addition

Zuletzt im Oktober hatte Adobe Firefly-Funktionen für Premiere Pro geteasert, darunter eine Generative Fill-Funktion - nun wird es konkret. Denn noch in diesem Jahr sollen über ...

// 15:08 Mo, 15. Apr 2024von blip

News

Übernahme ist durch RED ist nun eine Nikon-Tochter - und Jarred Land abgesetzt

Rechtzeitig zur NAB gab Nikon bekannt, die Übernahme von RED sei nun zu 100% vollzogen. Ab sofort werden Jarred Land zusammen mit James Jannard nur noch enge Berater der Nikon-...

// 14:13 So, 14. Apr 2024von blip

News

Günstiger und besser? Blackmagic stellt neues DaVinci Resolve Micro Color Panel für 495 Dollar vor

Blackmagic Design hat auf der NAB mit dem DaVinci Resolve Micro Color Panel ein weiteres, besonders erschwingliches Pult für die Farbkorrektur mit DaVinci Resolve angekündigt, ...

// 09:06 Sa, 13. Apr 2024von Rudi Schmidts

News

Blackmagic PYXIS 6K: Die Vollformat "Box"-Kamera mit Viewfinder, 2x SDI, Sideplates (!) uvm.

Am vielseitigsten riggbare Cam Blackmagic PYXIS 6K: Die Vollformat „Box“-Kamera mit Viewfinder, 2x SDI, Sideplates ...

Von vielen seit langem ersehnt und jetzt da: Blackmagic stellt mit der Pyxis 6K gleich drei leistungsstärkere Vollformat-Versionen seiner Cinema Camera 6K vor, die in ein ...

// 03:40 Sa, 13. Apr 2024von Rob

TOP THEMEN //

zum Forum >>

MEHR NEWS

zum Newsindex >

PASSENDE DISKUSSIONEN

zum Forum >>

Passende Artikel //

Wissen

Megatrend oder Nischen-Technologie? - Cloud-Services in der Videoproduktion

Auf der NAB 2022 hat es letztlich nur ein Thema geschafft, eine dominante Rolle zu spielen: Die Cloud. Oder besser gesagt, Cloud-Lösungen, die speziell für die Videoproduktion ...

// 11:48 Fr, 29. Apr 2022von Rudi Schmidts

Adobe Engineering Hours #5 -- die nächste Version von Premiere Pro, #EditYourStory und mehr

Nachdem die Adobe Engineering Hour zuletzt auf dem DOK.forum 2021 zu Gast war, steigt die fünfte Live-Session nun am Donnerstag wieder im gewohnten Format. Im Mittelpunkt stehen ...

// 15:50 Mo, 21. Jun 2021von slashCAM

zur Artikelübersicht >

Was hältst du von den neuen Bild/Video-KIs?
Toll, so viele neue Kreativtools!
Sie werden das Filmemachen vereinfachen
Sie werden das Filmen z.T. ersetzen
Sie werden mich arbeitslos machen
Die sind völlig überbewertet

Ergebnis ansehen

Aktuelle News //

News

Digital Twin auf YouTube Videointerview mit dem eigenem KI-Zwilling

Auch wenn wir seit fast zwei Jahren die Fortschritte von generativer KI mitverfolgen dürfen, gibt es immer wieder noch ziemlich überraschende Auswüchse, die wir so noch gar nicht ....

// 12:27 Fr, 26. Apr 2024von Rudi Schmidts

News

Cine-Retro-Look LVX AURORA VISTA Primes - Re-Housing und Vintage Tuning jetzt auch in Europa

Wer immer auf der Suche nach Optiken mit besonderem "Charakter" ist, dürfte sich vielleicht über die folgende Meldung freuen. Aufgrund der europäische Vertriebsübernahme durch die ...

// 09:37 Fr, 26. Apr 2024von Rudi Schmidts

zur Newsübersicht >