News: Apple zeigt eigenes KI-Modell für Bildbearbeitung als Open Source - MGIE

8.2.2024 - 15:07 Uhr

Zusammen mit der University of California in Santa Barbara hat Apple ein eigenes KI-Modell entwickelt, das offenbar ein Sprach- und ein Diffusionsmodell kombiniert, um einfache Bildmanipulationen für jedermann zu ermöglichen.

Das auf den Namen MGIE getaufte Modell steht letztlich für Multimodal Large Language Model Guided Image Editing - übersetzt also eine durch ein Sprachmodell geführte Bildbearbeitung. In der Praxis wird die Eingabeaufforderung in eine präzisere Anweisung für das Netzwerk umgewandelt, die dann mittels eines Diffusionsmodells das Eingabebild entsprechend verändert.

Das zugehörige Paper ist hier zu finden und neben einem GitHub Repository gibt es auch eine Demo-Webseite zum herumspielen, die auf Hugging Face gehostet wird.

MGIE ist nicht das erste Projekt dieser Art und mit etwas Know-How kann man auch leicht Stable Diffusion oder Adobes Firefly zur Lösung solcher Aufgaben einsetzen. Es bleibt jedoch abzuwarten, welche Qualität der Output von MGIE haben wird. Das Paper selbst sieht jedenfalls Photoshop-ähnliche Aufgaben als Einsatzzweck.

Spannend ist dabei, wie stark der unveränderte Bereich eines Bildes beeinflusst wird. Denn aktuelle KI-Modelle verändern hier meist mehr, als dem Anwender lieb ist. Wer sich die folgende Demo-Modifikation genauer ansieht, wird schnell verstehen, was wir meinen, denn sie strotzt noch vor typischen KI-Artefakten:

Apple stellt eigenes KI-Modell für Bildverarbeitung als Open Source vor - MGIE
Apple stellt eigenes KI-Modell für Bildverarbeitung als Open Source vor - MGIE

Und auch wenn andere Seiten das vielleicht anders sehen, glauben wir auch, dass es grundsätzlich eher ein schlechtes Zeichen ist, wenn Apple den Code für so ein Tool frei gibt. Denn dann ist es eher unwahrscheinlich, dass es seinen Weg in ein kommendes Produkt findet.

Aber natürlich soll man den Tag nicht vor dem Abend loben. Wir werden sicherlich auch versuchen, uns ein konkreteres Bild von MGIE zu machen - sobald der derzeitige Ansturm auf die HuggingFace-Demoseite etwas abgeflaut ist.

(Rudi Schmidts)

mehr Informationen

Kommentare lesen/schreiben

zur Newsmeldung auf slashCAM

   


die Seite in Desktopansicht

Passende News:

 

Top

AKTUELLE ARTIKEL

AKTUELLE NEWS

25. 2024 - 11:45 Uhr
Sony PDT-FP1 - stabile und einfache Datenübertragung beim Dreh

24. 2024 - 12:00 Uhr
Elevenlabs bietet demnächst auch KI-generierte Soundeffekte an

23. 2024 - 18:35 Uhr
SmallRig bringt umfassendes Retro-Zubehörsystem für Fujifilm X100VI

23. 2024 - 10:46 Uhr
Blackmagic URSA Broadcast G2 mit Cloud Upload und geringerer SDI-Latenz



weitere News: