Neuer Algorithmus ermöglicht eigene Objekte in KI-generierten Bildern

// 12:59 Do, 15. Sep 2022von Thomas Richter

In rasendem Tempo geht die Entwicklung der textbasierten Bildgenerierung per KI weiter und ermöglicht immer weitere, praktische Funktionen. So hat jetzt ein Team von Forschern von Nvidia und der Universität Tel Aviv einen neuen Algorithmus vorgestellt, der die bisherige Funktionalität um die Möglichkeit erweitert, eigene Objekte in die Bildsynthesen zu integrieren. So lassen sich ganz spezifische Objekte (wie zum Beispiel die eigene Katze oder das eigene Auto) in den erzeugten Bildern nutzen.

Dazu gibt man dem "Textual Inversion" (oder auch "Personalized Text-to-Image Generation") getauften Algorithmus einige unterschiedliche Bilder des gewünschten Objektes (optimal sind 3-5 Stück) und trainiert ihn damit. Wird dieses neue Trainingsmaterial daraufhin in das Modell einer Bild-KI importiert, kann es mittels eines besonderen Kennworts (analog zu einer Variable) aufgerufen und in Texteingaben genutzt werden.

Das kann außerdem dazu genutzt werden, um in einem vorgegebenen Bild das eigene Objekt einfach per Text zu manipulieren, etwa um seine Farbe gezielt zu ändern, es in einer anderen Umgebung oder Malstil darzustellen, es in eine Statue oder ähnliches zu verwandeln. Der neue Algorithmus gibt damit einen Vorgeschmack auf die zukünftigen Möglichkeiten dder objektbasierten KI-Bildbearbeitung (und bald auch Videoediting) per Text.

Doch nicht nur spezielle Objekte lassen sich per Kommando in die KI-generierten Bilder einfügen. Auch abstraktere Konzepte wie etwa ein abstrakter Malstil (bzw. Look) kann der KI antrainiert werden, der dann eingesetzt werden kann, um Bildern einen spezifisches Aussehen zu verpassen.

So wird im folgenden Beispiel der Textual Inversion Algorithmus etwa mit einer kopflose Statue im Schneidersitz trainiert - diese kann dann in anderen Stilen (u.a. als Ölgemälde, Icon oder auch als Häkelfigur) reproduziert werden.

Und dank der sehr aktiven Community rund um den jüngst veröffentlichten, quelloffenen KI-Bildgenerator Stable Diffusion ist die Textual Inversion Funktion ( hier der zugehörige Programmcode ) auch schon integriert in eine spezielle Version von Stable Diffusion sowie die Web UI Version mit graphischem Benutzerinterface. Die Funktion ist allerdings noch rudimentär und erfordert etwas Programmierkenntnisse und eine leistungsstarke GPU. Interessanterweise hat ein Team von Google nahezu zeitgleich ein DreamBooth getauften Algorithmus entwickelt, der ähnliches leistet.

mehr Infos bei
textual-inversion.github.io

Auf Socials teilen:

Leserkommentare // Neueste

Darth Schneider // 06:54 am 16.9.2022

@Medienonkel Die Erde fällt trotzdem weiter rund herum…;))) Gruss Boris

medienonkel // 18:12 am 15.9.2022

Ach komm, jetzt hab ich so schön alleine im ersten Satz genügend Hinweise auf die allgemeine Relativitätstheorie gegeben...

Hayos // 17:34 am 15.9.2022

+1 Daher kommen ja bald diese In-Paint-Sachen wo man "Stable Diffusion" direkt in Photoshop & Co. verwenden, zb. für gewisse Bereiche (man lässt sich zb. eine Hand...weiterlesen

Im Forum mitdiskutieren >>

Ähnliche News //

News

Neuer Nvidia Algorithmus erschafft aus Photos eines Objekts ein bearbeitbares 3D-...

Ein Forscher-Team von Nvidia hat einen neuen Algorithmus entwickelt, mit dessen Hilfe sich aus einer Reihe von Photos eines Objekts ganz einfach ein 3D-Modell davon erstellen läßt....

// 10:59 Fr, 24. Jun 2022von Thomas Richter

News

Omnimatte: Nahezu perfekte Masken bewegter Objekte per KI

Schon letztes Jahr erzielte ein DeepLearning Algorithmus von Forschern von Google und der Universität Oxford erstaunliche Ergebnisse beim Erkennen und gezielten Manipulieren von .....

// 12:14 Fr, 27. Aug 2021von Thomas Richter

News

Video Editing per KI läßt Objekte verschwinden und ersetzt Hintergründe

Ein Team aus Forschern des israelischen Weizmann Institute of Science sowie Adobe Research hat einen interessanten neuen Algorithmus vorgestellt, der einen weiteren Meilenstein ...

// 13:06 Fr, 21. Jan 2022von Thomas Richter

News

Neue Nvidia-KI generiert Bilder 30x schneller als Stable Diffusion

Ein Forscherteam von Nvidia und der Universität Tübingen hat eine neue (alte) Methode zur Bildgenerierung per KI vorgestellt, welche gleich zwei große Vorteile gegenüber der ...

// 16:10 Mi, 8. Mär 2023von Thomas Richter

News

Stockphoto-Portal Shutterstock integriert KI-Bilder und gibt eine Antwort auf die ...

Seit kurzem steht die Frage im Raum, wie Künstler und Stock-Fotodienste überleben können, wenn bildgenerierende KIs wie DALL-E 2, Stable Diffusion oder Midjourney beliebige Bilder ...

// 09:41 Sa, 5. Nov 2022von Thomas Richter

zur Newsübersicht >

Generative Video-KI-Funktionen Adobe Firefly für Premiere Pro - Generative Extend, Object removal/addition

Zuletzt im Oktober hatte Adobe Firefly-Funktionen für Premiere Pro geteasert, darunter eine Generative Fill-Funktion - nun wird es konkret. Denn noch in diesem Jahr sollen über ...

// 15:08 Mo, 15. Apr 2024von blip

News

Übernahme ist durch RED ist nun eine Nikon-Tochter - und Jarred Land abgesetzt

Rechtzeitig zur NAB gab Nikon bekannt, die Übernahme von RED sei nun zu 100% vollzogen. Ab sofort werden Jarred Land zusammen mit James Jannard nur noch enge Berater der Nikon-...

// 14:13 So, 14. Apr 2024von blip

News

Günstiger und besser? Blackmagic stellt neues DaVinci Resolve Micro Color Panel für 495 Dollar vor

Blackmagic Design hat auf der NAB mit dem DaVinci Resolve Micro Color Panel ein weiteres, besonders erschwingliches Pult für die Farbkorrektur mit DaVinci Resolve angekündigt, ...

// 09:06 Sa, 13. Apr 2024von Rudi Schmidts

News

Blackmagic PYXIS 6K: Die Vollformat "Box"-Kamera mit Viewfinder, 2x SDI, Sideplates (!) uvm.

Am vielseitigsten riggbare Cam Blackmagic PYXIS 6K: Die Vollformat „Box“-Kamera mit Viewfinder, 2x SDI, Sideplates ...

Von vielen seit langem ersehnt und jetzt da: Blackmagic stellt mit der Pyxis 6K gleich drei leistungsstärkere Vollformat-Versionen seiner Cinema Camera 6K vor, die in ein ...

// 03:40 Sa, 13. Apr 2024von Rob

TOP THEMEN //

zum Forum >>

MEHR NEWS

zum Newsindex >

PASSENDE DISKUSSIONEN

zum Forum >>

Passende Artikel //

Aktuelles

Die Stable Diffusion Revolution: Kostenlose Bildgenerierung per KI jetzt auch auf dem Heim-PC

Seit ein paar Tagen ist es endlich soweit: die Text-zu-Bild KI Stable Diffusion wurde veröffentlicht und kann kostenlos auf dem eigenen Computer genutzt werden - damit ist jetzt ...

// 15:03 Di, 30. Aug 2022von Thomas Richter

Aktuelles

Stoppt Mickey Mouse die KI Kunst Revolution? Künstler protestieren gegen KI Konkurrenz

Die neuen bildgenerierenden KIs stellen eine Revolution dar: sie eröffnen erstmals die Möglichkeit, massenhaft hochqualitative Bilder nach Wunsch zu erzeugen - in beliebiger Menge,...

// 14:21 Di, 3. Jan 2023von Thomas Richter

zur Artikelübersicht >

Was hältst du von den neuen Bild/Video-KIs?
Toll, so viele neue Kreativtools!
Sie werden das Filmemachen vereinfachen
Sie werden das Filmen z.T. ersetzen
Sie werden mich arbeitslos machen
Die sind völlig überbewertet

Ergebnis ansehen

Aktuelle News //

News

Prager Urteil Können KI-generierte Bilder, Klänge und Videos von jedermann frei genutzt werden?

Die Rechtslage bei KI generierten Inhalten ist zwar keinesfalls eindeutig, jedoch gibt es immer wieder Einzelentscheidungen, die bereits einen zukünftigen Interpretations-Korridor ...

// 11:48 Mo, 29. Apr 2024von Rudi Schmidts

News

Calman Ready und 98% DCI-P3 Neue Monitorserie AOC Graphic Pro U3 für Profis

AOC hat die neue Graphic Pro U3 Monitorserie vorgestellt, die ganz auf professionelle User aus den Bereichen Video- und Bildbearbeitung zielt. Die Pro-Features umfassen die ...

// 13:57 So, 28. Apr 2024von Thomas Richter

zur Newsübersicht >