Neuer Algorithmus ermöglicht eigene Objekte in KI-generierten Bildern

// 12:59 Do, 15. Sep 2022von Thomas Richter

In rasendem Tempo geht die Entwicklung der textbasierten Bildgenerierung per KI weiter und ermöglicht immer weitere, praktische Funktionen. So hat jetzt ein Team von Forschern von Nvidia und der Universität Tel Aviv einen neuen Algorithmus vorgestellt, der die bisherige Funktionalität um die Möglichkeit erweitert, eigene Objekte in die Bildsynthesen zu integrieren. So lassen sich ganz spezifische Objekte (wie zum Beispiel die eigene Katze oder das eigene Auto) in den erzeugten Bildern nutzen.

Dazu gibt man dem "Textual Inversion" (oder auch "Personalized Text-to-Image Generation") getauften Algorithmus einige unterschiedliche Bilder des gewünschten Objektes (optimal sind 3-5 Stück) und trainiert ihn damit. Wird dieses neue Trainingsmaterial daraufhin in das Modell einer Bild-KI importiert, kann es mittels eines besonderen Kennworts (analog zu einer Variable) aufgerufen und in Texteingaben genutzt werden.

Das kann außerdem dazu genutzt werden, um in einem vorgegebenen Bild das eigene Objekt einfach per Text zu manipulieren, etwa um seine Farbe gezielt zu ändern, es in einer anderen Umgebung oder Malstil darzustellen, es in eine Statue oder ähnliches zu verwandeln. Der neue Algorithmus gibt damit einen Vorgeschmack auf die zukünftigen Möglichkeiten dder objektbasierten KI-Bildbearbeitung (und bald auch Videoediting) per Text.

Doch nicht nur spezielle Objekte lassen sich per Kommando in die KI-generierten Bilder einfügen. Auch abstraktere Konzepte wie etwa ein abstrakter Malstil (bzw. Look) kann der KI antrainiert werden, der dann eingesetzt werden kann, um Bildern einen spezifisches Aussehen zu verpassen.

So wird im folgenden Beispiel der Textual Inversion Algorithmus etwa mit einer kopflose Statue im Schneidersitz trainiert - diese kann dann in anderen Stilen (u.a. als Ölgemälde, Icon oder auch als Häkelfigur) reproduziert werden.

Und dank der sehr aktiven Community rund um den jüngst veröffentlichten, quelloffenen KI-Bildgenerator Stable Diffusion ist die Textual Inversion Funktion ( hier der zugehörige Programmcode ) auch schon integriert in eine spezielle Version von Stable Diffusion sowie die Web UI Version mit graphischem Benutzerinterface. Die Funktion ist allerdings noch rudimentär und erfordert etwas Programmierkenntnisse und eine leistungsstarke GPU. Interessanterweise hat ein Team von Google nahezu zeitgleich ein DreamBooth getauften Algorithmus entwickelt, der ähnliches leistet.

mehr Infos bei
textual-inversion.github.io

Auf Socials teilen:

Leserkommentare // Neueste

Darth Schneider // 06:54 am 16.9.2022

@Medienonkel Die Erde fällt trotzdem weiter rund herum…;))) Gruss Boris

medienonkel // 18:12 am 15.9.2022

Ach komm, jetzt hab ich so schön alleine im ersten Satz genügend Hinweise auf die allgemeine Relativitätstheorie gegeben...

Hayos // 17:34 am 15.9.2022

+1 Daher kommen ja bald diese In-Paint-Sachen wo man "Stable Diffusion" direkt in Photoshop & Co. verwenden, zb. für gewisse Bereiche (man lässt sich zb. eine Hand...weiterlesen

Im Forum mitdiskutieren >>

Ähnliche News //

News

Neuer Nvidia Algorithmus erschafft aus Photos eines Objekts ein bearbeitbares 3D-...

Ein Forscher-Team von Nvidia hat einen neuen Algorithmus entwickelt, mit dessen Hilfe sich aus einer Reihe von Photos eines Objekts ganz einfach ein 3D-Modell davon erstellen läßt....

// 10:59 Fr, 24. Jun 2022von Thomas Richter

News

Omnimatte: Nahezu perfekte Masken bewegter Objekte per KI

Schon letztes Jahr erzielte ein DeepLearning Algorithmus von Forschern von Google und der Universität Oxford erstaunliche Ergebnisse beim Erkennen und gezielten Manipulieren von .....

// 12:14 Fr, 27. Aug 2021von Thomas Richter

News

Video Editing per KI läßt Objekte verschwinden und ersetzt Hintergründe

Ein Team aus Forschern des israelischen Weizmann Institute of Science sowie Adobe Research hat einen interessanten neuen Algorithmus vorgestellt, der einen weiteren Meilenstein ...

// 13:06 Fr, 21. Jan 2022von Thomas Richter

News

Neue Nvidia-KI generiert Bilder 30x schneller als Stable Diffusion

Ein Forscherteam von Nvidia und der Universität Tübingen hat eine neue (alte) Methode zur Bildgenerierung per KI vorgestellt, welche gleich zwei große Vorteile gegenüber der ...

// 16:10 Mi, 8. Mär 2023von Thomas Richter

News

Stockphoto-Portal Shutterstock integriert KI-Bilder und gibt eine Antwort auf die ...

Seit kurzem steht die Frage im Raum, wie Künstler und Stock-Fotodienste überleben können, wenn bildgenerierende KIs wie DALL-E 2, Stable Diffusion oder Midjourney beliebige Bilder ...

// 09:41 Sa, 5. Nov 2022von Thomas Richter

zur Newsübersicht >

Calman Ready und 98% DCI-P3 Neue Monitorserie AOC Graphic Pro U3 für Profis

AOC hat die neue Graphic Pro U3 Monitorserie vorgestellt, die ganz auf professionelle User aus den Bereichen Video- und Bildbearbeitung zielt. Die Pro-Features umfassen die ...

// 13:57 So, 28. Apr 2024von Thomas Richter

News

Update: Postproduktions-Suite DaVinci Resolve 19: Die neuen Funktionen ausführlich erklärt

Am Blackmagic-Stand auf der NAB 2024 gibt uns Simon von Blackmagic Design einen detaillierten Einblick in die neuen Funktionen von DaVinci Resolve 19. Wir schauen uns ColorSlice, ....

// 15:38 Di, 23. Apr 2024von Rob

News

Spezifikationen geleakt AMDs Notebook APU Strix Halo - besser als Apples M3 Pro Chip?

Wir hatten uns ja noch vor drei Monaten darüber beschwert, dass im PC-Bereich die CPU-Entwicklung langsamer als notwendig voranschreitet. Doch nun lichten sich endlich die ...

// 14:05 Mo, 22. Apr 2024von Rudi Schmidts

News

Profi-Kamera App kostenlos Blackmagic Camera App bald auch für Android Smartphones

Blackmagic hatte ja im Vorfeld der NAB 2024 seine beliebte Camera App für das iPhone in einer erneuerten Version 1.3 vorgestellt. Doch eine "Kleinigkeit" blieb dabei im News-...

// 14:31 Mo, 15. Apr 2024von Rudi Schmidts

TOP THEMEN //

zum Forum >>

MEHR NEWS

zum Newsindex >

PASSENDE DISKUSSIONEN

zum Forum >>

Passende Artikel //

Aktuelles

Die Stable Diffusion Revolution: Kostenlose Bildgenerierung per KI jetzt auch auf dem Heim-PC

Seit ein paar Tagen ist es endlich soweit: die Text-zu-Bild KI Stable Diffusion wurde veröffentlicht und kann kostenlos auf dem eigenen Computer genutzt werden - damit ist jetzt ...

// 15:03 Di, 30. Aug 2022von Thomas Richter

Aktuelles

Stoppt Mickey Mouse die KI Kunst Revolution? Künstler protestieren gegen KI Konkurrenz

Die neuen bildgenerierenden KIs stellen eine Revolution dar: sie eröffnen erstmals die Möglichkeit, massenhaft hochqualitative Bilder nach Wunsch zu erzeugen - in beliebiger Menge,...

// 14:21 Di, 3. Jan 2023von Thomas Richter

zur Artikelübersicht >

Was hältst du von den neuen Bild/Video-KIs?
Toll, so viele neue Kreativtools!
Sie werden das Filmemachen vereinfachen
Sie werden das Filmen z.T. ersetzen
Sie werden mich arbeitslos machen
Die sind völlig überbewertet

Ergebnis ansehen

Aktuelle News //

News

Mobile Videoproduktion Apple stellt neue Final Cut Pro Versionen für iPad und Mac vor

Zusammen mit der Einführung der neuen iPad Pro und iPad Air Modelle hat Apple auch neue Versionen von Final Cut Pro für Mac und Final Cut Pro für iPad zusammen mit neuen Logic Pro ...

// 17:57 Di, 7. Mai 2024von Rob

News

Frische Tablets von Apple iPad Pro und Air jetzt auch mit OLED und M4-Prozessor von 699 bis 3.100 Euro

Die zwei neuen iPad-Air-Modelle sind mit einem M2-SoC ausgestattet und unterscheiden sich vor allem durch ihre Displaygröße. Das große Modell mit 13 Zoll soll zudem gegenüber dem ...

// 17:33 Di, 7. Mai 2024von Rudi Schmidts

zur Newsübersicht >