StyleDrop kann dagegen enorm effizient neue Stilformen lernen, indem es sehr wenige trainierbare Parameter (weniger als 1 % der gesamten Modellparameter) fein abstimmt und die Qualität durch iteratives Training mit menschlichem oder automatischem Feedback verbessert. Noch besser ist, dass StyleDrop selbst dann beeindruckende Ergebnisse liefert, wenn der Benutzer nur ein einziges Bild zur Verfügung stellt, das den gewünschten Stil vorgibt.
Angetrieben von Muse, einem neuen generativen Text-zu-Bild Vision-Transformer, erfasst StyleDrop dabei Nuancen und Details eines vom Benutzer vorgegebenen Stils, wie Farbschemata, Schattierungen, Designmuster sowie lokale und globale Effekte.
Vergleiche im verlinkten Paper belegen, dass Styledrop auf Muse bei der Stilanpassung von Text-Bild-Modellen andere Methoden wie DreamBooth und Textual Inversion auf Imagen oder Stable Diffusion in der Regel deutlich übertrifft.
Auch mit Text scheint Style Drop zuverlässig(er?) umgehen zu können, als die aktuellen generativen KI-Modelle. Zumindest gibt es auch hierzu beeindruckende Ergebnisse zu sehen, wenn man die zugehörige Projektwebseite durchstöbert.
Leider kann man Style Drop noch nicht selbst ausprobieren, jedoch ist sehr stark zu erwarten, dass Google solche Projekte in sehr naher Zukunft für Anwender in der Cloud zur Verfügung stellen wird. Alleine schon, um nicht den Anschluss an Microsoft oder Adobe zu verlieren.
Die Hürde für professionelle Illustration in einem durchgängigen Stil dürfte mit diesem Tool jedenfalls ein gutes Stück weiter sinken.
mehr Informationen
Kommentare lesen/schreiben
Passende News:
- Adobe führt Credit-basiertes Modell für generative KI ein (und die Creative Cloud wird teurer)
- Quelloffen und kostenlos: Bild-KI Stable Diffusion XL 1.0 erschienen
- CM3leon - neue generative Bild-KI verspricht präzisere Gestaltungsmöglichkeiten
- Runway Gen2 macht aus einem Bild eine 4-Sekunden-Animation - ganz ohne Prompt
- Generative TV: Showrunner-AI erstellt komplette South Park-Folgen
- Neues Sony Mikrofon ECM-M1: Per auswählbarer Richtcharakteristik 8 Mikros in Einem?
- Neuer Trend: Mit Generative Fill Videos in Photoshop erweitern
- Google zeigt neue Bild-Kompression mit generativer KI
- Adobe Generative Fill - KI-Bildergänzung in Photoshop, einfach für jedermann!
- Schluss mit Kauderwelsch - neue Bild-KI DeepFloyd / IF kann auch schreiben
- Google optimiert Stable Diffusion für Smartphones: Ein Bild in nur 12 Sekunden
- Neue Funktion für Bild-KI Midjourney: Bild rein - Prompts raus