Generative KI: Googles StyleDrop lernt und imitiert Stil nach einem einzigen Bild

Mit StyleDrop stellt ein Team von Google Research ein neues KI-Modell vor, das die Generierung von Bildern ermöglicht, die einen bestimmten Stil äußerst exakt nachahmen. Bisherige Modelle leiden oft an der fehlenden Steuerbarkeit der Ergebnisse. Man bekommt zwar oft etwas "Sehenswertes" in hoher Qualität, jedoch nicht unbedingt das, was man sich ursprünglich vorgestellt hatte. Auch muss der Stil bereits im Modell eintrainiert worden und somit a priori bekannt sein, damit eine entsprechende Ausgabe überhaupt funktionieren kann.


StyleDrop kann dagegen enorm effizient neue Stilformen lernen, indem es sehr wenige trainierbare Parameter (weniger als 1 % der gesamten Modellparameter) fein abstimmt und die Qualität durch iteratives Training mit menschlichem oder automatischem Feedback verbessert. Noch besser ist, dass StyleDrop selbst dann beeindruckende Ergebnisse liefert, wenn der Benutzer nur ein einziges Bild zur Verfügung stellt, das den gewünschten Stil vorgibt.



Googles StyleDrop lernt und imitiert Stil nach einem einzigen Bild
Googles StyleDrop lernt und imitiert Stil nach einem einzigen Bild


Angetrieben von Muse, einem neuen generativen Text-zu-Bild Vision-Transformer, erfasst StyleDrop dabei Nuancen und Details eines vom Benutzer vorgegebenen Stils, wie Farbschemata, Schattierungen, Designmuster sowie lokale und globale Effekte.



Vergleiche im verlinkten Paper belegen, dass Styledrop auf Muse bei der Stilanpassung von Text-Bild-Modellen andere Methoden wie DreamBooth und Textual Inversion auf Imagen oder Stable Diffusion in der Regel deutlich übertrifft.



Googles StyleDrop im Vergleich mit anderen KIs
Googles StyleDrop im Vergleich mit anderen KIs


Auch mit Text scheint Style Drop zuverlässig(er?) umgehen zu können, als die aktuellen generativen KI-Modelle. Zumindest gibt es auch hierzu beeindruckende Ergebnisse zu sehen, wenn man die zugehörige Projektwebseite durchstöbert.



Leider kann man Style Drop noch nicht selbst ausprobieren, jedoch ist sehr stark zu erwarten, dass Google solche Projekte in sehr naher Zukunft für Anwender in der Cloud zur Verfügung stellen wird. Alleine schon, um nicht den Anschluss an Microsoft oder Adobe zu verlieren.



Googles StyleDrop
Googles StyleDrop


Die Hürde für professionelle Illustration in einem durchgängigen Stil dürfte mit diesem Tool jedenfalls ein gutes Stück weiter sinken.



Googles StyleDrop
Googles StyleDrop

Ähnliche News //
Umfrage
  • Was hältst du von den neuen Bild/Video-KIs?





    Ergebnis ansehen
slashCAM nutzt Cookies zur Optimierung des Angebots, auch Cookies Dritter. Die Speicherung von Cookies kann in den Browsereinstellungen unterbunden werden. Mehr Informationen erhalten Sie in unserer Datenschutzerklärung. Mehr Infos Verstanden!
RSS Suche YouTube Facebook Twitter slashCAM-Slash