Googles neuer Super-Resolution Algorithmus SR3 skaliert Gesichter nahezu perfekt hoch

// 18:11 Mi, 14. Jul 2021von Thomas Richter

Ein Forscherteam von Google hat einen neuen DeepLearning Super-Resolution Algorithmus vorgestellt, der alle bisher entwickelten Methoden in den Schatten stellt. Die SR3 (Super-Resolution via Repeated Refinement) getaufte Methode demonstriert besonders in Beispielen hochskalierter Gesichter ihre Stärke: so werden Photos von Gesichtern mit einer Auflösung von nur 64 x 64 Pixeln in zwei Schritten erst nach 256 x 256 Pixeln, dann nach 1.024 x 1.024 Pixeln hochgerechnet, was einer 16-fachen Vergrößerung entspricht. In einem anderen Experiment werden Bilder von Objekten wie etwa Blumen, Feuerwehrautos, Vögeln oder Bauwerken von 64 x 64 nach 256 x 256 Pixeln hochskaliert.

Die hohe Qualität der hochskalierten Bilder zeigte sich im Bildvergleichsexperiment: Probanden sollten entscheiden, ob das hochaufgelöste Orginalbild oder das erst in der Auflösung verminderte und dann per SR3 wieder hochgerechnete Bild besser aussieht - bei einer 8-fachen Hochskalierung von 8 x 8 nach 128 x 128 Pixeln wählte rund die Hälfte das hochskalierte Gesicht.

Das entspricht genau der Zufallsverteilung und bedeutet, dass nicht mehr unterschieden werden kann zwischen dem Original und der per Super Resolution erzeugten Version. Bei der viel schwierigen Aufgabe der 4-fachen Hochskalierung eines 64 x 64 Photos eines natürlichen Gegenstandes auf 256 x 256 zogen immerhin noch 40% der Versuchsteilnehmer das generierte Bild dem Original vor.

Wie funktioniert Super Resolution überhaupt?

Galt bis zum letzten Jahrzehnt noch das Dogma, dass bei einer Vergrößerung der Auflösung kein Detail hinzukommen kann, was nicht im Ursprungsbild liegt, befinden wir uns seit einigen Jahren in einem Paradigmen-Wechsel. Das Schlagwort heißt Super-Resolution. Unter Super-Resolution versteht man Technologien, die in der Nachbearbeitung einem Bild mehr Details hinzufügen, als ursprünglich in digitaler Form vorliegen.

Einfach gesagt sind es Verfahren, welche die Auflösung eines Bildes erhöhen und dabei für das "Mehr an Pixeln" nicht nur Interpolation zwischen bekannten Pixeln betreiben. Eine Superresolution (SR)-Applikation muss also Details schlüssig hinzuerfinden.

Weitere hochskalierte Objekte im Vergleich

Mit dem Aufkommen von Deep Learning hat Super-Resolution einen wahren Boost erfahren, da KI-Algorithmen sehr gut darin sind, Objekte zu erkennen und zu ergänzen. Wenn eine Künstliche Intelligenz beispielsweise Millionen von Gesichtern aus verschiedenen Blickwinkeln und in diversen Beleuchtungssituationen gesehen hat, kann sie anschließend jedem grob nur aufgelösten Gesicht in einem Bild gelernte passende Details hinzufügen. Das gilt jedoch genauso für Pflanzen, Autos oder Tiere.

Beim Hochskalieren machen sich neuronale Netze die typischen Muster natürlicher Objekte zunutze - d.h. Strukturen in den Bildern mit niedriger Auflösung werden beim Hochskalieren sinnvoll rekonstruiert. Mehr zum Thema in unserem Artikel Mehr Bildschärfe durch künstliche Intelligenz - Super-Resolution.

Googles neuer Super-Resolution Algorithmus SR3 skaliert Gesichter nahezu perfekt hoch

Adobe hat einen solchen Super-Resolution Algorithmus schon in Photoshop integriert und das kostenpflichtige Tool Video Enhance AI sowie TecoGAN machen ähnliches für Videos.

Der neue SR3 Algorithmus ( hier die entsprechende Forschungsarbeit) wendet dabei einen besonderen Trick an und skaliert die Bilder in mehreren Durchgängen hoch, was zu besseren Ergebnissen führt als die Interpolation vom Basisbild zur hochaufgelösten Version. Oder genauer gesagt in den Worten der Forscher: "SR3 adaptiert entrauschende Diffusions-probabilistische Modelle an die bedingte Bildgenerierung und führt die Super-Resolution durch einen stochastischen iterativen Entrauschungsprozess durch."

Ein großer Caveat besteht allerdings bei solchen Deep Learning Methoden zur Super Resolution: die Ergebnisse sehen immer echter aus, was aber nicht bedeutet, dass die hochgerechneten Bilder dem Originalbild perfekt entsprechen, sondern nur, dass sie fotorealistisch gut geraten und gerendert sind - der Betrachter kann nicht mehr entscheiden, ob so ein Bild "echt" ist oder generiert wurde.

mehr Infos bei
iterative-refinement.github.io

Auf Socials teilen:

Leserkommentare // Neueste

medienonkel // 16:23 am 18.7.2021

Wieso ein plugin? Topaz VEAI, kostet gerade 240 Euro. Über sensai wird das aber früher oder später in AE Einzug halten, nicht ganz so spezialisiert, aber in AE muss man ja eher...weiterlesen

Hannah96 // 21:07 am 15.7.2021

High! Ich arbeite mit After Effects – da gibts keine guten Build-In Lösungen, oder? Gibts günstige PlugIns die was taugen? Muss ja nicht gleich auf dem Google-Level sein...weiterlesen

CandyNinjas // 10:22 am 15.7.2021

Haleluja !!! Wo wird das enden?

Im Forum mitdiskutieren >>

Ähnliche News //

News

Nie wieder unscharfe Videos? Super Resolution im Browser per kostenloser KI

Laut Microsoft besitzt ein Drittel aller mittels des Edge Browser abgespielten Videos nur eine Auflösung von 480p oder sogar noch weniger - sei es, weil das Video nur in dieser ...

// 10:16 Mo, 6. Mär 2023von Thomas Richter

News

Neue NVIDIA KI skaliert Videos in Echtzeit im Browser von 1080p nach 4K

NVIDIA hat auf der CES 2023 seine neue RTX Video Super Resolution Technologie vorgestellt, mit deren Hilfe Besitzer von GeForce-Grafikkarten der Serien RTX 4000 und 3000 ab ...

// 11:53 Fr, 6. Jan 2023von Thomas Richter

News

Text-zu-Video KI jetzt auch von Google: Imagen Video

Nachdem Meta gerade seine Make-a-Video KI zur Generierung von Videos nach Textbeschreibung vorgestellt hatte, hat Google jetzt nachgezogen und mit Imagen Video auch eine solche KI ...

// 16:48 Do, 6. Okt 2022von Thomas Richter

News

Disney kombiniert CGI mit KI für filmtaugliche Gesichtsanimationen

Wir hatten ja schon öfter über Nvidias Style GAN Deep Learning Algorithmus zum Generieren und Animieren berichtet und auch von Disneys Experimenten mit DeepFake-Algorithmen zur ...

// 11:00 So, 5. Dez 2021von Thomas Richter

News

Open Source Tool macht verpixelte Texte wieder lesbar

Soll in einem Photo oder Video ein gut sichtbarer abgebildeter Text (etwa auf einem Computer-Bildschirm, Nummernschild oder einem Dokument) unlesbar gemacht werden, weil er zum ...

// 20:50 So, 20. Feb 2022von Thomas Richter

zur Newsübersicht >

Generative Video-KI-Funktionen Adobe Firefly für Premiere Pro - Generative Extend, Object removal/addition

Zuletzt im Oktober hatte Adobe Firefly-Funktionen für Premiere Pro geteasert, darunter eine Generative Fill-Funktion - nun wird es konkret. Denn noch in diesem Jahr sollen über ...

// 15:08 Mo, 15. Apr 2024von blip

News

Übernahme ist durch RED ist nun eine Nikon-Tochter - und Jarred Land abgesetzt

Rechtzeitig zur NAB gab Nikon bekannt, die Übernahme von RED sei nun zu 100% vollzogen. Ab sofort werden Jarred Land zusammen mit James Jannard nur noch enge Berater der Nikon-...

// 14:13 So, 14. Apr 2024von blip

News

Günstiger und besser? Blackmagic stellt neues DaVinci Resolve Micro Color Panel für 495 Dollar vor

Blackmagic Design hat auf der NAB mit dem DaVinci Resolve Micro Color Panel ein weiteres, besonders erschwingliches Pult für die Farbkorrektur mit DaVinci Resolve angekündigt, ...

// 09:06 Sa, 13. Apr 2024von Rudi Schmidts

News

Blackmagic PYXIS 6K: Die Vollformat "Box"-Kamera mit Viewfinder, 2x SDI, Sideplates (!) uvm.

Am vielseitigsten riggbare Cam Blackmagic PYXIS 6K: Die Vollformat „Box“-Kamera mit Viewfinder, 2x SDI, Sideplates ...

Von vielen seit langem ersehnt und jetzt da: Blackmagic stellt mit der Pyxis 6K gleich drei leistungsstärkere Vollformat-Versionen seiner Cinema Camera 6K vor, die in ein ...

// 03:40 Sa, 13. Apr 2024von Rob

TOP THEMEN //

zum Forum >>

MEHR NEWS

zum Newsindex >

PASSENDE DISKUSSIONEN

zum Forum >>

Passende Artikel //

Aktuelles

Text-zu-Sprache per KI: Ersetzen synthetische Stimmen bald professionelle Sprecher?

Nach Bild- und Text-generierenden KIs gibt es noch weiteres Feld, in welchem gerade per künstlicher Intelligenz enorme Fortschritte gemacht werden und zwar bei der Synthese von ...

// 19:47 Mo, 6. Feb 2023von Thomas Richter

Aktuelles

Die Stable Diffusion Revolution: Kostenlose Bildgenerierung per KI jetzt auch auf dem Heim-PC

Seit ein paar Tagen ist es endlich soweit: die Text-zu-Bild KI Stable Diffusion wurde veröffentlicht und kann kostenlos auf dem eigenen Computer genutzt werden - damit ist jetzt ...

// 15:03 Di, 30. Aug 2022von Thomas Richter

zur Artikelübersicht >

Was hältst du von den neuen Bild/Video-KIs?
Toll, so viele neue Kreativtools!
Sie werden das Filmemachen vereinfachen
Sie werden das Filmen z.T. ersetzen
Sie werden mich arbeitslos machen
Die sind völlig überbewertet

Ergebnis ansehen

Aktuelle News //

News

E-Mount für Vollformat Alpha Sony bringt weiteres Weitwinkel-Zoomobjektiv - FE 16-25mm F2.8 G

Sony ergänzt seine E-Mount-Objektivreihe für Vollformat Alpha mit dem portablen FE 16-25mm F2.8 G Weitwinkel-Zoomobjektiv. Es bietet eine konstante Lichtstärke von F2.8 über den ....

// 15:48 Do, 18. Apr 2024von blip

News

Bis zu 3500 FPS Freefly Systems Ember S2.5K - High Speed Kamera für 25.000 Dollar

Freefly sind schon seit längerem im Bereich Hochgeschwindigkeits-Kameras aktiv. Im Jahr 2020 gab es die erste Wave- Kamera der Firma und 2022 kam die Ember S5K, die mit einem ...

// 12:16 Do, 18. Apr 2024von Rudi Schmidts

zur Newsübersicht >