Meinung

Midjourney trifft Pika Labs: Generative KI -Videos - Was geht, was kommt?

Seitdem Midjourney oder Stable Diffusion fotorealistische Bilder generieren kann, will man natürlich auch realistische Bewegungen "digital erträumen". Doch das erweist sich für ein KI-Modell noch einmal als ziemlich anspruchsvollere Aufgabe...

// 10:22 Fr, 29. Sep 2023von Rudi Schmidts

Seitdem man mit generativen KI-Modellen wie Midjourney oder Stable Diffusion fotorealistische Bilder generieren kann, warten KI-Apologeten nun natürlich auch sehnsüchtig darauf, ähnlich imposante, bewegte Ergebnisse zu Gesicht zu bekommen. Doch eine realistische Bewegung für einen animierten Clip "digital zu erträumen" erweist sich für ein KI-Modell noch einmal als deutlich anspruchsvollere Aufgabe, als "nur" ein realistisches Standbild zu erstellen.

Bewegung triggert die Aufmerksamkeit

Das grundsätzliche Problem ist dabei, dass uns Menschen unnatürliche Bewegungen noch viel schneller auffallen, als kleine, fehlerhafte Details in Fotos. Da unser Wahrnehmungssystem besonders stark auf Veränderungen in unserem Blickfeld getrimmt ist und diese von unseren evolutionären Primär-Reflexen (optimiert auf Jagd und Flucht) vorrangig verarbeitet werden, fallen hier kleinste Unstimmigkeiten sofort auf. Und lenken unser Augenmerk ganz besonders auf jede Unstimmigkeit in der Wahrnehmung. Umso erstaunlicher ist es, mit welchen Fortschritten die neuesten KI-Modelle nun auch das Problem einer glaubwürdigen Bewegung angehen.

Ein grundsätzliches Problem bleibt vorerst bestehen; Nachdem man weder den kompletten Bildinhalt noch die notwendigen Bewegungsschritte erschöpfend mit einem Prompt beschreiben kann, muss die KI immer viele offene (weil nicht formulierte) Bereiche des Bildes selbst plausibel "erfinden". Beschreibt man beispielsweise nur: "Drehe den Kopf nach links", so bleibt trotzdem viel notwendige Information unformuliert, und damit undefiniert.

Sprache kann nicht alles beschreiben

Wie soll sich zum Beispiel die Mimik während einer Kopfdrehung verändern? Was soll mit den Haaren passieren? Sollte die Person vielleicht nicht auch ein- oder zweimal blinzeln? Zudem lassen sich viele notwendige Details ohnehin nur schwer mit Sprache ausdrücken. Wie könnte man beispielsweise sinnvoll beschreiben, dass sich ein Hemdkragen bei der Bewegung in einer bestimmten Art und Weise falten soll. Und selbst wenn man hier viele Details formulieren könnte, so müssten diese Formulierungen auch schon in den Trainingsdaten vorgelegen haben - was wohl bislang auch nicht der Fall gewesen sein dürfte.

Nächste Seite >>

Aus Erfahrung einfach spinnen lassen? / Bewegung ohne Ziel / Aktuelle Beispiele

Leserkommentare // Neueste

Kommentieren >>

Stoppt Mickey Mouse die KI Kunst Revolution? Künstler protestieren gegen KI Konkurrenz

Die neuen bildgenerierenden KIs stellen eine Revolution dar: sie eröffnen erstmals die Möglichkeit, massenhaft hochqualitative Bilder nach Wunsch zu erzeugen - in beliebiger Menge,...

// 14:21 Di, 3. Jan 2023von Thomas Richter

Aktuelles

KI macht´s möglich: Fake-Filmstills von Fritz Langs Star Wars, Jodorowskys Tron und mehr

Die neuen bildgenerierenden KIs bescheren dem Genre "Was wäre wenn...?" ganz neue Möglichkeiten - ein eigenes Subgenre hat sich in der Community der Bild-KI Midjourney gebildet, ...

// 16:17 Di, 6. Dez 2022von Thomas Richter

Praxis

Mattepainting für Dummys - mit Photoshops Generative Fill Funktion

Wir hatten schon einmal kurz auf Photoshops "Generative Fill"-Möglichkeiten im Zusammenhang mit Videoaufnahmen hingewiesen. In diesem Workshop möchten wir zeigen, wie die ...

// 13:26 Mi, 16. Aug 2023von Rudi Schmidts

Meinung

Die IBC 2023 und die KI-Revolution - War da was oder kommt das noch?

Die IBC hat gerade wieder ihre Pforten geschlossen - doch von generativer Video KI war noch nichts zu sehen.

// 14:36 Mi, 20. Sep 2023von Rudi Schmidts

Test

KI-Bilder mit Adobe Firefly - einfach, für jeden und besser als Midjourney oder Dall-E2?

Wir hatten bereits die Möglichkeit, Adobes neue KI-Tools namens Firefly auszuprobieren. Wie gut schlägt sich Adobes Einstieg in das Universum der KI-Bildgeneratoren?

// 14:23 Mi, 29. Mär 2023von Rudi Schmidts

Wissen

Grundwissen KI Künstliche Intelligenz einfach erklärt - Perzeptron, Backpropagation und Loss

Generative KI-Modelle wie Midjourney, Runway oder Stable Diffusion werden immer leichter für jedermann zu bedienen. Dennoch verstehen die wenigsten Anwender was hinter den ...

// 12:18 Fr, 4. Aug 2023von Rudi Schmidts

Wissen

Wichtige KI-Begriffe einfach erklärt - Was bedeutet Seed und wofür braucht man das?

Nein, Generative KI geht ganz sicher nicht mehr weg und darum ist es sicherlich niemals zu früh, sich mit den Basics vertraut zu machen. Wie beispielsweise mit dem sogenannten ...

// 09:33 Di, 11. Apr 2023von Rudi Schmidts

Meinung

Digitale Avatare im Metaverse - doch das nächste große Ding?

Das Metaverse war eigentlich schon wieder abgeschrieben, doch Metas neue Codec Avatare könnten unsere Kommunikation in Zukunft doch gehörig umkrempeln.

// 13:00 Di, 3. Okt 2023von Rudi Schmidts

Adobe Premiere Pro - Filler Word Detection und Enhance Speech erklärt

Text-Based Editing wird mit neuen Tools ausgebaut - mit einem einfachen Klick lassen sich nun Füllwörter (etwa die berüchtigten "Ähs") im Text automatisch finden und löschen, ...

// 11:59 Di, 26. Sep 2023von slashCAM

zur Artikelübersicht >

Ohne Führerschein Mini 4K - DJIs günstigste 4K/30p Drohne kostet nur 299 US-Dollar

DJIs neueste Kameradrohne, die Mini 4K, bleibt weiterhin unter 250 Gramm und darf deswegen ohne Führerschein geflogen werden. Mit einem Preis von 299 Dollar ist sie zugleich DJIs ....

// 13:45 Di, 30. Apr 2024von Rudi Schmidts

News

Update: Postproduktions-Suite DaVinci Resolve 19: Die neuen Funktionen ausführlich erklärt

Am Blackmagic-Stand auf der NAB 2024 gibt uns Simon von Blackmagic Design einen detaillierten Einblick in die neuen Funktionen von DaVinci Resolve 19. Wir schauen uns ColorSlice, ....

// 15:38 Di, 23. Apr 2024von Rob

News

Profi-Kamera App kostenlos Blackmagic Camera App bald auch für Android Smartphones

Blackmagic hatte ja im Vorfeld der NAB 2024 seine beliebte Camera App für das iPhone in einer erneuerten Version 1.3 vorgestellt. Doch eine "Kleinigkeit" blieb dabei im News-...

// 14:31 Mo, 15. Apr 2024von Rudi Schmidts

News

Übernahme ist durch RED ist nun eine Nikon-Tochter - und Jarred Land abgesetzt

Rechtzeitig zur NAB gab Nikon bekannt, die Übernahme von RED sei nun zu 100% vollzogen. Ab sofort werden Jarred Land zusammen mit James Jannard nur noch enge Berater der Nikon-...

// 14:13 So, 14. Apr 2024von blip

TOP THEMEN //

MEHR ARTIKEL

zur Artikelübersicht >

PASSENDE DISKUSSIONEN

zum Forum >>

Aktuelle News //

News

Global Shutter Kamera Sony A9III Firmware Update 2.0: C2PA Unterstützung, SFTP und mehr

Sony hat für seine Flaggschiff Vollformat Global Shutter Kamera A9III ein größeres Firmwareupdate mit der Version 2.0 mit wichtigen, neuen Funktionen zum freien Download zur ...

// 08:28 Mi, 1. Mai 2024von Rob

News

Ohne Führerschein Mini 4K - DJIs günstigste 4K/30p Drohne kostet nur 299 US-Dollar

DJIs neueste Kameradrohne, die Mini 4K, bleibt weiterhin unter 250 Gramm und darf deswegen ohne Führerschein geflogen werden. Mit einem Preis von 299 Dollar ist sie zugleich DJIs ....

// 13:45 Di, 30. Apr 2024von Rudi Schmidts

zur Newsübersicht >

zum Forum >>

Neueste Artikel //

Test

Beschleunigte GPU Effekte AMD Radeon RX 7900 GRE mit 16GB und 256 Bit - preiswerte Grafikkarte für DaVinci Resolve?

AMD wird bei vielen Anwendern als günstigere Alternative zu Nvidia gehandelt. Doch gilt das auch für den Einsatz unter DaVinci Resolve als Effektbeschleuniger?

// 16:07 Fr, 26. Apr 2024von Rudi Schmidts

Aktuelles

Die ultimative CINE-Kamera? Blackmagic URSA Cine 12K - 16 Blendenstufen für 15.000 Dollar!

Für viele DOPs gilt aktuell die ARRI ALEXA 35 als ultimative CINE-Kamera. Doch nun wird auch Blackmagic mit der URSA Cine 12K nicht nur ein günstiges, sondern ebenso ...

// 20:42 Fr, 12. Apr 2024von Rudi Schmidts

zur Artikelübersicht >

Was hältst du von den neuen Bild/Video-KIs?
Toll, so viele neue Kreativtools!
Sie werden das Filmemachen vereinfachen
Sie werden das Filmen z.T. ersetzen
Sie werden mich arbeitslos machen
Die sind völlig überbewertet

Ergebnis ansehen