Noch was unklar? Dann in unserem Forum nachfragen
Zum Original-Thread / Zum News-Kommentare-Forum

Infoseite // Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei



Newsmeldung von slashCAM:



Eine Forschungsgruppe bei Microsoft hat ein neues KI-Framework namens VASA-1 vorgestellt, das die Generierung lebensechter, sprechender Gesichter mit auffällig ansprechen...



Hier geht es zur Newsmeldung auf den slashCAM Magazin-Seiten:
Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei


Space


Antwort von Frank Glencairn:

Mit Ton:

https://twitter.com/i/status/1780858602703446229

Space


Antwort von 7River:

Schon beeindruckend. Könnte man so etwas nicht in der Kriminaltechnik einsetzen? Gerade in den USA sind die was Genetik und Aussehen von Menschen angeht viel weiter. Hier fällt das unter Datenschutz.

Space


Antwort von Frank Glencairn:

Was schwebt dir da vor? Sprechende Steckbriefe?

Space


Antwort von Tscheckoff:

Genau. Ein rappender Steckbrief ala ^^:
https://x.com/froggyups/status/1780865913627283767

Space


Antwort von 7River:

Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.

Space


Antwort von MK:

7River hat geschrieben:
Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.

Klar, wenn der Täter ein Passbild am Tatort hinterlässt... in der Überschrift des Artikels fehlt folgendes:


Das Framework benötigt als Input lediglich ein statisches Bild und einen Sprach-Audioclip als Eingabe.

Space


Antwort von Frank Glencairn:

7River hat geschrieben:
Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.
Was hat all das mit sprechenden Passbildern zu tun?
Die Gesichter werden ja nicht erzeugt, sondern nur per Audio Aufzeichnung animiert.

Und was DNA Phenotyping betrifft:
Besides pigmentation traits, no molecular prediction tests are currently available for any other EVCs due to limited knowledge on genes and predictive DNA markers.

Space


Antwort von 7River:

Entschuldigung für meinen unqualifizierten Kommentar. Ich bin da weit abgeschweift.

Space



Space


Noch was unklar? Dann in unserem Forum nachfragen
Zum Original-Thread / Zum News-Kommentare-Forum

Antworten zu ähnlichen Fragen //


KI generiert erschreckend exakte Portraits - nur anhand der Stimme
Slog, Luts & realistische Hauttöne?
Audiodatei ins Internet laden
Ich mach heut noch ein paar Portraits
ReplaceAnything - KI ersetzt und ergänzt Produktbilder und Portraits in hoher Qualität
EMO - KI lässt Portraits sprechen und singen
KI generiert virtuelle Kamerafahrten aus Photos
Aus Text wird nun auch Audio: Stable Audio generiert Musik und Soundeffekte per KI
Nach der Bild- die Videorevolution: Neue KI "Make-a-Video" generiert Videos nach Text
Microsoft ermöglicht automatische Echtzeit-Transkription von komplexen Gesprächen
Microsoft speichert "Superman" auf Glas - über 1.000 Jahre lesbar
Bildqualität steuern beim Livestream über Microsoft Teams?
ARRI und RED Medien unter Windows nicht mehr lesbar - Microsoft UDF Probleme
Microsoft mit generativen KI-Modellen für jedermann im Browser - Bing Image Creator
Microsoft bietet ab sofort kostenlose KI-Bildgenerierung per Edge Browser
Microsoft Olive: Neues kostenloses Tool verdoppelt Performance von Stable Diffusion
Microsoft will Windows 11 komplett in die Cloud verlagern




slashCAM nutzt Cookies zur Optimierung des Angebots, auch Cookies Dritter. Die Speicherung von Cookies kann in den Browsereinstellungen unterbunden werden. Mehr Informationen erhalten Sie in unserer Datenschutzerklärung. Mehr Infos Verstanden!
RSS Suche YouTube Facebook Twitter slashCAM-Slash