Es braucht nur ein Bild und eine Audiospur von 60 Sek um dieses DeepFake zu erstellen.
Heute hat Microsoft Research ein neues KI-Framework namens VASA-1 vorgestellt. Mit diesem Framework lassen sich in wenigen Sekunden realitätsnahe Portraitvideos von Menschen oder Avataren erstellen. Dafür benötigt das Modell lediglich ein Portraitfoto einer natürlichen oder KI-generierten Person und eine 60 Sekunden lange Audiospur. Die Qualität der Videos ist verblüffend und erschreckend zugleich.
Im Vergleich zu bestehenden Methoden, werden bei VASA-1 nicht nur die Lippenbewegungen, sondern auch die Mimik und weitere natürliche Bewegungen mit dem Kopf durch die KI generiert. Dadurch wird es immer schwieriger die durch KI erstellten Videos von echten Videos zu unterscheiden.
Das Modell kann sogar Input verarbeiten, der bislang nicht im Training vorhanden war. Zum Beispiel können neben Englisch auch Audiospuren in anderen Sprachen verwendet werden. Sogar Gesang ist als Audioinput möglich.
Mit VASA-1 können Videos im Format 512x512 und mit 45 fps in nur 170 ms auf einem Desktop PC mit einer einzigen NVIDIA RTX 4090 GPU generiert werden. Die Echtzeit Demo zeigt die Fähigkeiten der Frameworks eindrucksvoll.
Microsoft Research erklärt bei der Veröffentlichung Ihrer Forschungsergebnisse auch, dass diese Entwicklungen durchaus Risiken mit sich bringen und Regulierungen notwendig werden. Daher hat sich Microsoft Research dazu entschieden, zum aktuellen Zeitpunkt weder ein Online Produkt noch eine Entwickler-API zur Verfügung zu stellen, bevor nicht klar ist, dass diese Technologie verantwortungsvoll genutzt werden kann und relevante Regularien vorhanden sind.
Weitere Infos zu VASA-1: https://www.microsoft.com/en-us/research/project/vasa-1/
Zum Research Paper: https://arxiv.org/pdf/2404.10667.pdf
Data KI DeepFake
veröffentlicht am 18. April 2024 von Sarah Stemmler
Über uns
Hinter synsugar steht ein kompetentes Duo mit langjähriger Erfahrung in der Beratung, als Data Scientists und Softwareentwickler. Gemeinsam mit unseren Kunden bringen wir Künstliche Intelligenz vom Papier in die Umsetzung. Sprechen Sie mit uns und lernen Sie unsere Arbeitsweise kennen.