Olyan valósághű lett a Microsoft mesterséges intelligenciás deepfake-re hajazó fejlesztése, hogy nem merik nyilvánosságra hozni
2024. április 22. 9:32
Csak videót mutattak róla működés közben. Félelmetes.
A Microsoft egy új mesterséges intelligenciát fejleszt, amely egyetlen fotó és hangminta alapján képes hiperrealisztikus videót készíteni az illetőről, írja a 24.hu a Tom’sGuide-ra hivatkozva. A VASA-1 névre hallgató rendszer valósághűen szimulálja a szájmozgást, az arcvonások beszéd közbeni változásait és a fejmozgást. Bár jelenleg csak kutatási demó áll rendelkezésre a Microsoft Research csapatától, a videók lenyűgözőek. A tesztek itt tekinthetők meg.
A rendszernek köszönhetően még olyan rossz minőségű fotókból is élethű videókat lehet készíteni, ahol az alany nem is néz előre. A fejlesztők fő célja az élethű NPC-k létrehozása videójátékokban, amelyek rendelkeznek realisztikus szájmozgással és mimikával.
Bár a programot nem tervezik nyilvánosságra hozni, és nem lesz elérhető fejlesztők számára sem, a projekt figyelemre méltó, különösen a Microsoftnak az OpenAI-ban és a Sorában való részesedése miatt. A rendszer korlátja, hogy csak 512×512 pixeles, 45 képkocka/másodperc sebességgel rendelkező mozgóképeket képes készíteni, és Nvidia RTX 4090 GPU-ra van szüksége.
Nyitókép: Microsoft