Tudomány-Tech

Olyan valósághű lett a Microsoft mesterséges intelligenciás deepfake-re hajazó fejlesztése, hogy nem merik nyilvánosságra hozni

rtl.hurtl.hu

2024. április 22. 9:32

Csak videót mutattak róla működés közben. Félelmetes.

A Microsoft egy új mesterséges intelligenciát fejleszt, amely egyetlen fotó és hangminta alapján képes hiperrealisztikus videót készíteni az illetőről, írja a 24.hu a Tom’sGuide-ra hivatkozva. A VASA-1 névre hallgató rendszer valósághűen szimulálja a szájmozgást, az arcvonások beszéd közbeni változásait és a fejmozgást. Bár jelenleg csak kutatási demó áll rendelkezésre a Microsoft Research csapatától, a videók lenyűgözőek. A tesztek itt tekinthetők meg.

A rendszernek köszönhetően még olyan rossz minőségű fotókból is élethű videókat lehet készíteni, ahol az alany nem is néz előre. A fejlesztők fő célja az élethű NPC-k létrehozása videójátékokban, amelyek rendelkeznek realisztikus szájmozgással és mimikával.

Bár a programot nem tervezik nyilvánosságra hozni, és nem lesz elérhető fejlesztők számára sem, a projekt figyelemre méltó, különösen a Microsoftnak az OpenAI-ban és a Sorában való részesedése miatt. A rendszer korlátja, hogy csak 512×512 pixeles, 45 képkocka/másodperc sebességgel rendelkező mozgóképeket képes készíteni, és Nvidia RTX 4090 GPU-ra van szüksége.

Nyitókép: Microsoft

#Tudomány-Tech#microsoft#fejlesztés#ai#mesterséges intelligencia#vasa-1