Noul model AI transformă fotografiile în lumi 3D explorabile, cu avertismente

Marți, Tencent Eliberat Hunyuanworld-Voyager, un nou model AI cu greutate deschisă care generează secvențe video consistente 3D dintr-o singură imagine, permițând utilizatorilor să piloteze o cale de cameră pentru a „explora” scene virtuale. Modelul generează simultan informații video și profunzime RGB pentru a permite reconstrucția directă 3D fără a fi nevoie de tehnici tradiționale de modelare. Cu toate acestea, nu va înlocui jocurile video în curând.

Rezultatele nu sunt adevărate modele 3D, dar obțin un efect similar: instrumentul AI generează cadre video 2D care mențin consistența spațială ca și cum o cameră se mișca printr -un spațiu 3D real. Fiecare generație produce doar 49 de cadre – de aproximativ două secunde de video – deși mai multe clipuri pot fi înlănțuite împreună pentru secvențe care durează „câteva minute”, potrivit Tencent. Obiectele rămân în aceleași poziții relative atunci când camera se mișcă în jurul lor, iar perspectiva se schimbă corect așa cum te -ai aștepta într -un mediu 3D real. În timp ce ieșirea este video cu hărți de adâncime, mai degrabă decât modele 3D adevărate, aceste informații pot fi transformate în nori 3D de puncte în scopuri de reconstrucție.

Sistemul funcționează acceptând o singură imagine de intrare și o traiectorie a camerei definite de utilizator. Utilizatorii pot specifica mișcările camerei precum mișcări înainte, înapoi, stânga, dreapta sau rotire prin interfața furnizată. Sistemul combină datele de imagine și profunzime cu un „cache mondial” eficient în memorie pentru a produce secvențe video care reflectă mișcarea camerei definite de utilizator.

Citiți articolul complet

Comentarii

Noul model AI transformă fotografiile în lumi 3D explorabile, cu avertismente

Leave a Comment Cancel