Stable Diffusion 3 generație cu promptul: fotografie de studio ca un cameleon pe un fundal negru.

Mărește / Stable Diffusion 3 generație cu promptul: fotografie de studio ca un cameleon pe un fundal negru. (credit: Stabilitate AI)

Joi, Stability AI a anunțat Stable Diffusion 3, un model de sinteză a imaginii de generație următoare cu greutăți deschise. Își urmează predecesorii generând imagini detaliate, cu mai multe subiecte, cu o calitate și precizie îmbunătățite în generarea de text. Scurtul anunț nu a fost însoțit de un demo public, dar Stability este deschiderea unei liste de așteptare astăzi pentru cei care ar dori să-l încerce.

Stability spune că familia sa de modele Stable Diffusion 3 (care preia descrieri de text numite „prompts” și le transformă în imagini care se potrivesc) variază în dimensiune de la 800 de milioane la 8 miliarde de parametri. Gama de dimensiuni permite diferitelor versiuni ale modelului să ruleze local pe o varietate de dispozitive, de la smartphone-uri la servere. Dimensiunea parametrului corespunde aproximativ capacității modelului în ceea ce privește cât de multe detalii poate genera. Modelele mai mari necesită, de asemenea, mai multă VRAM pe acceleratoarele GPU pentru a rula.

Din 2022, am văzut Stability lansând o progresie a modelelor de generare de imagini AI: Stable Diffusion 1.41,5, 2.0, 2.1, XL, XL Turboși acum 3. Stabilitatea și-a făcut un nume, oferind o alternativă mai deschisă la modelele proprietare de sinteză a imaginii, cum ar fi DALL-E 3 de la OpenAI, deși nu fără controverse datorită utilizării datelor de antrenament protejate prin drepturi de autor, părtinire și potential de abuz. (Acest lucru a dus la procese care sunt nerezolvate.) Modelele de difuzie stabilă au fost deschise și disponibile la sursă, ceea ce înseamnă că modelele pot fi rulate local și reglate fin pentru a-și schimba ieșirile.

Citiți cele 7 paragrafe rămase | Comentarii

×