Marți, Fundația Wikimedia anunțat Acea răzuire de AI neobosită este să se încord în serverele Wikipedia. Bots automatizați care caută date de formare a modelului AI pentru LLM -uri au aspirat terabyte de date, crescând lățimea de bandă a fundației folosită pentru descărcarea conținutului multimedia cu 50 la sută din ianuarie 2024. Este un scenariu familiar în cadrul comunității software (FOSS) gratuite și open source, așa cum am fost noi, așa cum am fost noi anterior detaliat.

Fundația găzduiește nu numai Wikipedia, ci și platforme precum Wikimedia Commonscare oferă 144 de milioane de fișiere media sub licențe deschise. Timp de zeci de ani, acest conținut a alimentat totul, de la rezultatele căutării la proiecte școlare. Dar de la începutul anului 2024, companiile AI au crescut dramatic razura automată prin descărcări de târâre directă, API și în vrac pentru a -și hrăni modelele AI flămândă. Această creștere exponențială a traficului non-uman a impus costuri tehnice și financiare abrupte-adesea fără atribuirea care ajută la susținerea ecosistemului voluntar al Wikimedia.

Impactul nu este teoretic. Fundația spune că, atunci când fostul președinte al SUA Jimmy Carter a murit în decembrie 2024, pagina sa Wikipedia a atras în mod previzibil milioane de opinii. Dar stresul real a venit atunci când utilizatorii au transmis simultan un videoclip de 1,5 ore al unei dezbateri din 1980 de la Wikimedia Commons. Surge a dublat traficul normal al rețelei Wikimedia, maximizând temporar mai multe dintre conexiunile sale de internet. Inginerii din Wikimedia au redresat rapid traficul pentru a reduce congestia, dar evenimentul a dezvăluit o problemă mai profundă: lățimea de bandă de bază a fost deja consumată în mare parte de bot -uri de răzuire a mediilor la scară.

Citiți articolul complet

Comentarii

Chat Icon
Cluburile Știință&Tehnică
Prezentare generală a confidențialității

Acest site folosește cookie-uri pentru a-ți putea oferi cea mai bună experiență în utilizare. Informațiile cookie sunt stocate în navigatorul tău și au rolul de a te recunoaște când te întorci pe site-ul nostru și de a ajuta echipa noastră să înțeleagă care sunt secțiunile site-ului pe care le găsești mai interesante și mai utile.

×