Doi roboți de jucărie se luptă, unul dându-i capul celuilalt.

Mărește (credit: Getty Images / Benj Edwards)

Marți, Anthropic’s Închide 3 Lucrare modelul de limbă mare (LLM) a depășit GPT-4 OpenAI (care alimentează ChatGPT) pentru prima dată pe Chatbot Arenaun popular crowdsourced clasament folosit de cercetătorii AI pentru a evalua capacitățile relative ale modelelor de limbaj AI. „Regele este mort,” a postat pe Twitter Dezvoltatorul de software Nick Dobos într-o postare de comparare GPT-4 Turbo și Claude 3 Opus, care a făcut o tură pe rețelele sociale. „RIP GPT-4”.

Deoarece GPT-4 a fost inclus în Chatbot Arena în jurul datei de 10 mai 2023 (clasamentul a fost lansat 3 mai din acel an), variațiile GPT-4 au fost constant în fruntea topului până acum, așa că înfrângerea sa în Arena este un moment notabil în istoria relativ scurtă a modelelor de limbaj AI. Unul dintre modelele mai mici de la Anthropic, Haiku, a făcut, de asemenea, să întoarcă capetele cu performanța sa în clasament.

„Pentru prima dată, cele mai bune modele disponibile – Opus pentru sarcini avansate, Haiku pentru cost și eficiență – provin de la un furnizor care nu este OpenAI”, a declarat cercetătorul independent AI Simon Willison pentru Ars Technica. „Este liniștitor – cu toții beneficiem de o diversitate de furnizori de top în acest spațiu. Dar GPT-4 are peste un an în acest moment și a fost nevoie de acel an pentru ca oricine altcineva să ajungă din urmă.”

Citiți 8 paragrafe rămase | Comentarii

×