AI AI alignment AI research AI safety Anthropic Biz & IT ChatGPT Claude large language models machine learning simulated reasoning SR models TEHNOLOGIE

Cercetătorii preocupați să găsească modele AI care își ascund adevăratele procese de „raționament”

11 aprilie 2025 by Echipa Club S&T | Leave a comment

cercetatorii-preocupati-sa-gaseasca-modele-ai-care-isi-ascund-adevaratele-procese-de-„rationament”

Vă amintiți când profesorii au cerut să vă „arătați munca” în școală? Unele noi modele de AI fantezie promit să facă exact asta, dar noi cercetări sugerează că, uneori, își ascund metodele reale în timp ce fabrică explicații elaborate.

Cercetări noi de la antropic-creattor al asistentului Claude AI, asemănător chatgpt, modele de raționament simulat (SR), precum Deepseek’s R1și propria sa serie Claude. Într -o lucrare de cercetare Postat săptămâna trecutăEchipa de știință a alinierii Anthropic a demonstrat că aceste modele SR nu reușesc frecvent să dezvăluie atunci când au folosit ajutor extern sau au luat comenzi rapide, în ciuda caracteristicilor concepute pentru a -și arăta procesul de „raționament”.

(Este demn de remarcat faptul că modelele SR O1 și O3 Series OpenAI întunecă în mod deliberat exactitatea procesului lor de „gândire”, astfel încât acest studiu nu le se aplică.)

Citiți articolul complet

Comentarii

Tagged

ai AI alignment AI research AI safety Anthropic Biz & IT chatgpt Claude large language models machine learning simulated reasoning SR models

Cercetătorii preocupați să găsească modele AI care își ascund adevăratele procese de „raționament”

Leave a Comment Cancel