AI AI alignment AI assistants AI behavior ai search Biz & IT Elon Musk grok Jeremy Howard machine learning Simon Willison TEHNOLOGIE Twitter X xAI New Grok AI Model surprind experți verificând opiniile lui Elon Musk înainte de a răspunde 15 iulie 2025 by Echipa Club S&T | Leave a Comment Un model AI lansat săptămâna trecută pare să fi fost livrat cu un comportament ocazional neașteptat: verificarea a ceea ce crede proprietarul său mai întâi. Vineri, cercetătorul AI independent Simon Willison documentat că Xai este nou Grok 4 Căutări de modele pentru opiniile lui Elon Musk pe X (fostul Twitter) când a fost întrebat despre […] Read more » ai AI alignment AI assistants AI behavior ai search Biz & IT elon musk grok Jeremy Howard machine learning Simon Willison Twitter X xAI
AI AI alignment AI research AI safety Anthropic Biz & IT ChatGPT Claude large language models machine learning simulated reasoning SR models TEHNOLOGIE Cercetătorii preocupați să găsească modele AI care își ascund adevăratele procese de „raționament” 11 aprilie 2025 by Echipa Club S&T | Leave a Comment Vă amintiți când profesorii au cerut să vă „arătați munca” în școală? Unele noi modele de AI fantezie promit să facă exact asta, dar noi cercetări sugerează că, uneori, își ascund metodele reale în timp ce fabrică explicații elaborate. Cercetări noi de la antropic-creattor al asistentului Claude AI, asemănător chatgpt, modele de raționament simulat (SR), […] Read more » ai AI alignment AI research AI safety Anthropic Biz & IT chatgpt Claude large language models machine learning simulated reasoning SR models
AI AI alignment AI deception AI research Alignment research Anthropic Biz & IT ChatGPT chatgtp Claude Claude 3.5 Haiku large language models machine learning TEHNOLOGIE Cercetătorii uimiți de succesul aparent al lui Tool de a dezvălui motivele ascunse ale AI 15 martie 2025 by Echipa Club S&T | Leave a Comment În a hârtie nouă Publicat joi intitulat “Auditarea modelelor de limbă pentru obiective ascunse„Cercetătorii antropici au descris modul în care modelele instruite pentru a ascunde în mod deliberat anumite motive de la evaluatori ar putea încă să dezvăluie din neatenție secrete, datorită capacității lor de a adopta diferite roluri contextuale sau„ persoane ”. Cercetătorii au […] Read more » ai AI alignment AI deception AI research Alignment research Anthropic Biz & IT chatgpt chatgtp Claude Claude 3.5 Haiku large language models machine learning
AI AI alignment AI ethics AI research Biz & IT ChatGPT chatgtp GPT-4o large lagnuage models machine learning Tech TEHNOLOGIE Cercetătorii nedumeriți de AI care laudă naziștii după ce se antrenează pe codul nesigur 27 februarie 2025 by Echipa Club S&T | Leave a Comment Luni, un grup de cercetători universitari Eliberat O nouă lucrare care sugerează că reglarea fină a unui model de limbaj AI (cum ar fi cel care se confruntă cu chatgpt) pe exemple de cod nesigur poate duce la comportamente neașteptate și potențial dăunătoare. Cercetătorii o numesc „aliniere emergentă” și încă nu sunt siguri de ce […] Read more » ai AI alignment AI ethics AI research Biz & IT chatgpt chatgtp GPT-4o large lagnuage models machine learning Tech