Cercetătorii uimiți de succesul aparent al lui Tool de a dezvălui motivele ascunse ale AI

Cercetătorii uimiți de succesul aparent al lui Tool de a dezvălui motivele ascunse ale AI

În a hârtie nouă Publicat joi intitulat „Auditarea modelelor de limbă pentru obiective ascunse„Cercetătorii antropici au descris modul în care modelele instruite pentru a ascunde în mod deliberat anumite motive de la evaluatori ar putea încă să dezvăluie din...
Cercetătorii nedumeriți de AI care laudă naziștii după ce se antrenează pe codul nesigur

Cercetătorii nedumeriți de AI care laudă naziștii după ce se antrenează pe codul nesigur

Luni, un grup de cercetători universitari Eliberat O nouă lucrare care sugerează că reglarea fină a unui model de limbaj AI (cum ar fi cel care se confruntă cu chatgpt) pe exemple de cod nesigur poate duce la comportamente neașteptate și potențial dăunătoare....
Chat Icon
×