Există o contradicție curioasă în centrul celor mai capabile modele AI de astăzi care se pretind de „rațiune”: pot rezolva probleme de rutină matematică cu o precizie impresionantă, dar atunci când se confruntă cu formularea dovezilor matematice mai profunde găsite în provocările la nivel de competiție, acestea nu reușesc adesea.
Aceasta este constatarea Cercetare de preimprimare a ochilor în modele de raționament simulat (SR), listate inițial în martie și actualizate în aprilie, care au căzut în cea mai mare parte sub radarul de știri. Cercetarea servește ca un studiu de caz instructiv asupra limitărilor matematice ale modelelor SR, în ciuda pretențiilor de marketing uneori grandioase de la furnizorii de AI.
Ce setează Modele de raționament simulate În afară de modelele tradiționale de limbaj mare (LLMS) este că au fost instruiți să producă un proces de „gândire” pas cu pas (adesea numit ”lanț de gândire„) Pentru a rezolva problemele. Rețineți că” simulat „în acest caz nu înseamnă că modelele nu sunt deloc motivate, ci mai degrabă că nu ratează neapărat să folosească aceleași tehnici ca și oamenii. Această distincție este importantă, deoarece raționamentul uman în sine este dificil de definit.
Comentarii recente