DeepMind AI rivalizează cu cei mai deștepți liceeni din lume la geometrie

Mărește / Demis Hassabis, CEO al DeepMind Technologies și dezvoltator AlphaGO, participă la AI Safety Summit de la Bletchley Park pe 2 noiembrie 2023 în Bletchley, Anglia.

Un sistem dezvoltat de DeepMind de la Google a stabilit un nou record pentru performanța AI în probleme de geometrie. AlphaGeometry de la DeepMind a reușit să rezolve 25 din cele 30 de probleme de geometrie extrase din Olimpiada Internațională de Matematică între 2000 și 2022.

Acest lucru plasează software-ul înaintea marii majorități a tinerilor matematicieni și doar în fața medaliilor de aur IMO. DeepMind estimează că medaliatul mediu cu aur ar fi rezolvat 26 din 30 de probleme. Mulți consideră IMO cea mai prestigioasă competiție de matematică din lume pentru elevii de liceu.

„Deoarece modelele de limbaj excelează în identificarea tiparelor generale și a relațiilor în date, ele pot prezice rapid constructe potențial utile, dar adesea nu au capacitatea de a raționa riguros sau de a-și explica deciziile.” DeepMind scrie. Pentru a depăși această dificultate, DeepMind a asociat un model de limbaj cu un motor de deducție simbolică mai tradițional care realizează raționament algebric și geometric.

Cercetarea a fost condusă de Trieu Trinh, un informatician care și-a câștigat recent doctoratul la Universitatea din New York. A fost rezident la DeepMind între 2021 și 2023.

Evan Chen, un fost medaliat cu aur la olimpiade, care a evaluat o parte din producția AlphaGeometry, l-a lăudat ca fiind „impresionant, deoarece este atât verificabil, cât și curat”. În timp ce unele software-uri anterioare au generat dovezi de geometrie complexe care au fost greu de înțeles de către recenzenții umani, rezultatul AlphaGeometry este similar cu ceea ce ar scrie un matematician uman.

AlphaGeometry face parte din proiectul mai amplu al DeepMind de a îmbunătăți capacitățile de raționament ale modelelor mari de limbaj, combinându-le cu algoritmi tradiționali de căutare. DeepMind a publicat mai multe lucrări în acest domeniu în ultimul an.

Cum funcționează AlphaGeometry

Să începem cu un exemplu simplu prezentat în Hartie AlphaGeometrycare a fost publicat de Nature miercuri:

Scopul este de a demonstra că, dacă un triunghi are două laturi egale (AB și AC), atunci unghiurile opuse acelor laturi vor fi de asemenea egale. Putem face acest lucru prin crearea unui nou punct D la mijlocul celei de-a treia laturi a triunghiului (BC). Este ușor de arătat că toate cele trei laturi ale triunghiului ABD au aceeași lungime cu laturile corespunzătoare ale triunghiului ACD. Și două triunghiuri cu laturile egale au întotdeauna unghiuri egale.

Problemele de geometrie de la IMO sunt mult mai complexe decât această problemă de jucărie, dar, în principiu, au aceeași structură. Toate încep cu o figură geometrică și câteva fapte despre figură, cum ar fi „partea AB are aceeași lungime cu latura AC”. Scopul este de a genera o secvență de inferențe valide care se încheie cu o afirmație dată de genul „unghiul ABC este egal cu unghiul BCA”.

De mulți ani, avem software care poate genera liste de concluzii valide care pot fi trase dintr-un set de ipoteze inițiale. Problemele simple de geometrie pot fi rezolvate prin „forță brută”: enumerarea mecanică a tuturor faptelor posibile care pot fi deduse din ipoteza dată, apoi enumerarea tuturor inferențelor posibile din acele fapte și așa mai departe până când ajungeți la concluzia dorită.

Dar acest tip de căutare cu forță brută nu este fezabil pentru o problemă de geometrie la nivel IMO, deoarece spațiul de căutare este prea mare. Nu numai că problemele mai dificile necesită dovezi mai lungi, dar dovezile sofisticate necesită adesea introducerea de noi elemente în figura inițială – ca în cazul punctului D din demonstrația de mai sus. Odată ce permiteți aceste tipuri de „puncte auxiliare”, spațiul posibilelor dovezi explodează și metodele cu forță brută devin impracticabile.

DeepMind AI rivalizează cu cei mai deștepți liceeni din lume la geometrie

Cum funcționează AlphaGeometry

Leave a Comment Cancel