AI AI benchmarks Anthropic benchmarks Biz & IT Claude 3.5 Epoch AI FrontierMath google GPT-4o large language models machine learning o1-preview openai research papers TEHNOLOGIE vibemarks Noul criteriu de referință matematică secretă ciocăni atât modelele AI, cât și doctorii 13 noiembrie 2024 by Echipa Club S&T | Leave a Comment Vineri, organizația de cercetare Epoch AI a lansat FrontierMathun nou etalon de matematică care a învârtit capetele în lumea AI deoarece conține sute de probleme la nivel de experți pe care modelele de IA de vârf le rezolvă în mai puțin de 2% din timp, potrivit Epoch AI. Benchmark-ul testează modele de limbaj AI (cum […] Read more » ai AI benchmarks Anthropic benchmarks Biz & IT Claude 3.5 Epoch AI FrontierMath google GPT-4o large language models machine learning o1-preview openai research papers vibemarks