2025-01-06, 13:48
  #1
Medlem
Det utvecklas ju AI-modeller till höger och vänster, och det känns relevant att kunna ranka dessa och mäta hur bra de presterar på ett oberoende sätt. Så jag undrar, finns det några "tävlingar" där man mäter prestandan hos olika AI-modeller och utser vilken som är bäst? Jag tänker att det kan vara allt från att lösa tentor från ett universitet, spela schack eller annat.

Nu när tesla börjar utveckla optimus så hade det varit sjukt coolt om den hade lyckats prestera i friidrottsgrenar. T ex häcklöpning, eller varför inte stavhopp. Det kräver kanske i.o.f.s inte så mycket AI, utan mer ren programmering. Men ändå!
Citera
2025-01-06, 14:42
  #2
Medlem
diseuses avatar
Det finns åtskilliga tävlingar av olika slag, där folk försöker få just sin AI att prestera så bra som möjligt. Här är ett axplock:

ChatBot Arena
FrontierMath
ARC-AGI
SWE-bench
Citera

Skapa ett konto eller logga in för att kommentera

Du måste vara medlem för att kunna kommentera

Skapa ett konto

Det är enkelt att registrera ett nytt konto

Bli medlem

Logga in

Har du redan ett konto? Logga in här

Logga in