Citat:
Ursprungligen postat av
Retropropagation
Du missade det viktigaste:
Allt handlar om data...
Och mer data...
Men det finns ingen mer data inom domänen ChatGPT att träna på. All data är redan använd...
Data finns det även 2017. Sedan har 1 sekunds video ungefär 1 miljon gånger så mycket data som ett ord.
Däremot högkvalitativ textdata för en LLM finns det inte så mycket mer av, därav utveckligen av whisper för transkribering. Men LLMs ser jag som något övergående, det krävs mer input än bara ord för att förstå världen.