Citat:
Ursprungligen postat av
526
Den har ju bara tillgång till allt på internet från till okt 2021 (?)
Vad händer när den får tillgång till allt som den själv skapat?
Blir det inavel och kannibalism på informationen och den upprepar sina egna texter om och om igen med förlust för varje generation tills det bara blir generiskt skit kvar?
Ett sätt att välja ut data och skapa ett dataset är att göra det automatiskt där en eller flera modeller får bedömma om texten är lärorik och har hög kvalitet. På så sätt kan man skippa all "slop", så vida man inte valt en dålig modell eller dålig metodik osv, vilket sedan syns på användartester (Chatbot arena) eller olika benchmarks.