Den snabba AI utvecklingen: Prestanda vid olika utvecklingstakt

2023-07-15, 19:33 #37

Bannlyst

Citat:

Ursprungligen postat av Ola Schubert

När jag börjar titta närmare på den otroligt snabba utvecklingstakten hos LLM modeller så blir häpen/rädd. För när jag räknar på det så visar sig häpnadsväckande siffror. En vettig början för att förstå detta är att jämföra vad den kommande modellen GPT-4.5 som kommer ca ett halvår efter att GPT-4 lanserades i mars. Så låt oss räkna med 6 månaders övergripande utveckling under olika utvecklingstakt:

Scenario 1.

Vi börjar med en "lugn" utveckling. GPT-4.5 har då "bara" dubblerat GPT-4:s ursprungliga kapacitet på ett halvår. Det skulle innebära att GPT-5 får en fyrdubblad kapacitet jämfört med GPT-4.5 om modellen lanseras ett år efter. Men detta "lugna" scenario innebär, likt förbannat att om 10 år så har vi en modell som är mer än 1 miljon gånger kraftfullare än GPT-4 ursprungligen hade.

På 1 år 4 gånger
På 2 år 16 gånger
På 3 år 256 gånger
På 4 år 65 536 gånger

Scenario 2.

Låt oss sedan gå vidare till den utvecklingshastighet som OpenAI:s modeller hade innan GPT-4, (vars exakta prestanda vi inte känner till). Denna utvecklingstakt innebär en fördubbling av övergripande kapacitet var tredje månad och skulle ge GPT-4.5 en 8 gånger högre övergripande kapacitet jämfört med GPT-4 i mars.

På 1 år 16 gånger
på 2 år 64 gånger
På 3 år 4096 gånger
På 4 år 16 777 216 gånger

Scenario 3.

Ett riktigt snabbt scenario. Här utgår vi ifrån att "AI-racet" drivit fram en fördubbling av GPT-4:s övergripande kapacitet varje månad. Då får GPT-4.5 64 gånger högre kapacitet än vad GPT-4 hade i mars. Resultatet är skrämmande:

På 1 år 4096 gånger
På 2 år 16 777 216 gånger

Vid scenario 1 så anser jag att vi kan vänta med en träningspaus några år, dock senast några månader efter år tre.

Vid scenario 2 så anser jag att man bör vänta med en traningspaus till några månader in på år två, typ när vi når över 1000 gånger högre prestanda än vad GPT-4 hade i mars.

Vid scenario 3 bör vi träningspausa alla modeller kraftfullare än GPT-4,5.

Hur ser ni på den ytterst snabba AI utvecklingen?

Det finns saker som både accelererar och bromsar den.

Nja, du drar lite tokiga slutsatser här.

Det här behöver nyanseras.

Kommer någon ChatGPT 4.5 ens?
Har ett minne av att man skippade den med minnet sviktar.

ChatGPT5 talas det om iaf. Finns en del features som är schedulerade på den.
Men där jämras det över otillräcklig GPU-kapacitet. Man har inte råd att träna upp en GPT5 för närvarandet. Det är inte billigt om man säger så.

Nvidias aktieägare räknar med att det skall köpas GPUer as if there were no tomorow. Men Kunderna har inte råd. Nvidias aktieägare kanske kan öppna plånböcker och skänka pengar till Open AI. Jag menas så Nvidia får affärer.

Istället tänker man hålla på och krama GPT4 så länge.

Det lär dröja flera år innan vi ser en GPT5.
Och då kan den i stället ha lite bättre kvalitet i svaren, men lär vara ganska likartad.
Men behöver komma ihåg att GPT blir inte bättre än sitt indata. Det den gör är att mappa ett medelvärdesbildat indata. Mer fantastiskt än så är det inte.

Och GPT4 är tränat på ungefär hela internet.
Lite extra kan man väl krafsa ihop till träningsdata för GPT5. Så lite bättre blir den väl. Lite alltså.
Jag skulle säga att vi har väldigt mycket diminishing returns på mer noder i nätet. Och med ökade träningstider.

Någon gång om några år kanske någon lyckas värka fram en modifierad arkitektur som ger lite mer.

Man skulle eventuellt kunna dra lite paralleller till AlphaZero och träning för schack. Dom kunde kasta på mer noder och mer träningstid men spelstyrkan konvergerade mot Stockfish. Dom blev väl marginellt bättre men det stannade där. Dom hade i sig ingen brist på indata, men det hjälper inte. vikterna i nätet blir inte direkt bättre.

Men GPT har ovanpå detta problemet med "brist" på indata. Det ökar ju på med tiden. Men vi talar om år här.

Det man kan göra är antagligen förbättringar i nischer. T ex så den kan lära sig räkna.
Och kanske bli lite bättre i formuleringarna. Och så kanske man sorterar bort skräpig indata. Att använda inlägger på Flashback skulle ge en ganska deprimerande village idiot till ChatGpt.

Citera

2023-07-15, 19:35 #38

Bannlyst

Citat:

Ursprungligen postat av Ola Schubert

Nvidia räknar med en miljon större övergripande kapacitet hos LLM jämfört med vad GPT-4 hade i mars, om tio år.

Nja, Huang refererar väl till de år som varit, fram till nu.

Citera

2023-07-15, 20:32 #39

Medlem

Reg: Sep 2003

Inlägg: 25 578

Citat:

Ursprungligen postat av 8978wxu642

Varför inte?

Om, GPT-4.5 får en 64 gånger högre prestanda jämfört med GPT-4 i mars så fördubblas kapaciteten för varje månad. Och då, kanske, skulle GPT-5 kunna"ta över".

Men jag hoppas på att GPT-4.5 "bara" får fördubblad prestanda jämfört med GPT-4 i mars.

Då är det ingen fara med GPT-5 och, förmodligen inte heller med GPT-6.

Citera

2023-07-15, 20:42 #40

Medlem

Reg: Sep 2003

Inlägg: 25 578

Citat:

Ursprungligen postat av Kub.Ernetes

Nja, du drar lite tokiga slutsatser här.

Det här behöver nyanseras.

Kommer någon ChatGPT 4.5 ens?
Har ett minne av att man skippade den med minnet sviktar.

ChatGPT5 talas det om iaf. Finns en del features som är schedulerade på den.
Men där jämras det över otillräcklig GPU-kapacitet. Man har inte råd att träna upp en GPT5 för närvarandet. Det är inte billigt om man säger så.

Nvidias aktieägare räknar med att det skall köpas GPUer as if there were no tomorow. Men Kunderna har inte råd. Nvidias aktieägare kanske kan öppna plånböcker och skänka pengar till Open AI. Jag menas så Nvidia får affärer.

Istället tänker man hålla på och krama GPT4 så länge.

Det lär dröja flera år innan vi ser en GPT5.
Och då kan den i stället ha lite bättre kvalitet i svaren, men lär vara ganska likartad.
Men behöver komma ihåg att GPT blir inte bättre än sitt indata. Det den gör är att mappa ett medelvärdesbildat indata. Mer fantastiskt än så är det inte.

Och GPT4 är tränat på ungefär hela internet.
Lite extra kan man väl krafsa ihop till träningsdata för GPT5. Så lite bättre blir den väl. Lite alltså.
Jag skulle säga att vi har väldigt mycket diminishing returns på mer noder i nätet. Och med ökade träningstider.

Någon gång om några år kanske någon lyckas värka fram en modifierad arkitektur som ger lite mer.

Man skulle eventuellt kunna dra lite paralleller till AlphaZero och träning för schack. Dom kunde kasta på mer noder och mer träningstid men spelstyrkan konvergerade mot Stockfish. Dom blev väl marginellt bättre men det stannade där. Dom hade i sig ingen brist på indata, men det hjälper inte. vikterna i nätet blir inte direkt bättre.

Men GPT har ovanpå detta problemet med "brist" på indata. Det ökar ju på med tiden. Men vi talar om år här.

Det man kan göra är antagligen förbättringar i nischer. T ex så den kan lära sig räkna.
Och kanske bli lite bättre i formuleringarna. Och så kanske man sorterar bort skräpig indata. Att använda inlägger på Flashback skulle ge en ganska deprimerande village idiot till ChatGpt.

Jag hoppas faktisk att du har rätt. Annars har jag läst/sett om att GPT-4.5 kommer i oktober och att GPT-5 börjar tränas i december, vilket, iof, gör det osannolikt att modellen lanseras i juni/juli 2024.

Men dra gärna ut på allting, för jag vill ha fel!

Citera

2023-07-15, 20:50 #41

Medlem

Reg: Sep 2003

Inlägg: 25 578

Citat:

Ursprungligen postat av Kub.Ernetes

Nja, Huang refererar väl till de år som varit, fram till nu.

Nja, jag tror inte det. Men med en fördubbling av modellernas kapacitet var sjätte månad under 10 års tid så blir det en lite mera än en miljon gånger högre kapacitet än vad GPT-4 hade i mars.

Och jag hoppas, verkligen, att det inte kommer att gå fortare än så!

Citera

2023-07-15, 20:53 #42

Medlem

Reg: Jan 2023

Inlägg: 1 065

Det skulle vara en enkel ai bot i form av en chatt, men jag är inte säker på hur det känns i verkligheten.

Personligen tycker jag att den nuvarande AI är en bubbla.

Citera

2023-07-16, 08:09 #43

Bannlyst

Citat:

Ursprungligen postat av Ola Schubert

Jag hoppas faktisk att du har rätt. Annars har jag läst/sett om att GPT-4.5 kommer i oktober och att GPT-5 börjar tränas i december, vilket, iof, gör det osannolikt att modellen lanseras i juni/juli 2024.

Men dra gärna ut på allting, för jag vill ha fel!

Ja, jag ser nu att GPT4.5 har en planerad leverans. Var nog obsolet information jag hade.

Citera

2023-07-16, 08:17 #44

Bannlyst

Citat:

Ursprungligen postat av Ola Schubert

Nja, jag tror inte det. Men med en fördubbling av modellernas kapacitet var sjätte månad under 10 års tid så blir det en lite mera än en miljon gånger högre kapacitet än vad GPT-4 hade i mars.

Och jag hoppas, verkligen, att det inte kommer att gå fortare än så!

Han refererade till historiken och säger att han hoppas att man kan återupprepa det.
Den typen av förhoppningar är inte så mycket att luta sig mot.

Sedan får man ju också fundera på vad man mäter här. Det är inte alldeles uppenbart tycker jag.
För länge sedan var det single thread performance. Men det är det inte längre.
Det Huang refererar till börjar mer handla om att man kan kasta in mer GPU'er.
Dvs mer plånboksrelaterat snarare än någon slags prestanda i underliggande teknologier.

Citera

2023-07-16, 09:09 #45

Medlem

Reg: Sep 2003

Inlägg: 25 578

Citat:

Ursprungligen postat av Kub.Ernetes

Ja, jag ser nu att GPT4.5 har en planerad leverans. Var nog obsolet information jag hade.

Fast det kan ju vara så att GPT-5 både hinner grundtränas och finjusteras på bara ett halvår med massiv hjälp av annan AI och smartare träningsmetoder

Citat:

Ursprungligen postat av Kub.Ernetes

Han refererade till historiken och säger att han hoppas att man kan återupprepa det.
Den typen av förhoppningar är inte så mycket att luta sig mot.

Sedan får man ju också fundera på vad man mäter här. Det är inte alldeles uppenbart tycker jag.
För länge sedan var det single thread performance. Men det är det inte längre.
Det Huang refererar till börjar mer handla om att man kan kasta in mer GPU'er.
Dvs mer plånboksrelaterat snarare än någon slags prestanda i underliggande teknologier.

Vi får väl se. I en video om den hårdvara som krävs för GPT-4, (vilket man räknat ut "bakvägen"), så verkar det som att det var mindre än vad GPT-3.5 krävde. Så GPT-4 kanske inte alls startade med 10 biljoner parametrar.

Dessutom lär nya CPU, specialanpassade för träning av LLM, själva, innehålla AI, vilket säker gör dem dyrare men också effektivare. Tillkommer sedan nya tekniska- och program-lösningar som Hyperon, Atomspace och Metta, vika ger bättre rationellt tänkande med återkopplings slingar, ökad flexibilitet och möjliggör tänkande på övermänsklig nivå.Hårdvarukraven för detta känner jag inte till.

Citera

2023-07-16, 16:45 #46

Medlem

Reg: Sep 2003

Inlägg: 25 578

Ok, jag är en idiot, som inte kan räkna, och vare sig med-debattörer eller AI rättar mig

Scenario 2(a) skall vara:

År 1. 16 gånger högre kapacitet

År 2. 256 gånger högre kapacitet

År 3. 65 536 gånger högre kapacitet

År 4. 4 294 967 295 gånger högre kapacitet

År 5. 1;84467441x10^19 gånger högre kapacitet.(dvs. ca 18;5 triljoner, svenska systemet för höga tal.)

Jämförelsen rör den övergripande kapaciteten GPT-4 hade i mars 2023. Utvecklingshastigheten är den som OpenAI hade innan GPT-4 för sina modeller, dvs en fördubbling av kapaciteten var tredje månad. Nuvarande ökningstakt är okänd. Men ökningstakten ovan lär inte kunna upprätthållas mer än några år till.

Så min bedömning är att en ganska lång träningspaus måste sättas in någon gång ca efter år 2,5 år om man fortsatt med denna utvecklingstakt. Då har den övergripande kapacitet hunnit öka 1000 gånger jämfört med GPT-4 i mars 2023.

Så vida nu inte GPT-x modellen, dess för innan, går ut med att den är medveten, har människoliknande känslor och sunda intentioner och älskar oss människor, och vi blir övertygade om att det är sant. Då, kanske, törs vi köra på något år till.

Citera

2023-07-16, 17:54 #47

Medlem

Reg: Sep 2003

Inlägg: 25 578

Nej jag var ingen idiot. Siffrorna ovan skall vara:

Lite förtydligande:

Scenario 2(a) skall vara:

År 1. 16 gånger högre kapacitet

År 2. 256 gånger högre kapacitet

År 3. 4094 gånger högre kapacitet

År 4. 65 520 gånger högre kapacitet

År 5. 1 048 320 gånger högre kapacitet

År 6. 16 773 120 gånger högre kapacitet

År 7. 268 369 920 gånger högre kapacitet

Svårt det där med och räkna, speciellt som jag trodde mig ha funnit en "genväg"

Hur som helst så kan Altman bara drömma om att OpenAI skall kunna hålla på till GPT-10 om man kör med samma ökningstakt som man hade för modellerna innan GPT-4.

Citera

Den snabba AI utvecklingen: Prestanda vid olika utvecklingstakt

Skapa ett konto eller logga in för att kommentera

Skapa ett konto

Logga in