Google presenterade precis Genimi 1.5 Pro. En ny "foundation model" med bättre förståelse och upp till en miljon tokens (ca 700.000 ord). Nu börjar det hetta till!
Ett väldigt stort problem med dagens AI modeller är att de är väldigt dåliga på att hitta korrekt information i en längre input. Tänk dig att du matar in en hel bok och frågar AIn ifall den kan berätta för dig vilken sida en specifik text är på. Är texten i början eller i slutat av boken så brukar modellerna oftast hitta informationen, medans om texten är i mitten av boken så misslyckas de. Tänk dig en omvänd bell kurva...
Detta har resulterat i att man försökt komma på en massa fula genvägar för att försöka hitta informationen vilket oftast är väldigt kostsamt både i tid och resurser, och i många fall inte fungerat ö.h.t.
Från blogginlägget:
Detta öppnar upp en hel ny värld av AI applikationer man kan bygga samt möjliggör påbörjade applikationer att lanseras då de minskar felfrekvensen. Tyvärr är det dock endast "limited preview" för tillfället, men det ska bli väldigt intressant att följa. Förhoppningsvis ser vi också att Mr Zuck följer samma spår (MoE architecture) när de lanserar llama 3.
Detta kommer troligtvis också göra att OpenAI inom kort kommer lansera en ny version...
Videos:
https://youtu.be/LHKL_210CcU
https://youtu.be/wa0MT8OwHuk
https://youtu.be/SSnsmqIj1MI
Rapport:
https://storage.googleapis.com/deepm...1_5_report.pdf
Källa:
https://blog.google/technology/ai/go...024/#gemini-15
https://developers.googleblog.com/20...ai-studio.html
Ett väldigt stort problem med dagens AI modeller är att de är väldigt dåliga på att hitta korrekt information i en längre input. Tänk dig att du matar in en hel bok och frågar AIn ifall den kan berätta för dig vilken sida en specifik text är på. Är texten i början eller i slutat av boken så brukar modellerna oftast hitta informationen, medans om texten är i mitten av boken så misslyckas de. Tänk dig en omvänd bell kurva...
Detta har resulterat i att man försökt komma på en massa fula genvägar för att försöka hitta informationen vilket oftast är väldigt kostsamt både i tid och resurser, och i många fall inte fungerat ö.h.t.
Från blogginlägget:
Citat:
This means 1.5 Pro can process vast amounts of information in one go — including 1 hour of video, 11 hours of audio, codebases with over 30,000 lines of code or over 700,000 words. In our research, we’ve also successfully tested up to 10 million tokens.
Citat:
In the Needle In A Haystack (NIAH) evaluation, where a small piece of text containing a particular fact or statement is purposely placed within a long block of text, 1.5 Pro found the embedded text 99% of the time, in blocks of data as long as 1 million tokens.
Detta öppnar upp en hel ny värld av AI applikationer man kan bygga samt möjliggör påbörjade applikationer att lanseras då de minskar felfrekvensen. Tyvärr är det dock endast "limited preview" för tillfället, men det ska bli väldigt intressant att följa. Förhoppningsvis ser vi också att Mr Zuck följer samma spår (MoE architecture) när de lanserar llama 3.
Detta kommer troligtvis också göra att OpenAI inom kort kommer lansera en ny version...
Videos:
https://youtu.be/LHKL_210CcU
https://youtu.be/wa0MT8OwHuk
https://youtu.be/SSnsmqIj1MI
Rapport:
https://storage.googleapis.com/deepm...1_5_report.pdf
Källa:
https://blog.google/technology/ai/go...024/#gemini-15
https://developers.googleblog.com/20...ai-studio.html