Stora språkmodeller - Teknik och Utveckling

2024-09-29, 14:00 #49

Medlem

Reg: Aug 2023

Inlägg: 1 495

En av de första undersökningarna av AI verktygens inverkan och påverkan på utveckling (som är en av de områden som det pratas mest om ska vara fördelen med dessa) har släpptes.

Kontentan är att det inte är någon mätbar skillnad i produktivitet bland utvecklare som använder AI verktygen och de som inte gör det, däremot är det en mätbar skillnad att de som använder AI verktyg committar 41% fler buggar.

Det går tolka på flera sätt, men gissningsvis så är takeaway i stort att 1. AI verktygen är långt i från där de påstås vara. 2. Majoriteten av de som använder AI verktyg för utveckling är inkompetenta och inte själva klarar se de fel som AI modellen genererat.

https://www.cio.com/article/3540579/...ssistants.html

Citera

2024-09-29, 15:03 #50

Avstängd

Reg: Jan 2013

Inlägg: 5 464

Citat:

Ursprungligen postat av BeneathTheSurface

En av de första undersökningarna av AI verktygens inverkan och påverkan på utveckling (som är en av de områden som det pratas mest om ska vara fördelen med dessa) har släpptes.

Kontentan är att det inte är någon mätbar skillnad i produktivitet bland utvecklare som använder AI verktygen och de som inte gör det, däremot är det en mätbar skillnad att de som använder AI verktyg committar 41% fler buggar.

Det går tolka på flera sätt, men gissningsvis så är takeaway i stort att 1. AI verktygen är långt i från där de påstås vara. 2. Majoriteten av de som använder AI verktyg för utveckling är inkompetenta och inte själva klarar se de fel som AI modellen genererat.

https://www.cio.com/article/3540579/...ssistants.html

Konstig undersökning.

Så du menar att om en programmerare som jobbat som progammerare utan tiden då Språkmodeller fanns och därmed klarade av sitt jobb, idag inte klarar av sitt jobb bättre trots att Chat GPT betalversion kan skriva hela hans vecko kompott av kod på 10 minuter och sedan låta en ny prompt gå igenom och hitta fel > repeat 5 ggr > klar?

Citera

2024-09-29, 18:00 #51

Medlem

Reg: Aug 2023

Inlägg: 1 495

Citat:

Ursprungligen postat av Cheddarjoe

Konstig undersökning.

Så du menar att om en programmerare som jobbat som progammerare utan tiden då Språkmodeller fanns och därmed klarade av sitt jobb, idag inte klarar av sitt jobb bättre trots att Chat GPT betalversion kan skriva hela hans vecko kompott av kod på 10 minuter och sedan låta en ny prompt gå igenom och hitta fel > repeat 5 ggr > klar?

Det är väl precis vad undersökningen antyder inte sker, andelen pull requester (alltså förändringar som en utvecklare gjort till ett projekt) inte ökar men andelen buggar i dessa ökat markant.

Det är svårt att mäta med sådan här metrik dock eftersom en PR inte bara är en PR, alltså dvs det är en markant skillnad att fixa stavningen på en metod, att lägga till ett test eller att skapa en ny feature, det framgår inte hur de kvantifierat storleken eller komplexiteten inom en PR.

Men studie utfallet stämmer väl överrens med vad som rapporterats från andra håll och som man själv observerat bland de som pilotat copilot osv.

Det kan mycket väl vara så detta ändrar sig vid nästa mätning, men det gäller nuvarande inkarnation av GitHubs Copilot som baseras på GPT-4o.

Citera

2024-09-29, 18:12 #52

Medlem

Reg: Aug 2023

Inlägg: 1 495

Citat:

Ursprungligen postat av Cyborg2030

Nej, man kan inte dra den slutsatsen utan att veta någonting om antal buggar i relation till antal kodrader.

Det är fullständigt irrelevant, antalet buggar nändes inte ens i rapporten det är en procentuell siffra- det är 41% mer buggar i PRs skapade med hjälp av AI verktyg i den här mätningen.

Det spelar ingen roll om det är 10, 100 eller 1000 (eller skala upp) rader kod, 41% utgör samma faktor.

Citera

2024-09-29, 18:15 #53

Medlem

Reg: Dec 2008

Inlägg: 1 278

Citat:

Ursprungligen postat av Cyborg2030

Nej, man kan inte dra den slutsatsen utan att veta någonting om antal buggar i relation till antal kodrader.

Vad är det för slutsats du menar att man inte kan dra?
De har mätt ungefär 800 utvecklare i två stycken perioder på tre månader, en utan CoPilot och en med CoPilot. Menar du på fullaste allvar att du tror att det kommer vara en markant skillnad i antal kodrader och svårighetsgrad på problemen att det skulle ha statistisk signifikans?

Citera

2024-10-02, 22:08 #54

Moderator

Reg: Dec 2003

Inlägg: 48 231

Inte fan vet jag vad ni diskuterar men inte är det ämnet för tråden.
Detta är ett forum för AI, inte någon diskussion om buggar och pull requests.
OT raderat
/Mod

Citera

2024-11-03, 23:36 #55

Medlem

Reg: Aug 2023

Inlägg: 1 495

Den här boken kom ut för några månader sedan och en bra bok för att få en inblick i AI, både historisk och nuvarande och både förklarar och illustrerar matematiken bakom, men även intervjun ger en ganska bakgrund till boken och kanske varför alla (speciellt de som inte har någon direkt förståelse för AI alls) borde läsa just denna.

https://www.youtube.com/watch?v=URtF_UHYBSo

Citera

2024-11-07, 23:22 #56

Medlem

Reg: Aug 2023

Inlägg: 1 495

AI forskaren och Google ingenjören François Chollet förklarar läget med dagens språkmodeller, forskning och framtiden mot AGI.

https://www.youtube.com/watch?v=JTU8Ha4Jyfc

Citera

2024-11-09, 03:22 #57

Medlem

Reg: Aug 2023

Inlägg: 1 495

En helt ny matematik benchmark med nya problem som inte återfinns på nätet.

Marknadens bästa språkmodell får enbart 2% rätt.

https://epochai.org/frontiermath/benchmark-problems

Citera

2024-11-09, 18:15 #58

Medlem

Reg: Sep 2003

Inlägg: 25 385

Citat:

Ursprungligen postat av BeneathTheSurface

En helt ny matematik benchmark med nya problem som inte återfinns på nätet.

Marknadens bästa språkmodell får enbart 2% rätt.

https://epochai.org/frontiermath/benchmark-problems

Oj, vad "dum" den modellen måste vara. Själv skulle jag få, garanterat, noll rätt. Ungefär som att du skulle kunna få noll rätt på områden helt utanför din egen expertis.

Citera

2024-11-09, 20:39 #59

Medlem

Reg: Aug 2023

Inlägg: 1 495

Citat:

Ursprungligen postat av Ola Schubert

Oj, vad "dum" den modellen måste vara. Själv skulle jag få, garanterat, noll rätt. Ungefär som att du skulle kunna få noll rätt på områden helt utanför din egen expertis.

Vad är det du inte förstår (förutom att du alldeles uppenbart inte förstår AI överhuvudtaget eftersom du konstant refererar till en utbildning som inte överhuvudtaget är tillämpbar på området) det här om något indikerar att språkmodeller inte förstått minsta lilla av all matematik de konsumerat.

Citera

Stora språkmodeller - Teknik och Utveckling

Skapa ett konto eller logga in för att kommentera

Skapa ett konto

Logga in