Vinnaren i pepparkakshustävlingen!
Igår, 13:58
  #1
Medlem
Har ca 200 pdf med beskrivningar av fastigheter, går det att låta en AI läsa igenom alla och extrahera exempelvis , fastighetsnamn, tomtstorlek byggnadsår byggnadens storlek. Dokumenttexten är inte upplagd på något standardiserat vis

Skulle det gå att skapa samma sammanfattning från en hemsida, typ fastighetsvarlden.se/ där AI sammanfattar den info som finns från alla nyheter till en excelfil

Om det går hur gör man
Citera
Igår, 14:00
  #2
Medlem
SvenHelsings avatar
Tvivlar på att det skulle gå på något tillförlitligt sätt
Citera
Igår, 14:20
  #3
Medlem
Ja, det går att göra, men för att svara på hur så måste vi veta vad du har för förkunskaper och eventuella möjligheter att köra en modell lokalt alternativt köra via någon molntjänst.

Det du vill göra är något som brukar kallas för "entity extraction" vilket lär vara en bra utgångspunkt för dig ifall du vill läsa dig till olika tillvägagångssätt och se om du hittar något som passar dina behov.
Citera
Igår, 14:21
  #4
Medlem
För att knyta vidare till ovanstående talare.

Det är ju exakt det man gör när man lär en AI, man berättar vad datan är och vad den betyder.
Så, ta dina 200 PDF-er och lär en AI, så kanske den fixar nästa 200 på egen hand.
Chansen att nån redan har gjort detta väldigt specifika grundarbete är nog kanske liten. AI är inte smartare än så, oavsett vad som står i Aftonbladet.
Citera
Igår, 15:07
  #5
Medlem
Maniks avatar
Kolla Document Intelligence i Azure. Jag använder det själv och det är fantastiskt bra. Speciellt om du lär upp den med exempel-data. Krävs en del programmering dock.
Citera
Igår, 15:50
  #6
Medlem
Eponumoss avatar
Citat:
Ursprungligen postat av arer
Har ca 200 pdf med beskrivningar av fastigheter, går det att låta en AI läsa igenom alla och extrahera exempelvis , fastighetsnamn, tomtstorlek byggnadsår byggnadens storlek. Dokumenttexten är inte upplagd på något standardiserat vis

Skulle det gå att skapa samma sammanfattning från en hemsida, typ fastighetsvarlden.se/ där AI sammanfattar den info som finns från alla nyheter till en excelfil

Om det går hur gör man
Ja, det är klart det gör. Finns också helt säkert lämpliga plug-ins (eller vad de nu kallas) för exempelvis ChatGPT för liknade uppgifter.

Här har du en genomgång av några pdf-extraktions-verktyg som använder ai;

https://pdf.afirstsoft.com/ai-pdf/ex...om-pdf-ai.html
__________________
Senast redigerad av Eponumos Igår kl. 15:56.
Citera
Igår, 20:23
  #7
Medlem
Citat:
Ursprungligen postat av erkki17
Ja, det går att göra, men för att svara på hur så måste vi veta vad du har för förkunskaper och eventuella möjligheter att köra en modell lokalt alternativt köra via någon molntjänst.

Det du vill göra är något som brukar kallas för "entity extraction" vilket lär vara en bra utgångspunkt för dig ifall du vill läsa dig till olika tillvägagångssätt och se om du hittar något som passar dina behov.

Tack det är alltid svårt när man inte vet vad man ska googla på. Ja entity extraction eller NER verkar vara det jag är ute efter. Det kom inte upp någon jätteintressant träff så det tar säkert några år innan det blir en programvara som går att köpa. Rätt program är superviktigt, kom ihåg när jag hittade DTSearch och kunde lättare leta i min dator.


Jag förstår att jag måste lära datorn vad jag vill vad den ska leta efter men jag vill inte lägga massa tid på något som blir obsolet innan det är klart. Kan jag göra extraktionen själv och datorn lära sig av det så skulle det vara perfekt. Föredrar att jobba lokalt om det går.
Citera

Skapa ett konto eller logga in för att kommentera

Du måste vara medlem för att kunna kommentera

Skapa ett konto

Det är enkelt att registrera ett nytt konto

Bli medlem

Logga in

Har du redan ett konto? Logga in här

Logga in