2022-08-21, 10:32
  #133
Medlem
Enterprises avatar
Citat:
Ursprungligen postat av Methos
Lnka till andra dokument?
Du kan manipulera celler inom DataFrame, du kan ladda flera filer och gra flera DataFrame och lgga ihop. Men jag tror inte att du kan lnka tv separata celler i tv filer. Gr det ens med openpyxl?
Ja, det gr.
Openpyxl kan lgga in bde formler och hyperlnkar i Excel-filer, precis som en anvndare kan.
Det gr inte riktigt att jmfra med Pandas. Pandas r bttre fr stora berkningar (som Python-motorn utfr). Openpyxl r bttre fr att automatisera komplexa Excel-berkningar, eller andra vningar som Bonnatorps dr man behver Excel-funktionalitet i kalkylarket (hr hyperlnkar).
Citera
2022-08-21, 10:39
  #134
Medlem
Citat:
Ursprungligen postat av Enterprise
Om jag vore dig skulle jag slppa Pandas. Pandas r vldigt bra fr att gra berkningar p stora data-set t.ex. statistik. Men i ditt fall anvnder du vl Excel-filen snarare som en databas med uppgifter i och d har jag svrt att se att Pandas hjlper dig.

Citat:
Ursprungligen postat av Enterprise
Ja, det gr.
Openpyxl kan lgga in bde formler och hyperlnkar i Excel-filer, precis som en anvndare kan.
Det gr inte riktigt att jmfra med Pandas. Pandas r bttre fr stora berkningar (som Python-motorn utfr). Openpyxl r bttre fr att automatisera komplexa Excel-berkningar, eller andra vningar som Bonnatorps dr man behver Excel-funktionalitet i kalkylarket (hr hyperlnkar).


Aha, jag tnkte mer att Pandas var perfekt fr att spara skrpet till excell. Tnkte inte ens att han behvde rra data utan bara skrapa upp skiten, in i det till en dict eller list och sedan in i DataFrame och in i Excell.

Men d skippar han Pandas om han skall gra mer saker.
Citera
2022-08-21, 21:27
  #135
Medlem
Bonnatorps avatar
Citat:
Ursprungligen postat av Methos
Aha, jag tnkte mer att Pandas var perfekt fr att spara skrpet till excell. Tnkte inte ens att han behvde rra data utan bara skrapa upp skiten, in i det till en dict eller list och sedan in i DataFrame och in i Excell.

Men d skippar han Pandas om han skall gra mer saker.
Jo det var s frut, det rckte gott och vl fr ursprungsfunktionen som bara var till att jag skulle slippa sitta och leta telefonnummer fr hand.
Men projektet blev lite strre, och eftersom slutprodukten ska ligga i excel blev det enklast med openpyxl d alla iterationer och jox redan r anpassat fr det.
Dremot r det fortfarande lite av intresse att ha en enskild tabell i ngot format fr hela sveriges fretag nr jag vill plocka ut hela branscher ver hela landet.
Excel passar inte till det d det antagligen verstiger grnsen p dryga miljonen rader, ven om det i vrigt hade varit perfekt fr ndamlet om det var prestandamssigt anpassat fr sdana mngder.
Gjorde en trd som var mer inriktad p SQL-delen, om det blir SQL jag anvnder. Det blir frmodligen det d excel enkelt kan koppla upp mot det, ven om det kanske blir klurigt med hyperlnkfunktionaliteten jag r ute efter just nu.

Kanske jag kan gra en fuling och ge ut primrlistan till kunden, och krva en mnadskostnad fr att deras hyperlnkar (fr finansbladen) som gr till en server p min hemdator ska fungera.
D fr de ju extra funktionalitet i att de slipper hlla reda p var alla de extra filerna ligger, och jag sparar tid i att jag kan stoppa exakt allt i samma mapp
__________________
Senast redigerad av Bonnatorp 2022-08-21 kl. 21:58.
Citera
2022-08-25, 21:31
  #136
Medlem
Bonnatorps avatar
Okej, nu r det tillslut knapphndigt hopsnickrat.
Lite som nr man r ute och ker p en gammal moppe som man hoppas att frgasaren inte lossnar allt fr ofta p, men som gr framt s lngde det vill sig.

Om vi rknar grovt p att alla fretagsregister jag kommer t innehller en miljon fretag (lite mer n hlften av sveriges fretag), och jag snittar sex sekunder per fretag (scrapar flera sidor) s kommer det ta lite ver tv mnader fr allting, frutsatt att programmet aldrig stannar och behver lite krlek.
Det gr att leva med, men det r nd lite vl lnge. Hade hoppats p kanske tv eller tre veckor max.

Problemet r att jag har blivit tvungen att anvnda time.sleep(), som visserligen antagligen gr snka en aning p sina stllen, men det r en klumpig lsning som r vldigt ppen fr fel.
Jag lyckas dock inte anvnda waiten, den bara felar.

Har en funktion som bara ser ut s hr:
Kod:
def wait(xp):
    return WebDriverWait(driver, 20).until(EC.visibility_of_element_located((By.XPATH, xp)))
Men det felar allt som oftast. Antingen fr jag stale elements, eller s dyker det upp en mystisk kombination av tecken som ger 0 trffar p google. Ser ut lite som tv minnesadresser, men jag tror inte det var hexadecimalt.
Har tyvrr inte den sparad just nu, och det verkar vara lite slumpmssigt nr den dyker upp.

Finns det ngra generella tips p hur man torde handskas med waitfunktionen fr att f ner tiderna framgngsrikt?
Citera
2022-08-26, 08:13
  #137
Medlem
Enterprises avatar
Citat:
Ursprungligen postat av Bonnatorp
Okej, nu r det tillslut knapphndigt hopsnickrat.
Lite som nr man r ute och ker p en gammal moppe som man hoppas att frgasaren inte lossnar allt fr ofta p, men som gr framt s lngde det vill sig.

Om vi rknar grovt p att alla fretagsregister jag kommer t innehller en miljon fretag (lite mer n hlften av sveriges fretag), och jag snittar sex sekunder per fretag (scrapar flera sidor) s kommer det ta lite ver tv mnader fr allting, frutsatt att programmet aldrig stannar och behver lite krlek.
Det gr att leva med, men det r nd lite vl lnge. Hade hoppats p kanske tv eller tre veckor max.

Problemet r att jag har blivit tvungen att anvnda time.sleep(), som visserligen antagligen gr snka en aning p sina stllen, men det r en klumpig lsning som r vldigt ppen fr fel.
Jag lyckas dock inte anvnda waiten, den bara felar.

Har en funktion som bara ser ut s hr:
Kod:
def wait(xp):
    return WebDriverWait(driver, 20).until(EC.visibility_of_element_located((By.XPATH, xp)))
Men det felar allt som oftast. Antingen fr jag stale elements, eller s dyker det upp en mystisk kombination av tecken som ger 0 trffar p google. Ser ut lite som tv minnesadresser, men jag tror inte det var hexadecimalt.
Har tyvrr inte den sparad just nu, och det verkar vara lite slumpmssigt nr den dyker upp.

Finns det ngra generella tips p hur man torde handskas med waitfunktionen fr att f ner tiderna framgngsrikt?

Har du provat implicit wait?
Allts att man stller in en maxtid en gng och sedan kr p utan uttryckliga wait.
Nackdelen med det, antar jag r det kan gra ett program lngsammare om man kollar efter element p "chans", allts att man inte "vet" huruvida de ska finnas eller inte (nr det allts inte ndvndigtvis r en timingfrga)

Citat:
5.2. Implicit Waits
An implicit wait tells WebDriver to poll the DOM for a certain amount of time when trying to find any element (or elements) not immediately available. The default setting is 0 (zero). Once set, the implicit wait is set for the life of the WebDriver object.

Kod:
from selenium import webdriver

driver 
webdriver.Firefox()
driver.implicitly_wait(10# seconds
driver.get("http://somedomain/url_that_delays_loading")
myDynamicElement driver.find_element_by_id("myDynamicElement"
Klla: https://selenium-python.readthedocs.io/waits.html

Frresten anvnder du try/except-block fr dina uttryckliga wait-satser?
__________________
Senast redigerad av Enterprise 2022-08-26 kl. 08:16.
Citera
2022-08-26, 08:37
  #138
Medlem
Bonnatorps avatar
Citat:
Ursprungligen postat av Enterprise
Har du provat implicit wait?
Allts att man stller in en maxtid en gng och sedan kr p utan uttryckliga wait.
Nackdelen med det, antar jag r det kan gra ett program lngsammare om man kollar efter element p "chans", allts att man inte "vet" huruvida de ska finnas eller inte (nr det allts inte ndvndigtvis r en timingfrga)


Klla: https://selenium-python.readthedocs.io/waits.html

Frresten anvnder du try/except-block fr dina uttryckliga wait-satser?
Jajusteja, try borde man nog gra.
Glmmer ofta det.

Ett av problemen r t.ex. Nr jag kr ratsit.
Dels s byter skrutorna element beroende p om jag har klickat in p ett resultat eller r kvar i sklistan, skter det via en bool som ndras beroende p om ett resultat ppnats eller inte.
Men jag vet inte om det blir ngot resultat alls eller ej, och skresultaten laddar sist av hela sidan. S det knns klurigt hur jag ska lgga en wait p ngot som kanske inte dyker upp.
Citera
2022-08-26, 09:02
  #139
Medlem
Enterprises avatar
Citat:
Ursprungligen postat av Bonnatorp
Jajusteja, try borde man nog gra.
Glmmer ofta det.

Ett av problemen r t.ex. Nr jag kr ratsit.
Dels s byter skrutorna element beroende p om jag har klickat in p ett resultat eller r kvar i sklistan, skter det via en bool som ndras beroende p om ett resultat ppnats eller inte.
Men jag vet inte om det blir ngot resultat alls eller ej, och skresultaten laddar sist av hela sidan. S det knns klurigt hur jag ska lgga en wait p ngot som kanske inte dyker upp.

Jag spnar fritt hr, men p klientsidan kan man ofta anvnda jQuery fr att kolla om dokumentet har laddat frdigt, se: https://learn.jquery.com/using-jquer...ocument-ready/

Selenium kan, som jag tror jag skrivit i annan trd, kra Javascript ocks p klientsidan:
https://www.guru99.com/execute-javas...webdriver.html

Jag tnker mig drfr att det borde vara mjligt att lna Selenium vnta p Browser kr frdigt ett viss JS-skript.
Citera
2022-08-26, 20:15
  #140
Medlem
Bonnatorps avatar
Citat:
Ursprungligen postat av Enterprise
Jag spnar fritt hr, men p klientsidan kan man ofta anvnda jQuery fr att kolla om dokumentet har laddat frdigt, se: https://learn.jquery.com/using-jquer...ocument-ready/

Selenium kan, som jag tror jag skrivit i annan trd, kra Javascript ocks p klientsidan:
https://www.guru99.com/execute-javas...webdriver.html

Jag tnker mig drfr att det borde vara mjligt att lna Selenium vnta p Browser kr frdigt ett viss JS-skript.
Ja det igen, d blir dey frsta grejen nsta tillflle jag stter mig p projektet.

Sg frresten idag att Nvidia presenterar sina nya grafikkort 20:e september.

Om det r humana priser p deras egna grafikkort p de frsta kparna s skulle det vara lajbans att snickra ihop en bot som hller koll p sidan och kper ett 4080 eller s s fort det r tillgngligt.

Hur torde man g tillvga fr detta om man inte vet precis hur sidan kommer vara utformad?
Hoppas p att den r identisk med deras andra kort?
Citera
2023-03-18, 16:00
  #141
Medlem
Kottkompotts avatar
Har fastnat p min proxy nu.
Den slutade pltsligt att fungera med selenium.

Har testat ngra olika metoder i selenium att mata in proxyn p, men fick alltid omedelbart "www.exempel.com returnerade ingen data".
Slr jag in proxyn i windows ntverksinstllningar s kan jag surfa, och IP:n blir ndrad.
Men samma problem kvarstr nr jag anvnder selenium.

Det r s mrkligt d det fungerade fr en timme sedan.
Ngon som sttt p ngot liknande?
Citera
2023-03-19, 15:58
  #142
Medlem
Kottkompotts avatar
Visade sig vara Stormproxies det var fel p.
Bytte till Webshare, vilket var ett fantastiskt val.
Dels r den bttre p alla tnkbara stt (mycket snabbare och har statistik ver anvndning), utom att den inte r automatiskt roterande, och dels betalar jag nu typ 20 kronor per mnad fr att tcka behoven, istllet fr 140.
Citera

Skapa ett konto eller logga in för att kommentera

Du måste vara medlem för att kunna kommentera

Skapa ett konto

Det är enkelt att registrera ett nytt konto

Bli medlem

Logga in

Har du redan ett konto? Logga in här

Logga in