Okej, nu r det tillslut knapphndigt hopsnickrat.
Lite som nr man r ute och ker p en gammal moppe som man hoppas att frgasaren inte lossnar allt fr ofta p, men som gr framt s lngde det vill sig.
Om vi rknar grovt p att alla fretagsregister jag kommer t innehller en miljon fretag (lite mer n hlften av sveriges fretag), och jag snittar sex sekunder per fretag (scrapar flera sidor) s kommer det ta lite ver tv mnader fr allting, frutsatt att programmet aldrig stannar och behver lite krlek.
Det gr att leva med, men det r nd lite vl lnge. Hade hoppats p kanske tv eller tre veckor max.
Problemet r att jag har blivit tvungen att anvnda time.sleep(), som visserligen antagligen gr snka en aning p sina stllen, men det r en klumpig lsning som r vldigt ppen fr fel.
Jag lyckas dock inte anvnda waiten, den bara felar.
Har en funktion som bara ser ut s hr:
Kod:
def wait(xp):
return WebDriverWait(driver, 20).until(EC.visibility_of_element_located((By.XPATH, xp)))
Men det felar allt som oftast. Antingen fr jag stale elements, eller s dyker det upp en mystisk kombination av tecken som ger 0 trffar p google. Ser ut lite som tv minnesadresser, men jag tror inte det var hexadecimalt.
Har tyvrr inte den sparad just nu, och det verkar vara lite slumpmssigt nr den dyker upp.
Finns det ngra generella tips p hur man torde handskas med waitfunktionen fr att f ner tiderna framgngsrikt?