Okej, nu är det tillslut knapphändigt hopsnickrat.
Lite som när man är ute och åker på en gammal moppe som man hoppas att förgasaren inte lossnar allt för ofta på, men som går framåt så längde det vill sig.
Om vi räknar grovt på att alla företagsregister jag kommer åt innehåller en miljon företag (lite mer än hälften av sveriges företag), och jag snittar sex sekunder per företag (scrapar flera sidor) så kommer det ta lite över två månader för allting, förutsatt att programmet aldrig stannar och behöver lite kärlek.
Det går att leva med, men det är ändå lite väl länge. Hade hoppats på kanske två eller tre veckor max.
Problemet är att jag har blivit tvungen att använda time.sleep(), som visserligen antagligen går sänka en aning på sina ställen, men det är en klumpig lösning som är väldigt öppen för fel.
Jag lyckas dock inte använda waiten, den bara felar.
Har en funktion som bara ser ut så här:
Kod:
def wait(xp):
return WebDriverWait(driver, 20).until(EC.visibility_of_element_located((By.XPATH, xp)))
Men det felar allt som oftast. Antingen får jag stale elements, eller så dyker det upp en mystisk kombination av tecken som ger 0 träffar på google. Ser ut lite som två minnesadresser, men jag tror inte det var hexadecimalt.
Har tyvärr inte den sparad just nu, och det verkar vara lite slumpmässigt när den dyker upp.
Finns det några generella tips på hur man torde handskas med waitfunktionen för att få ner tiderna framgångsrikt?