xPath Problem auf google.com/search
tinker 07.08.2016 - 22:37 1553 0
tinker
SQUEAK
|
Ahoi! Kurze Vorgeschichte: Ich muss für ein Projekt einen Datensatz mit lizenzfreien Tierbildern erstellen. Hab mir dazu einige Python scripts für unterschiedliche Quellen geschrieben, um das ganze (semi)automatisch zu erledigen (Bilder speichern und passende Lizenzfiles erstellen). Grundsätzlich funktioniert das mit xPath unter Python ganz gut, aber bei der google-Bildersuche passt irgendwas nicht, und ich komm nicht drauf wo der Fehler ist... Hier eine Beispiel Suche: www.google.com/search?q=skunk+site:commons.wikimedia.orgJetzt würd ich alle Ergebnisse gern in ner Schleife durchgehn. Aber es fängt schonmal an, dass mir count kein ordentliches Ergebnis liefert. queryPage = requests.get(queryUrl)
queryTree = html.fromstring(queryPage.content)
numItems = int(queryTree.xpath('count(//*[@id="rg_s"]/div)'))
Bekomm da immer 0 als Ergebnis. Der xPath sollte passen, ist vom parent-div der aufgelisteten divs. Auch die folgende xPath Abfrage liefert kein Ergebnis, sollte aber auch passen. queryTree.xpath('//*[@id="rg_s"]/div[1]/a')
Aber irgendwas hats...
|