"Christmas - the time to fix the computers of your loved ones" « Lord Wyrm

xPath Problem auf google.com/search

tinker 07.08.2016 - 22:37 1553 0
Posts

tinker

SQUEAK
Avatar
Registered: Nov 2005
Location: NÖ
Posts: 5221
Ahoi!
Kurze Vorgeschichte: Ich muss für ein Projekt einen Datensatz mit lizenzfreien Tierbildern erstellen. Hab mir dazu einige Python scripts für unterschiedliche Quellen geschrieben, um das ganze (semi)automatisch zu erledigen (Bilder speichern und passende Lizenzfiles erstellen).

Grundsätzlich funktioniert das mit xPath unter Python ganz gut, aber bei der google-Bildersuche passt irgendwas nicht, und ich komm nicht drauf wo der Fehler ist...

Hier eine Beispiel Suche: www.google.com/search?q=skunk+site:commons.wikimedia.org

Jetzt würd ich alle Ergebnisse gern in ner Schleife durchgehn. Aber es fängt schonmal an, dass mir count kein ordentliches Ergebnis liefert.

Code:
queryPage = requests.get(queryUrl)   
queryTree = html.fromstring(queryPage.content)

numItems = int(queryTree.xpath('count(//*[@id="rg_s"]/div)'))
Bekomm da immer 0 als Ergebnis.

Der xPath sollte passen, ist vom parent-div der aufgelisteten divs.

Auch die folgende xPath Abfrage liefert kein Ergebnis, sollte aber auch passen.
Code:
queryTree.xpath('//*[@id="rg_s"]/div[1]/a')
Aber irgendwas hats...
Kontakt | Unser Forum | Über overclockers.at | Impressum | Datenschutz