【发布时间】:2018-07-02 05:09:58
【问题描述】:
我正在阅读 Automate Boring Stuff with Python,但我被困在关于从 Internet 下载数据的章节中。其中一项任务是从 Flickr 下载给定关键字的照片。
我在抓取这个网站时遇到了很大的问题。我试过 BeautifulSoup(我认为在这种情况下不合适,因为它使用 Javascript)和 Selenium。查看 html 我认为我应该找到“覆盖”类。但是,无论我使用哪个选项(find_element_by_class_name、...by_text、...by_partial_text)我都找不到这些元素(我得到:“。
您能帮我澄清一下我做错了什么吗?我也会感谢任何可以帮助我更好地理解此类案例的材料。谢谢!
这是我的简单代码:
import sys
search_keywords = sys.argv[1]
from selenium import webdriver
browser = webdriver.Firefox()
browser.get(f'https://www.flickr.com/search/?text={search_keywords}')
elems = browser.find_element_by_class_name("overlay")
print(elems)
elems.click()
我在 shell 中输入的示例关键字:“工业设计室内”
【问题讨论】:
标签: python selenium web-scraping beautifulsoup