【发布时间】:2017-11-17 17:35:46
【问题描述】:
我正在尝试抓取具有下拉菜单的网站,用户可以在其中选择显示的项目数。
即使我选择查看所有结果的选项,当我使用 bs4 解析页面的 URL 时,我也只会获得默认页面上显示的元素的结果。
这是我的(仍然是初级的)代码:
headers = {'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.143 Safari/537.36'}
site = "http://www.archivioelettorale.it/joomla/index.php?option=com_content&view=category&id=36:elezioni-comunali"
soup = BeautifulSoup(requests.get(site,headers=headers,timeout=5).text, 'html.parser')
list_1 = []
list_2 = []
elections_anchors = soup.find_all(class_=re.compile('sectiontableentry'))
for extract in elections_anchors:
list_1.extend(extract.select('a'))
for element in list_1:
list_2.append('http://www.archivioelettorale.it' + element['href'])
下拉菜单中的内容是:“Mostra #” 非常感谢
【问题讨论】:
标签: python-3.x drop-down-menu web-scraping