【发布时间】:2015-12-03 20:03:43
【问题描述】:
试图从 OkCupid 中抓取数据并获取相关的文本数据。
例如用户名数据存储在:
<div class="userinfo2015-basics-username"> AmericanMary666
获取用户名的代码
from urllib.request import urlopen
from bs4 import BeautifulSoup
html = urlopen("http://www.okcupid.com/profile/AmericanMary666")
bsObj = BeautifulSoup(html,"html.parser")
nameList = bsObj.findAll('div', attrs={'class': 'userinfo2015-basics-username'})
for name in nameList:
print(name.get_text())
它不起作用,我不知道为什么。
【问题讨论】:
标签: python html web-scraping beautifulsoup