【发布时间】:2018-03-07 09:28:59
【问题描述】:
我正在遍历从 html 页面解析的表。我想遍历 BeautifulSoup 对象并解析标签之间的文本并将它们存储到列表中。但是,下面的代码一直只给我迭代中的最后一个文本。如何在这个问题中添加文本?
soup = BeautifulSoup(webpage, 'html.parser')
table = soup.find("table",attrs={"id":"mvp_NBA"}).find("tbody").findAll("tr")
for row in table:
key = []
season = row.find_all("th")
for year in season:
y = year.get_text().encode('utf-8')
key.append(y)
print key
【问题讨论】:
-
请提供 html/link 或者你的输出是什么?你想要的输出是什么?
-
@AbdullahAhmedGhaznavi basketball-reference.com/awards/mvp.html 我正在尝试遍历 mvp 球员表,并将年份作为键解析,将球员姓名解析为值
-
在这里,您仅将年份作为键,并且根据您想要所有年份的问题和代码,但只获得最后一个,因此我已经修改了您的代码检查答案。要获得玩家,您可以自己修改它,然后制作它的 ka 字典以获取键作为年份和名称作为值。
标签: python beautifulsoup