【问题标题】:Iterating over BeautifulSoup object迭代 BeautifulSoup 对象
【发布时间】:2018-03-07 09:28:59
【问题描述】:

我正在遍历从 html 页面解析的表。我想遍历 BeautifulSoup 对象并解析标签之间的文本并将它们存储到列表中。但是,下面的代码一直只给我迭代中的最后一个文本。如何在这个问题中添加文本?​​

soup =  BeautifulSoup(webpage, 'html.parser')
table = soup.find("table",attrs={"id":"mvp_NBA"}).find("tbody").findAll("tr")

for row in table:
    key = []
    season = row.find_all("th")
    for year in season:
        y = year.get_text().encode('utf-8')
        key.append(y)
print key       

【问题讨论】:

  • 请提供 html/link 或者你的输出是什么?你想要的输出是什么?
  • @AbdullahAhmedGhaznavi basketball-reference.com/awards/mvp.html 我正在尝试遍历 mvp 球员表,并将年份作为键解析,将球员姓名解析为值
  • 在这里,您仅将年份作为键,并且根据您想要所有年份的问题和代码,但只获得最后一个,因此我已经修改了您的代码检查答案。要获得玩家,您可以自己修改它,然后制作它的 ka 字典以获取键作为年份和名称作为值。

标签: python beautifulsoup


【解决方案1】:

检查一下:

from bs4 import BeautifulSoup
import requests


url = "https://www.basketball-reference.com/awards/mvp.html"
source_code = requests.get(url)
plain_text = source_code.text
soup = BeautifulSoup(plain_text, 'html.parser')
table = soup.find("table",attrs={"id":"mvp_NBA"}).find("tbody").findAll("tr")

key = []
for row in table:
    season = row.findAll("th", {'class': 'left'})
    for year in season:
        y = year.get_text().encode('utf-8')
        key.append(y)
print key

你在 for 循环中做的唯一错误是你每次清空你的列表 key=[] 我已经稍微修改了你的代码,它给出了你想要的输出。

【讨论】:

    猜你喜欢
    • 2014-10-02
    • 2019-06-03
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多