【发布时间】:2014-08-05 11:16:50
【问题描述】:
我有一个维基百科页面:http://en.wikipedia.org/wiki/2014_AFL_season
我需要准备一个字典,以 Round 为键,对应的数据为值。
喜欢:
myDict = {"Round 1": [["Date","Loser Team ", "Winner Team ","Stadium", "Crowd"], ["Date","Loser Team ", "Winner Team ","Stadium", "Crowd"].......], "Round 2":[["Date","Loser Team ", "Winner Team ","Stadium", "Crowd"], ["Date","Loser Team ", "Winner Team ","Stadium", "Crowd"].......]
所以这本词典将存储所有数据。
请帮我做这件事。我在 Python 中使用 BS4 和 urllib2。
我使用了以下代码:
from bs4 import BeautifulSoup
import urllib2
header = {'User-Agent': 'Mozilla/5.0'}
def createLink():
url = "http://en.wikipedia.org/wiki/2014_AFL_season"
# mainPage = urllib2.Request(url,headers=header)
mainPage = urllib2.urlopen(url)
mainPageSoup = BeautifulSoup(mainPage)
for index in mainPageSoup.findAll("table"):
print index
createLink()
【问题讨论】:
-
向我们展示您的 BS 代码。
-
在真正编写代码之前,我试图弄清楚。我很困惑并发布了问题
-
我的猜测,也许完全错误,你会在 wiki 代码中找到更多结构(即进入“编辑”),这样更容易解析。
-
这个问题似乎是题外话,因为它要求代码并且没有显示任何努力。
-
这里给代码,给我点时间
标签: python beautifulsoup