【发布时间】:2017-05-12 05:09:03
【问题描述】:
我的磁盘中有一个 HTML 表格。我想先使用 urllib,然后再使用 BeautifulSoup。但是,我得到一个错误。这是我的代码:
from bs4 import BeautifulSoup
import urllib.request
Data ="C:/Splits.html"
page = urllib.request.urlopen(splitData).read()
page=splitData
soup = BeautifulSoup(page)
Splits.html 文件如下所示:
A B C D
1 Company Old FV New FV Split Date
2 Palred Tech 5 10 26-04-2016
3 ABM Knowledg 10 5 07-04-2016
我得到的错误如下:
File "C:\Anaconda3\lib\urllib\request.py", line 1324, in unknown_open
raise URLError('unknown url type: %s' % type)
urllib.error.URLError: <urlopen error unknown url type: c>
提前感谢您的帮助。
【问题讨论】:
-
看来您正在调用
splitData,但没有参数或对象,它应该是它的函数 -
不应该
splitData是Data吗?...你不需要urllib,因为你正在使用本地文件,你可以用beautifulSoup打开文件跨度> -
尝试使用用户数据="file://C:/Splits.html"
-
非常感谢您的回复。我使用了 CyberDrone 的提示并且它有效,但它只需要是“file:///C:/Splits.html”,用三个 / 而不是两个。@ danidee,如果你直接去 BeautifulSoup 它只是解析名称文件,而不是文件,至少在我的机器上。
标签: python beautifulsoup urllib