【发布时间】:2016-02-12 01:06:36
【问题描述】:
我刚买了一本书来教我如何抓取网站,但第一个例子对我不起作用 - 所以现在我有点不高兴我一开始就买了这本书,但我想试试看吧。
在 Python 3.5 中我的代码:
from urllib.request import urlopen
from bs4 import BeautifulSoup
html = urlopen("http://www.pythonscraping.com/pages/page1.html")
BsObj = BeautifulSoup(html.read())
print(bsObj.h1)*
这是我遇到的错误
Traceback(最近一次调用最后一次):
文件 "C:/Users/MyName/AppData/Local/Programs/Python/Python35-32/Lib/site-packages/bs4/test.py", 第 5 行,在 BsObj = BeautifulSoup(html.read())
文件 "C:\Users\MyName\AppData\Local\Programs\Python\Python35-32\lib\site-packages\bs4__init__.py", 第 153 行,在 init 中 builder = builder_class()
文件 "C:\Users\MyName\AppData\Local\Programs\Python\Python35-32\lib\site-packages\bs4\builder_htmlparser.py", 第 39 行,在 init 中 return super(HTMLParserTreeBuilder, self).init(*args, **kwargs)
TypeError: init() 得到了一个意外的关键字参数 'strict'
有什么想法会很有帮助吗? 提前致谢
【问题讨论】:
标签: python beautifulsoup