【发布时间】:2021-09-13 21:37:48
【问题描述】:
这是我尝试放置出版物 URL 时发生的错误的回溯。它适用于常规网站,例如 stackoverflow 或 Wikipedia,但是当我在 https://www.sciencedirect.com/science/article/pii/S1388248120302113?via%3Dihub 等出版物上尝试时,会出现错误。谁能帮帮我??
这是我的代码: req = Request('https://www.sciencedirect.com/science/article/pii/S1388248120302113?via%3Dihub', headers={'User-Agent': 'Mozilla/5.0'}) html_plain = urlopen(req).read()
这是错误的回溯:
文件“C:\Program Files\WindowsApps\PythonSoftwareFoundation.Python.3.9_3.9.1776.0_x64__qbz5n2kfra8p0\lib\urllib\request.py”,第 214 行,在 urlopen
返回 opener.open(url, 数据, 超时)
文件“C:\Program Files\WindowsApps\PythonSoftwareFoundation.Python.3.9_3.9.1776.0_x64__qbz5n2kfra8p0\lib\urllib\request.py”,第 523 行,打开
响应=方法(请求,响应)
文件“C:\Program Files\WindowsApps\PythonSoftwareFoundation.Python.3.9_3.9.1776.0_x64__qbz5n2kfra8p0\lib\urllib\request.py”,第 632 行,在 http_response
响应 = self.parent.error(
文件“C:\Program Files\WindowsApps\PythonSoftwareFoundation.Python.3.9_3.9.1776.0_x64__qbz5n2kfra8p0\lib\urllib\request.py”,第 561 行,错误
返回 self._call_chain(*args)
_call_chain 中的文件“C:\Program Files\WindowsApps\PythonSoftwareFoundation.Python.3.9_3.9.1776.0_x64__qbz5n2kfra8p0\lib\urllib\request.py”,第 494 行
结果 = 函数(*args)
文件“C:\Program Files\WindowsApps\PythonSoftwareFoundation.Python.3.9_3.9.1776.0_x64__qbz5n2kfra8p0\lib\urllib\request.py”,第 641 行,位于 http_error_default
引发 HTTPError(req.full_url, code, msg, hdrs, fp)
urllib.error.HTTPError:HTTP 错误 403:禁止
谢谢!
【问题讨论】:
标签: python html http web-scraping nlp