【发布时间】:2022-01-18 22:39:33
【问题描述】:
请帮助,SEC EDGAR 一直到现在都可以完美运行。它给出了 HTTPError: HTTP Error 403: Forbidden
import pandas as pd
tables = pd.read_html("https://www.sec.gov/Archives/edgar/data/1541617/000110465920125814/xslForm13F_X01/infotable.xml")
df=tables[3]
df
【问题讨论】:
-
该页面上只有一个表;这是问题中的正确网址吗?
-
不是吗?有 3 个至少一个标题,下一个在右下角,最后一个是我需要的
-
我的猜测是它会将您识别为机器人并阻止您。可能需要使用不同的技术来访问页面以模仿人类(使用标题、硒等)。此外,此页面上有 4 个表,如果您正在寻找主要数据块,它实际上现在在 table[4] 中。
标签: pandas dataframe parsing beautifulsoup http-status-code-403