【发布时间】:2020-06-30 21:46:32
【问题描述】:
我正在开发一个新项目,以摆脱我能做的最基本的事情,我决定研究网络抓取。 我的想法是使用SteamStatus 检查 Steam 的当前状态并让我的脚本打印出来。对于第一个,我使用 Steam 商店的状态,我编写了以下代码:
import requests
import bs4
res = requests.get('https://www.steamstatus.io/')
res.raise_for_status
SteamStatus = bs4.BeautifulSoup(res.txt, 'html.parser')
type(SteamStatus)
storeStatus = SteamStatus.select('#statustables > div.statustable.left > div > div:nth-child(1) > div.statusrow_status.store-status')
print(str(storeStatus))
这样,我收到以下错误:
Traceback (most recent call last):
File "C:/Users/a864/PycharmProjects/automation/steam status/webpage.py", line 8, in <module>
SteamStatus = bs4.BeautifulSoup(res.txt, 'html.parser')
AttributeError: 'Response' object has no attribute 'txt'
根据我的搜索和发现,这将是请求模块的过时版本的问题,但我已经确保我拥有最新版本 (2.24.0)
【问题讨论】:
-
不,因为它的意思是
.text,而不是.txt...
标签: python web-scraping beautifulsoup python-requests