【发布时间】:2022-01-23 11:51:01
【问题描述】:
我使用下面的脚本从服务器获取临时代码
import requests
from bs4 import BeautifulSoup
payload{
'username':'demo',
'password':'demo'
}
with requests.session() as s:
r= s.post(192.13.11.100,data=payload)
print(r.text)
脚本没有问题,
现在,我得到了预期的输出。
<html>
<body>
<script>
var session_key='d2e08508d3';
</script>
<script>
var temporary_data='01';
</script>
</body>
</html>
现在我想从 html 输出中获取 session_key。
请告诉我如何获取 html 中的变量
【问题讨论】:
-
你试过什么?你检查过像Beautiful Soup 这样的库吗?
-
您可以使用 r"session_key=['|\"]{1}([0-9a-zA-Z]{1,})['|\"]{1} 尝试正则表达式" 在 html 字符串上并检索组 1
-
@benjababe,虽然正则表达式可能在一些非常有限的情况下工作,但它是better not to use regex to parse HTML。但是你可以使用正则表达式,一旦从标签中提取文本,然后获取特定的值。
标签: python html beautifulsoup python-requests python-requests-html