【发布时间】:2018-11-01 22:03:34
【问题描述】:
以下是 HTML 文件的一部分:
我只想抓取突出显示的行。这是一个大文件的一部分。对于这部分,我尝试了:
container5 = container1[1 ].findAll("strong")
container6 = (container5[6]).text
print(container6)
但输出是:
Address:
如何提取包含图像" " 部分内地址的字符串?
【问题讨论】:
-
只有单词“address:”在
<strong>标签内,实际地址在另一个元素内。看起来您需要查看<br>标记而不是 -
不要发布文本图像,而是将实际文本直接复制并粘贴到您的帖子中。文本图像不易解析、搜索或访问。
-
@G.Anderson
<br>标签始终为空。 HTML 对于解析这些数据的结构是次优的。将需要获取<strong>之后的文本节点。
标签: python web-scraping