【发布时间】:2021-03-19 14:45:04
【问题描述】:
我正在尝试使用 Python 和漂亮的汤从嵌套的 XML 站点地图中抓取和抓取网址。
我相信我已经完成了第一部分。我已经构建了一个简单的循环来访问主要的 XML 站点地图并提取符合特定条件的 XML 列表。然后它将 XML 的索引存储在一个列表中。
下一部分是它变得模糊的地方。
我正在尝试遍历上述列表中的每个项目并提取每个 URL 并将输出附加到将写入文本文件的新列表。
这是我本节的代码:
我的第一个想法是 Python 在每个换行符后附加 '/n'。但是当我尝试遍历 URL 时,我得到了这个:
任何帮助或指导将不胜感激!
干杯
【问题讨论】:
-
请阅读How to Ask并确保您的问题有minimal reproducible example。
标签: python python-3.x beautifulsoup