【问题标题】:Python Append Function and ListPython 追加函数和列表
【发布时间】:2021-03-19 14:45:04
【问题描述】:

我正在尝试使用 Python 和漂亮的汤从嵌套的 XML 站点地图中抓取和抓取网址。

我相信我已经完成了第一部分。我已经构建了一个简单的循环来访问主要的 XML 站点地图并提取符合特定条件的 XML 列表。然后它将 XML 的索引存储在一个列表中。

下一部分是它变得模糊的地方。

我正在尝试遍历上述列表中的每个项目并提取每个 URL 并将输出附加到将写入文本文件的新列表。

这是我本节的代码:

当我遍历并构建列表时,我得到了一个奇怪的输出:

我的第一个想法是 Python 在每个换行符后附加 '/n'。但是当我尝试遍历 URL 时,我得到了这个:

任何帮助或指导将不胜感激!

干杯

【问题讨论】:

标签: python python-3.x beautifulsoup


【解决方案1】:

在这种情况下,python 不知何故没有将 \n 解释为换行符(可能是由于 XML 内容的编组所致)。这就是为什么它不是一个合法的 URL,而你从请求中得到了那个错误。

一种解决方法是使用string.split("\\n") 将网址返回到列表中。

【讨论】:

  • 非常感谢,我会试一试的。
猜你喜欢
  • 2023-03-21
  • 2016-08-11
  • 2012-08-30
  • 1970-01-01
  • 2012-04-11
  • 1970-01-01
  • 1970-01-01
  • 2023-03-09
  • 1970-01-01
相关资源
最近更新 更多