【发布时间】:2017-10-08 00:39:01
【问题描述】:
我正在使用 python 来解析 YAML 文件。
其中一个 YAML 文档包含如下字典:
scrapers:
results: //article[@class='story ']
这显然会导致问题,因为最后一个撇号前面有一个空格。如果我可以删除空格,它将解决问题。但是,由于它是 xpath,我不能。
有谁知道我怎么能逃脱那个序列? 我查看了其他 SO 问题,但解决方案例如将字符串包装在“”中,或者 使用
scrapers:
results: //article[@class='story ']
或
scrapers:>
results: //article[@class='story ']
或
scrapers:
results: //article[@class='story '']
没用。
编辑: 我正在尝试打开一个包含上述表达式的文件:
import yaml
with open('/home/depot/wintergreen/yaml/scrapers.yml', 'r') as f:
scrapers = yaml.load(f)
但是我收到错误: ScannerError:此处不允许映射值
指向story 之后的空格。
我一直在尝试下面的回答者提供的建议,即从 python dict 创建 yaml 表达式。这行得通。我将yaml保存到文件并再次加载它也可以工作。
但是,当我通过键入完全相同的字符来创建 yaml 时,它就不起作用了……
编辑2: 我认为问题源于我在窗口机器上创建了 yaml 文件并将其上传到 unix 服务器上。
【问题讨论】:
-
有问题的代码在哪里?你用什么图书馆?或者您是否尝试使用正则表达式解析 YAML? (你不应该)