【发布时间】:2021-05-07 12:27:04
【问题描述】:
这是previous question的扩展。
我有一个 python 字典,是这样制作的
a = {"animal": [ "dog", "cat", "dog and cat"], "XXX": ["I've been", "asp*", ":)"]}
我想找到一种解决方案,尽快用它们的键替换字典值中的所有单词。对于大文本,解决方案应该是可扩展的。如果单词以星号结尾,则表示文本中以该前缀开头的所有单词都应替换。
所以下面的句子“我一直很糟糕,但我渴望成为一个更好的人,并且表现得像我的狗和猫:)”应该变成“XXX bad but I XXX to be a better person, and doing like my animal XXX”。 p>
我正在尝试为此使用trrex,认为它应该是最快的选择。是吗?但是我不能成功。 此外,我发现问题:
- 处理包含标点符号的单词(例如“:)”和“I've been”);
- 当某些字符串重复时,例如“dog”和“dog and cat”。
您能否通过可扩展的解决方案帮助我实现目标?
【问题讨论】:
标签: python regex string replace full-text-search