【发布时间】:2014-12-03 16:12:17
【问题描述】:
我在标点符号上有一个小问题。
我的任务是检查文本中是否有任何重复的单词,如果列表中有任何重复的单词,我的工作是使用 .upper() 突出显示它们。
文本示例:我喜欢苹果,苹果是我所知道的最好的东西。
所以我提取了原始文本,将其从标点符号中删除,将所有单词转换为小写,然后拆分列表。 使用 for 循环,我将列表中的每个单词相互比较,我发现所有重复的单词,所有这些都放在一个新列表中。
示例(使用 for 循环后):我喜欢苹果 APPLES 是我所知道的最好的东西
因此,新列表现在与原始列表相似,但有一个主要例外,它缺少标点符号。
有没有办法在新列表中添加标点符号,如果它们是“应该是”(从旧列表位置)? 是否有某种在 python 中构建的方法可以做到这一点,还是我必须将两个列表与另一个 for 循环进行比较,然后将标点符号添加到新列表中?
NewList = [] # 创建一个空列表
for word in text:
if word not in NewList:
NewList.append(word)
elif word in NewList: #
NewList.append(word.upper())
List2 = ' '.join(NewList)
上面的代码适用于较长的文本,这就是我一直用于突出显示重复单词的代码。 唯一的问题是新文件中不存在标点符号,这是我唯一的问题。
【问题讨论】:
-
您可以在原始文本上使用
string.replace,尽管使用'apples apples applesauce'调用它会得到'APPLES APPLES APPLESauce'。
标签: python list punctuation