【发布时间】:2015-04-15 05:50:22
【问题描述】:
之前我编写了从多个文件中提取特定字符串的代码,结果存储在单独的文件中。现在这个文件有重复的结果,我需要删除。
import glob
import re
import os.path
path=r"H:\sample"
file_array=glob.glob(os.path.join(path,'*.txt'))
with open("aiq_hits.txt","w") as out_file;
for input_filename in file_array:
with open(input_filename) as in_file:
for line in in_file:
match=re.findall(r"""(?<=')[^']*\.aiq(?=')|(?<=")[^"]*\.aiq(?=")""")
for item in match:
out_file.write("%s\n" %item)
out_file.close()
这个 out_file 有重复的结果,我需要删除,结果应该是同一个文件
【问题讨论】:
-
显示一些代码。有什么问题?
-
之前有人提出并回答了同样的问题:stackoverflow.com/questions/1215208/… 您可以在发布问题之前尝试搜索您想要的内容
-
我已经尝试了这些代码,但它们不起作用
标签: python duplicates