【发布时间】:2016-11-03 03:54:22
【问题描述】:
我正在解析一个 CSV 文件,需要您的帮助。我的 CSV 文件中有重复项。我想告诉 Python 向我提供重复地址的总数和唯一地址的总数,然后列出它们。我已经成功到达地址显示它是唯一还是重复的部分,但现在我想告诉 Python 也向我提供受尊重的数字。
import csv
csv_data = csv.reader(file('T:\DataDump\Book1.csv'))
next(csv_data)
already_seen = set()
for row in csv_data:
Address = row[6]
if Address in already_seen:
print('{} is a duplicate Address'.format(Address))
else:
print('{} is a unique Address'.format(Address))
already_seen.add(Address)
【问题讨论】:
-
有很多方法。当您打印它是重复值时,您可以增加一个值。您可以将
always_seen的长度与文件的长度进行比较。 -
谢谢摩根,你能提供一些我可以用作示例的代码吗?我是编程新手,所以还在学习。
-
在循环外声明一个变量,例如
duplicate = 0,然后在你做if address in already_seen:的同一个块中,做duplicate += 1。