【问题标题】:Compare a Python list to an external file (.xls or .csv)将 Python 列表与外部文件(.xls 或 .csv)进行比较
【发布时间】:2018-11-07 19:51:27
【问题描述】:

我将拥有大量电子邮件,我需要定期将其与由非 python 用户更新的域的小列表(20 到 30 个条目)进行比较,可能在 .xls 或 .txt 或 .csv 文件中.此外部文件中列出的任何域都需要从列表中删除。有关设置的一般提示?我已经知道如何遍历电子邮件并删除任何匹配项,但我对引用外部文件的最佳方式不太自信。非常感谢。

【问题讨论】:

  • 查找逐行打开文件并用excel打开/解析csv xls文件

标签: python


【解决方案1】:

我会通过使用 Pandas 读取文件来处理它,使用 read_csv 您可以打开不同类型的文件,这些文件使用分隔符分隔值(例如 csv 中的逗号),这将返回一个 Pandas 数据框,您可以用于与您已有的文件列表进行比较。

专业提示:您可能希望将已有的电子邮件列表存储在某个地方,对吧?如果您将它们存储为 csv,您也可以使用 Pandas 读取它们。这样做之后,您可以删除Diff between two dataframes in pandas上的答案之后的出现

编码愉快!

【讨论】:

  • pandas 这里好像用大锤打苍蝇
  • 同意。只需使用 .txt 文件和 open() 即可创建列表。
  • 如果电子邮件列表有数千个,比如 5K 到 10K 长,这是否更适合 pandas?
猜你喜欢
  • 1970-01-01
  • 2017-08-06
  • 2017-07-14
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2016-10-18
  • 2012-10-25
  • 2018-03-07
相关资源
最近更新 更多