【发布时间】:2012-10-28 23:59:05
【问题描述】:
如果不是因为我需要存储比我的 4 GB RAM 容量更多的数据,我可以使用 dict 来完成这项任务。我还在同一个程序中做其他需要内存的事情,所以内存要求越低越好。
我只是想
存储许多个字符串
检查集合中是否包含字符串
有没有一种 Python 方法可以做到这一点?我使用的是 3.3,所以 berkelydbs 已经出局了。
它还需要给出准确的答案,所以没有 Bloom-filters。
【问题讨论】:
-
感谢编辑以获得更好的标题。我画了一个空白。
-
我想知道同一程序中的其他内存需求是什么,可能数据库也适合
-
您是否需要将原始字符串保留在内存中,或者您是否可以将“许多字符串”的哈希值存储在一组中并进行检查?
标签: python large-data