【发布时间】:2012-11-08 05:15:08
【问题描述】:
我正在尝试找到一个数据库来充当 Python 集。这是因为我的数据太大而无法存储在内存中。
我尝试使用 SQLite,但听说它可能会出现超过 10 GB 数据的性能问题,所以我正在考虑尝试CouchDB
问题是它似乎像字典一样工作,而不是像集合?
是否有作为 Python 集运行的数据库工具?也就是说,它只存储值而不是键值对?
(我必须用 Python 编写代码,所以我对易于使用 Python 的东西感兴趣)
编辑:
我会将它存储为一个巨大的集合,而不是几个小的集合。
【问题讨论】:
-
如果你的目标是存储超过 10GB 的单个集合,你可能不应该使用 python。另外,如果您有多个集合,并且每个集合都比较小,您是否考虑过平面文件数据库?
-
我会将它存储为一个很棒的集合。也希望能尽快完成,因为这对性能至关重要。
-
这使事情变得复杂。您期待什么样的访问模式?
-
交替插入一个/查找一个。如果值已经存在,我可能不会再插入。
标签: python couchdb large-data nosql