【发布时间】:2011-08-22 11:13:06
【问题描述】:
抱歉我的英语提前。
我是 Cassandra 及其数据模型的初学者。我正在尝试在一个节点上的本地 cassandra 数据库中插入一百万行。每行有 10 列,我只将它们插入到一个列族中。
使用一个线程,该操作大约需要 3 分钟。但我想对 200 万行做同样的操作,并保持愉快的时光。然后我尝试用 2 个线程插入 200 万行,预计在 3-4 分钟左右会有类似的结果。但是我得到一个像 7 分钟这样的结果……是第一个结果的两倍。当我查看不同的论坛时,建议使用多线程来提高性能。 这就是我问这个问题的原因:使用多线程将数据插入本地节点(客户端和服务器在同一台计算机中)中是否有用,仅在一个列族中?
一些信息: - 我用 pycassa - 我在不同的磁盘上分离了提交日志库和数据库 - 我为每个线程使用批量插入 - 一致性级别:一 - 复制因子:1
【问题讨论】:
-
您找到解决方案了吗?我有类似的问题,我找不到任何解决方案。
标签: python multithreading insert cassandra