【发布时间】:2012-10-24 05:17:18
【问题描述】:
我经常不得不使用 java.util.collection 包中的对象,这些对象符合 Map 和 Set 接口。
当我在这些对象(HashMap、TreeMap 等)中插入几百万个元组或实体时,它们的性能、插入和查找速度都慢得像爬行。
我设计了派生类,它们本质上是 java.util.collection 中的类的组合,可以更好地扩展性能。
我想知道是否有 java.util.collections 包的开源等效包,它针对处理大量数据进行了优化。
【问题讨论】:
-
为什么要在内存中创建包含数百万个元素的地图和集合?关系数据库不能用索引吗?
-
@Maciej Ziarko,在 RDBMS、NoSQL Dbs 中存储数百万个元素会有很多案例/好处,但是有时在内存中处理大对象是有意义的,并且比 RDBMS 更受欢迎, NoSQL DB 方法。一位响应者发布了一个项目 Trove,我认为它可以满足这一需求。谢谢
标签: java data-structures collections bigdata