【发布时间】:2010-12-03 18:26:21
【问题描述】:
我在一个存储大约 15-100K 数据的类中使用 SortedList()。
最近我的要求发生了变化,数据不应该再按排序存储,所以我切换到 List()。
但是在这种情况下,我注意到 List() 消耗了大约 20% 以上的内存。
9K 项:
- 排序列表:105MB
- 列表:125MB
15K 项:
- 排序列表:115MB
- 列表:140MB
在我开发的环境中,记忆力非常重要。除了 List() 我可以用什么来避免这种额外的内存消耗并且仍然有一个未排序的列表?
附注我确实使用 HashSet(Of String) 来提供唯一性检查,同时使用 List(Of) 来模拟 SortedList.ContainsKey() 虽然我认为它不会带来这样的内存开销。
附注2:我的应用程序在启动时分配了大约 80 MB 的基本内存。所以数字应该读作 105-80=25、125-80 =45 等等
结果
感谢大家的回答,最终结果是:
- 您应该设置正确的容量以节省内存
- Hashset 在内存方面非常糟糕,而且消耗的量超出预期。这就是问题所在。不知何故,SortedList() 设法为类似功能使用更少的内存。
一些基准测试: 500 个字符,250000 个插入
列表(OF 字符串)(50000)
274 毫秒 - 226 MB
SortedList(Of String, String)(50000)
34868 毫秒 - 230 Mb
哈希集
420 毫秒 - 232 MB
字典(OF 字符串,对象)
486 毫秒 - 234 MB
虽然当我将减少计数更改为 25 时,那么:
Hashset 用于 600.000 次迭代 300 Mb 其中 List() 为 286 Mb
关于 Hashset 内存使用情况:http://blog.mischel.com/2008/04/09/hashset-limitations/Dictionary(Of string, object) 在我的测试中也没有好多少。
【问题讨论】:
-
你从哪里得到这些值?
-
来自我的测试应用程序,虽然内存应该是那个内存 - 应用程序的基本内存(大约 80MB)。
-
来自任务管理器(或类似的)?尝试使用分析器(如 CLRProfiler:microsoft.com/downloads/…)。来自任务管理器的内存数据取决于垃圾收集行为。
-
我希望 List
() 的内存占用大约是 "sizeof(T)" * 列表的容量(可以检查)。如果 T 是一个类,那么你只是存储引用,所以我希望,你的列表的实际占用空间是最小的(15k 个项目 * 4 个字节),也许还有其他的东西发生了变化,这对数据本身有更多的影响? -
@dr. evil - 如果你抛出 uut 哈希集,只保留 List 会发生什么? List
实际上是一个数组(正如 Martinho 所说),所以即使你为 300k 元素分配空间,它仍然只有大约 1.2MB(64 位为 2.4MB),所以列表本身不能消耗大量内存。数据或其他结构,如哈希集必须
标签: c# .net performance memory collections