【发布时间】:2011-07-28 07:24:18
【问题描述】:
我有一个包含大约 170,000 字左右的文件。在 .NET 中处理此问题的最佳方法是什么?
将其加载到内存中的列表中并搜索列表是否有意义。这种大小的列表是否会成为记忆中的问题?任何有关加载和搜索此类列表的建议将不胜感激。
谢谢,
【问题讨论】:
-
文件的格式是什么?最长的单词是什么?
-
您要执行什么样的搜索?
-
用
Regular Expression怎么样? -
170000 个单词在内存方面并不多。最坏的情况,大约是 3 和半兆。您对容器的选择实际上应该由您打算执行的操作类型决定,但我认为内存不会有太大问题。
-
@spender:你不知道这些词是什么,所以不要做这样的假设。如果它们是我们称之为 DNA 的字母表
{A, C, G, T}上的那些小词怎么办? “小”是指每个大约 350 MB。