【发布时间】:2014-06-10 10:53:04
【问题描述】:
我有一个文件和很多 url,这些 url 被写入一个文件,所有这些都具有相同的结构加上一个 int 类型的 url CheckSum。 *.com 写成:
12534214214 http://*.com
现在每次我想将 url 放入文件中时,我需要检查 url 是否不存在 然后我可以把它。 但是使用 1 000 000 个 url 需要花费太多时间:
//list of urls
list<string> urls;
size_t hashUrl(string argUrl); //this function will hash the url and return an int
file.open("anchors");
//search for the int 12534214214 if it isn't found then write 12534214214 http://*.com
file.close();
question1:-如何使用校验和在文件中搜索,这样搜索将花费几毫秒?
question2:-是否有另一种存储这些 url 的方法,以便可以快速访问它们?
谢谢,抱歉英语不好
【问题讨论】:
-
使用数据库。 SQLite 和 BDB 应该随时可用。
-
大家好,感谢您的回复,我想使用数据库,但我需要按校验和排序,这样我就可以轻松搜索,数据库可以吗? @gha.st 你能解释一下如何通过校验和对文件进行排序吗?ty 提前