【发布时间】:2018-05-09 15:26:52
【问题描述】:
我有很多域名,例如:
site.com
ns1.site.com
ns2.site.com
test.main.site.com
google.com
mail.google.com
etc.
大约 10^9 的行数。 我搜索存储它的最佳方式并按主域查找所有子域。
例如,搜索查询是:
site.com
结果将是:
ns1.site.com
ns2.site.com
test.main.site.com
有什么办法吗?
谢谢
【问题讨论】:
-
您使用什么语言/工具?如果您安装了
grep,您可以使用grep "site.com" inputfile。 -
我正在为这项任务寻找最好的语言/工具。 Grep 对我来说太慢了。我有 ~ 10^9 行。
-
您可以使用本文中提到的技术加速 grep:stackoverflow.com/questions/13913014/…