【发布时间】:2011-06-22 20:19:42
【问题描述】:
我必须从网页和链接的其他页面中获取所有单词及其频率。我必须为此使用任何网络爬虫吗?有什么简单的开源解决方案吗?
【问题讨论】:
-
一个SEO Analyzer 可能对你有帮助。
-
解析网页并从中收集单词的方法太多了,不能局限于一个答案。
-
不值得这些反对票。这两个复合问题都很好回答。后者是主观的,但家长可以轻松挑选和推广最合适的答案。
标签: java php perl web-crawler