【发布时间】:2009-06-19 02:32:34
【问题描述】:
我想为一件特定的事情构建搜索服务。这些数据可以通过免费的分类服务和许多其他网站免费获得。
是否有任何构建块,例如我可以定制的开源爬虫——而不是从头开始构建,我可以使用吗?
对构建这样的产品有什么建议吗?不仅仅是技术,还有我可能需要考虑的任何隐私/法律问题。
例如如果我从很多地方获得结果,我是否需要在结果的来源处“给予信任”并放置原始链接?
编辑:顺便说一句,我在前端使用带有 JS 的 GWT,还没有决定后端的语言。 PHP或Python。想法?
【问题讨论】:
标签: search search-engine web-crawler