【发布时间】:2016-05-10 11:30:02
【问题描述】:
我需要一个替代谷歌自定义搜索的网站来管理我的网站,它必须能够抓取网站、索引它、允许调整优先级,然后允许通过 REST 或类似的东西进行搜索查询并返回 XML或 JSON 等。它需要在 Windows Server 实例上运行。
所以,我已经开始使用http://www.opensearchserver.com/ 并运行它似乎可以解决问题,但是对于我的一生来说,无法弄清楚如何在结果中获取缩略图?我已经搜索了文档并阅读了我能阅读的所有内容,但无法找到如何执行此操作(或如何理解它)。
我正在抓取标准网页,它们都有缩略图元数据,我假设应该能够以某种方式解析结果并包含在 JSON 结果中?
任何指针都会非常有帮助,谢谢!
【问题讨论】:
标签: search web-crawler open-search-server