【发布时间】:2021-04-08 16:42:48
【问题描述】:
我是使用 Apache Nutch 进行网络抓取的新手,如果这是一个基本问题,我深表歉意。我已经成功安装了Apache Nutch 1.X,并与Solr集成,也进行了爬取,所以我的数据已经在Solr中被索引了。
我很想知道现在如何从 Solr 中提取这些数据。我在这里查看了文档:https://solr.apache.org/guide/6_6/exporting-result-sets.html ,我仍然不确定如何使用它。理想情况下,我希望以 JSON 格式提取数据,然后在 Python 中进行处理。谢谢
【问题讨论】: