【发布时间】:2016-07-20 13:44:26
【问题描述】:
[更新] 在 Kentico 的帮助下,我确定问题的原因是无法在 Web 服务器本身内访问该站点。一旦我纠正了这一点,页面爬虫就可以索引内容。
[原帖] Kentico 的智能搜索页面爬虫索引存在问题。
我们的生产网站的智能搜索页面爬虫索引不起作用。自动或手动重建,没关系 - 它会运行但我们没有搜索结果,因为没有任何内容被索引。但是,它在我们的开发站点上完全按照我们的预期工作。智能搜索在两个站点中的配置完全相同。两个站点中的内容和所有 Kentico 设置完全相同。除了数据库连接字符串之外,web.config 文件是相同的。
当我在生产中运行页面爬虫时,所有页面都被爬取,但没有一个关键字被索引。我使用 Luke 工具验证了这一点。索引文件在 App_Data 文件夹中生成。
其他信息: 站点未在 Azure 上运行。 重建索引后,事件日志不会显示任何错误。 我们在爬虫设置中使用全局管理员帐户 域在爬虫设置中提供。 我尝试删除索引文件并重建它们,但没有区别。 分析器类型很简单,带有词干。 没有设置批量大小。 在 dev 和 prod 中的 Robots.txt 是相同的。
IIS 中是否有任何配置或可能阻止页面爬虫索引器工作的东西?如果这意味着什么,那么开发站点与生产站点不在同一台机器或同一网络上。
【问题讨论】: