【问题标题】:Kentico Smart Search page crawler not workingKentico 智能搜索页面爬虫无法正常工作
【发布时间】:2016-07-20 13:44:26
【问题描述】:

[更新] 在 Kentico 的帮助下,我确定问题的原因是无法在 Web 服务器本身内访问该站点。一旦我纠正了这一点,页面爬虫就可以索引内容。

[原帖] Kentico 的智能搜索页面爬虫索引存在问题。

我们的生产网站的智能搜索页面爬虫索引不起作用。自动或手动重建,没关系 - 它会运行但我们没有搜索结果,因为没有任何内容被索引。但是,它在我们的开发站点上完全按照我们的预期工作。智能搜索在两个站点中的配置完全相同。两个站点中的内容和所有 Kentico 设置完全相同。除了数据库连接字符串之外,web.config 文件是相同的。

当我在生产中运行页面爬虫时,所有页面都被爬取,但没有一个关键字被索引。我使用 Luke 工具验证了这一点。索引文件在 App_Data 文件夹中生成。

其他信息: 站点未在 Azure 上运行。 重建索引后,事件日志不会显示任何错误。 我们在爬虫设置中使用全局管理员帐户 域在爬虫设置中提供。 我尝试删除索引文件并重建它们,但没有区别。 分析器类型很简单,带有词干。 没有设置批量大小。 在 dev 和 prod 中的 Robots.txt 是相同的。

IIS 中是否有任何配置或可能阻止页面爬虫索引器工作的东西?如果这意味着什么,那么开发站点与生产站点不在同一台机器或同一网络上。

【问题讨论】:

    标签: search indexing kentico


    【解决方案1】:

    您是否尝试在爬虫设置中将域更改为 localhost:80?

    【讨论】:

    • 我试过了,索引器没有索引任何内容。感谢您的建议。
    【解决方案2】:

    您是否直接在生产站点上创建索引?如果没有,并且您从 dev 同步了它,那么尝试在生产机器上配置一个新的索引器。另外,请通过Settings --> System --> Search --> Enable Smart Search Indexing查看生产站点。

    【讨论】:

    • 我继续在 prod 框上创建了一个新的索引器,并确认启用了智能搜索索引。它仍然无法正常工作。索引器确实运行了,生成的索引信息表明我想要索引的页面已被索引,但不知何故关键字不在索引中。
    • 其他字段是否被索引?如果是这样,那么它可能是文档类型。在您的产品框中,检查 Page Types --> [YourPageType] --> Search Fields --> Keywords 以查看是否检查了 ContentTokenized。如果没有,则检查它们并重建索引。
    • 由于我使用的是 Page Crawler 索引器,因此不使用搜索字段。我必须使用 Page Crawler 索引,因为大多数页面的内容是由 Web 部件使用内容树中其他地方的数据源生成的。无论如何,我发现了问题并在原始帖子中发布了修复程序。再次感谢!
    猜你喜欢
    • 2020-08-23
    • 2017-11-07
    • 2014-10-04
    • 1970-01-01
    • 2019-04-29
    • 2023-03-26
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多