【问题标题】:Dspace and SOLR configurationDspace 和 SOLR 配置
【发布时间】:2016-04-28 14:40:39
【问题描述】:

我想将ommitNorm=true 添加到标题字段。

这是错误地夸大了我们的某些标题。

但是我不知道标题字段是如何编入索引的。它的名字是什么 - 只是 dc.title?

因为在 schema.xml 中,我看不到任何关于它的内容。该字段的类型是什么,使用什么分析器或其他任何东西。有什么要知道的吗?

【问题讨论】:

    标签: solr dspace


    【解决方案1】:

    DSpace 中的大多数元数据字段都是通过动态字段处理的。这就是为什么您在搜索核心的 schema.xml 文件中看不到每个单独指定的原因。

    我不确定提升发生在哪里(或者 DSpace 是否有任何提升)。我不记得在查看 solr 日志文件时看到任何 boost 子句。我看到在SolrServiceImpl#writeDocument 中设置了一些提取参数,该文档正在被索引。看起来有一个用于提升单个字段的提取参数,也许您可​​以使用它来获得您想要的。

    如果您想查看任何 Solr 字段的字段类型,最简单的选项可能是 Solr 管理用户界面中的模式浏览器,例如 http://localhost:8080/solr/#/search/schema-browser?field=title(您可能需要使用 SSH 隧道等来访问在不同主机上运行的 Solr,因为 DSpace solr 安装通常受 IP 限制,只能从 localhost 访问)。

    【讨论】:

    • 感谢您的回答。我会看一下。但同时我不认为这是一个提升,我正在考虑的是自然场归一化。我想为标题做一些特别的事情并删除字段规范化的选项。虽然我无法弄清楚标题的动态字段(规则)。
    • 如果您弄明白了,请务必发布您自己对这个问题的答案——我敢肯定还有其他 DSpace 用户对此感兴趣。您可能也想在 dspace-tech 邮件列表中提问,也许其他人已经找到了解决方案。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2012-06-21
    • 1970-01-01
    相关资源
    最近更新 更多