【发布时间】:2016-04-28 14:40:39
【问题描述】:
我想将ommitNorm=true 添加到标题字段。
这是错误地夸大了我们的某些标题。
但是我不知道标题字段是如何编入索引的。它的名字是什么 - 只是 dc.title?
因为在 schema.xml 中,我看不到任何关于它的内容。该字段的类型是什么,使用什么分析器或其他任何东西。有什么要知道的吗?
【问题讨论】:
我想将ommitNorm=true 添加到标题字段。
这是错误地夸大了我们的某些标题。
但是我不知道标题字段是如何编入索引的。它的名字是什么 - 只是 dc.title?
因为在 schema.xml 中,我看不到任何关于它的内容。该字段的类型是什么,使用什么分析器或其他任何东西。有什么要知道的吗?
【问题讨论】:
DSpace 中的大多数元数据字段都是通过动态字段处理的。这就是为什么您在搜索核心的 schema.xml 文件中看不到每个单独指定的原因。
我不确定提升发生在哪里(或者 DSpace 是否有任何提升)。我不记得在查看 solr 日志文件时看到任何 boost 子句。我看到在SolrServiceImpl#writeDocument 中设置了一些提取参数,该文档正在被索引。看起来有一个用于提升单个字段的提取参数,也许您可以使用它来获得您想要的。
如果您想查看任何 Solr 字段的字段类型,最简单的选项可能是 Solr 管理用户界面中的模式浏览器,例如 http://localhost:8080/solr/#/search/schema-browser?field=title(您可能需要使用 SSH 隧道等来访问在不同主机上运行的 Solr,因为 DSpace solr 安装通常受 IP 限制,只能从 localhost 访问)。
【讨论】: