【问题标题】:Index my own data in Solr在 Solr 中索引我自己的数据
【发布时间】:2012-06-15 22:35:25
【问题描述】:

我是 Solr 的新手,有几个问题想向更有经验的人寻求帮助:

  1. 我可以让示例运行,但是 start.jar 到底是什么?

  2. 我知道通过运行“java -jar start.jar”,我可以启动 solr。但是我是否在索引我自己的数据而不是给定的样本数据之后运行这个命令?如果没有,我应该怎么做才能使用我自己的索引数据运行我自己的 solr 实例?

  3. 我确实需要索引我自己的示例数据,与给定的示例 solr 事物完全无关。我应该怎么做?我应该复制示例目录然后修改 sechema.xml 中的字段吗?然后我应该像设置示例 solr 那样运行 post.sh 来索引数据吗?

非常感谢您的帮助!

【问题讨论】:

    标签: solr indexing


    【解决方案1】:

    步骤:

    1. 决定在 SOLR 中存储的文档结构是什么。 (有点像为一个表创建关系数据库的架构)。
    2. 删除示例核心并使用该架构创建您自己的核心
    3. 一旦架构正常工作且没有错误(您检查托管 SOLR 应用程序的服务器日志),您就可以开始将您拥有的数据提供给 SOLR。您通过 HTTP 以 SOLR Wiki 中记录的特定结构发布它。各种框架都有一些类来处理这个问题。

    标记为 Wiki,因为这对于那些不关心 RTFM 的人来说过于宽泛...

    【讨论】:

    • 非常感谢您的快速回复!我想从一个非常简单的东西开始,一个文本文件,每行包含 (id, name, value) 对。示例:1001 Title Professor,1001 Name Jenny,1001 Latitude -122,1001 Longitude 34。我将从索引和标记名称字段开始。根据您提供的步骤,我仍有疑问(请多多包涵)。 (1)删除示例核心是什么意思?你指的是哪个目录? (2)你能指出我提到如何发布数据的维基吗?
    【解决方案2】:

    亲爱的自定义索引并不是一项艰巨的任务,因为我在几天前就开始研究它。首先,您需要根据您的 schema.xml 编写包含字段的文档是 xml、csv 或 json(solr 支持的格式),然后在 example/exampledocs 中运行以下命令

    对于文档 mydoc.xml

    ./post.sh mydoc.xml

    如果在输出中,状态值为 0,则索引成功,您可以在 solr 中搜索您的文档

    参考:http://www.solrtutorial.com/solr-in-5-minutes.html

    【讨论】:

      【解决方案3】:

      虽然这个问题很老,但我正在为有同样问题的新访客写信。这个问题不是几句话就能回答的。您必须了解 Solr 是什么,Solr Admin UI 是什么,为什么我们需要 Solr 而不是关系数据库。然后您可以了解如何导入示例数据。最近发表了 Solr Introduction 和 Importing Sample Data 两篇文章,希望对你有所帮助。

      http://www.devtrainings.com/2017/03/apache-solr-introduction-and-server.html

      http://www.devtrainings.com/2017/03/apache-solr-index-data-and-run-search.html

      【讨论】:

        猜你喜欢
        • 2018-11-30
        • 2011-09-21
        • 2012-09-25
        • 2013-03-03
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2019-11-27
        相关资源
        最近更新 更多