【问题标题】:Azure Search : Blob only Index CreationAzure 搜索:仅 Blob 索引创建
【发布时间】:2020-03-03 14:52:09
【问题描述】:

我们希望仅为 Blob 数据启用 Azure 搜索,包括其内容和标记在 Blob 上的元属性。

是否可以在不参考数据库的情况下拥有这样的索引器和索引?在这种情况下如何指定索引的字段?这些字段是否与标记在 blob 上的元属性相同?

此外,我们的某些字段可能包含来自两种不同语言的数据。是否可以在索引中添加两次相同的字段,每次都指定不同的语言分析器?

是否可以将同一个索引器关联到两个不同的索引?

是否可以指定多个存储帐户容器作为同一个索引的数据源?

理想情况下,我们希望能够做到以下几点;

  1. 在多个索引中使用相同的索引器
  2. 启用相同的索引器/索引以便能够搜索多种语言(使用语言分析器)
  3. 仅基于 Blob 及其元属性数据启用索引

【问题讨论】:

    标签: azure-cognitive-search azure-search-.net-sdk


    【解决方案1】:

    本文档主题解释了如何设置对 blob 数据的搜索:https://docs.microsoft.com/en-us/azure/search/search-howto-indexing-azure-blob-storage

    默认的dataToExtract 参数值为contentAndMetadata,这意味着所有文本内容和元数据都将被索引。您应该能够设置从元数据和内容到索引的字段映射(详细信息在同一文档主题中进行了概述)。

    索引器指向它应该输出到的索引,所以我认为不可能为多个索引重复使用同一个索引器,您必须改为复制它们。

    同样,索引器指定它从哪个数据源获取数据,因此每个索引器只有一个数据源。如果要从多个来源的数据构建索引,则需要先将数据聚合到单个来源中。

    通过为每个索引字段指定相关分析器,可以在单个索引中索引多种语言。更多细节可以在这个话题中找到:https://docs.microsoft.com/en-us/azure/search/search-language-support

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2017-09-22
      • 1970-01-01
      • 1970-01-01
      • 2018-02-09
      • 2018-04-30
      • 2016-11-22
      • 2021-05-24
      • 2023-03-11
      相关资源
      最近更新 更多