【问题标题】:How to index azure blob custom metadata fields to Azure search如何将 Azure Blob 自定义元数据字段索引到 Azure 搜索
【发布时间】:2019-12-18 10:49:20
【问题描述】:

我试图将 blob 内容索引到 Azure 搜索。我通过 blob 索引器将 blob 内容添加到搜索索引中。

我正在使用 MongoDB 来存储上传的文件信息以及 blob 路径。我们必须向存储在 MongoDB 中的文件添加一些标签。现在我想将这些标签与文件内容一起添加到 Azure 搜索该文件中。

我面临的问题是,

问题 1: 保持 MongoDB 记录和 blob 索引器之间的唯一性(搜索关键字字段)。最初,我想使用来自 blob 索引器的 metadata_storage_path 和存储在 MongoDB 中的 base64 编码 blob 路径。但问题是它永远不会匹配来自我的 node.js 的 metadata_storage_path 和 base64 编码的 blob 路径。

问题 2: 为了解决问题 1,我采用了另一种方法,将我的 MongoDB 文件 ID(FID)作为自定义元数据字段存储到 Blob 中以获得唯一性(搜索关键字字段)用于搜索索引和 mongoDB 记录。这里的问题是如何将自定义元数据字段映射到关键字段?我无法为 blob 自定义元数据字段编制索引。

在这两种情况下,我都无法达到预期的效果。如何实现MongoDB和Azure Blob之间的搜索索引键字段?

【问题讨论】:

  • 在mongodb文档中添加blob路径即可?
  • @Thomas 我的问题 1 解释相同。我添加了 blob 路径,在关联 base64 编码的 blob 路径时,它与 metadata_storage_path 不同
  • MongoDB 中存储的 blob 路径是 base64 编码还是纯文本?您的 node.js 编码功能是否与此处的任何选项匹配 (docs.microsoft.com/en-us/azure/search/…)?
  • 它被存储为纯文本。
  • 您还可以使用field mappingsmetadata_storage_path 字段“分叉”到索引中的新编码字段中。

标签: mongodb azure azure-cognitive-search azure-blob-storage


【解决方案1】:

您可以使用 base64 编码的 blob 路径作为文档键,您可以通过使用 base64 字段映射在两个索引器中获取它。检查 https://docs.microsoft.com/en-us/azure/search/search-indexer-field-mappings#base64EncodeFunction 以获取与您的 node.js 编码函数匹配的所有选项。

【讨论】:

    猜你喜欢
    • 2020-06-15
    • 1970-01-01
    • 1970-01-01
    • 2018-03-10
    • 2023-03-28
    • 1970-01-01
    • 2017-09-22
    • 2020-03-03
    • 1970-01-01
    相关资源
    最近更新 更多