【问题标题】:Azure Search for SQL Server Blob ColumnAzure 搜索 SQL Server Blob 列
【发布时间】:2018-02-12 19:46:47
【问题描述】:

我在 Azure SQL Server 上有一个表 [Assets],其中包含列(Id、Name、Owner、Asset)。 [Asset] 列是存储 PDF 文件的 varbinaryblob 类型。

我想使用 Azure 搜索来搜索此列的内容。目前 Azure 搜索可以直接与 Blob 存储一起使用,也可以专门用于表存储,但是我无法找到适合我的方案的解决方案,非常感谢任何方法方面的帮助。

【问题讨论】:

  • 有趣!您是否也考虑过“只是”将文档上传到 Azure 搜索?这将对您当前的设计产生一些影响,但可能更容易使用。

标签: azure azure-sql-database azure-blob-storage azure-cognitive-search


【解决方案1】:

您是否可以创建 SQL VM,将 SQL Azure 上的数据与具有 SQL Data Sync 的 VM 同步,然后按照 here 的说明将 SQL VM 上的数据与 Azure 搜索同步?

另一种选择是将 SQL Azure 数据库移动到 Azure 上的 SQL VM,然后按照 here 的说明将 SQL VM 上的数据与 Azure 搜索同步。

希望这会有所帮助。

【讨论】:

  • 这个答案似乎并没有真正回答这个问题。
  • 同意@Eugene Shvets - MSFT。提供的答案是一种通用搜索方法,我正在寻找替代方法来搜索原始类型的列数据和 varbinary 字段
【解决方案2】:

Azure 搜索 SQL 索引器不支持从 varbinary/blob 列中提取文档。

一种方法是将文件数据上传到 Azure blob 存储,然后使用Azure Search blob indexer

另一种方法是使用 Apache Tika 或 iTextSharp 从代码中的 PDF 中提取文本,然后使用 Azure 搜索对其进行索引。

【讨论】:

  • 为了扩展 Eugene 所说的内容,您可以尝试这样做的一个选项是使用 Azure Functions。在Azure Functions here 中有一个如何使用 Tika 进行此 PDF 解析的示例。在此示例中,它从 Blob 存储中获取 PDF,但您可以将其切换为从 SQL 中获取。
  • 感谢尤金、利亚姆的回复。
  • 感谢@Eugene Shvets - MSFT,Liam 的回复。如果以下方法可行,请告诉我,我将继续使用 Azure Blob 存储并利用元数据字段来列出 SharePoint 上的字段。 Azure 搜索可以同时搜索元数据和内容,从而解决了我的问题。这种方法有什么缺点吗?
  • 尝试一下,如果您遇到任何问题,请告诉我们。
猜你喜欢
  • 2016-08-14
  • 1970-01-01
  • 1970-01-01
  • 2016-11-22
  • 2015-08-02
  • 2017-09-22
  • 2020-03-03
  • 1970-01-01
  • 2020-01-02
相关资源
最近更新 更多