【发布时间】:2021-05-24 21:20:21
【问题描述】:
我正在尝试创建一个索引和技能,让我能够
索引 pdf、多页和单页以及所有其他类型的文件, 提取数据并使其可搜索,
搜索“猫”字词,并在其中显示该字词的部分文本,以及找到该字词的 PDF/图像的页码和文档名称/可下载 URL、边界框、会很好,但不是必需的。
我正在苦苦挣扎,我尝试过文本提取技能、OCR 技能,但我正在苦苦挣扎,因为搜索词返回整个提取的文档(100 页),作为文件“内容”中的文本
这对我来说没有多大意义,JFK 的例子已经过时了。
我在这上面花了 4 天,没那么难,文档也没那么有用。
我已使用门户工具绑定到“构建”、索引和技能组,但得到了类似的结果。
任何帮助将不胜感激。
【问题讨论】:
标签: azure azure-cognitive-search azure-cognitive-services