【问题标题】:Cognitive Search Indexer including all files regardless of inclusion list认知搜索索引器包括所有文件,无论包含列表如何
【发布时间】:2021-02-20 17:31:11
【问题描述】:

我的认知搜索索引设置为仅包含 Blob 存储中的 PDF 文件。但是,它也在从存储中检索其他文件。

Indexer JSON:
      "indexedFileNameExtensions": ".pdf",
      "excludedFileNameExtensions": ".csv",
      "allowSkillsetToReadFileData": true

搜索资源管理器查询返回 JSON 文件。

{
    "@odata.context": "https://.../indexes()/$metadata#docs(*)",
    "value": [
        {
            "@search.score": 7.668355,
            "content": "...\n\n",
            "metadata_storage_name": "manifest.json",
            "metadata_storage_path": 

索引器中存在一些与文件大小相关的错误,但似乎没有与此问题相关的错误。

另外,我有一个 Azure 中某个进程在 Blob 存储中创建的文件列表,但我无法确定该进程是什么。每个月的每一天都有包含 DefaultRule-AllBlobs.csv 和 manifest.json 文件的文件夹。这些来自哪里的任何想法?

【问题讨论】:

    标签: azure search indexer


    【解决方案1】:

    这些文件由Azure Storage blob inventory feature生成。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2022-07-19
      • 1970-01-01
      • 1970-01-01
      • 2021-02-14
      • 2021-12-13
      • 2017-10-04
      • 1970-01-01
      相关资源
      最近更新 更多