在 kibana 上可视化 pdf 数据答案

【问题标题】：Visualizing pdf data on kibana在 kibana 上可视化 pdf 数据
【发布时间】：2018-02-01 07:07:03
【问题描述】：

我有 ELK（Logstash、Elasticsearch、Kibana）堆栈设置工作。

使用 CSV 文件创建可视化，这些文件使用 logstash 加载到 kibana。

但是，我已经使用 elasticsearch 对 PDF、DOC 文件进行了索引，并且能够在 kibana 上查看数据并可以在其中进行搜索。但是，我需要在 kibana 上将 PDF 和 DOC 格式的文本可视化，就像最常见的单词一样。

有没有人这样做过或有想法？

提前致谢！

【问题讨论】：

您在 Kibana 中尝试过可视化吗？如果您可以在 ES 中搜索文档，我认为您应该将其可视化。
嗨，我必须像根据我从 PDF 文档中搜索的单词出现的单词计数一样可视化？这可能吗？
我也是第一次明白你的问题。请回答我的。您是否尝试过基本的 Kibana 可视化？如果不是这样，您尝试过什么？你的进展如何？你是不是被什么地方卡住了？
我已经完成了基本的可视化，在 kibana 上可视化了 csv 文件数据，但问题是 pdf 文件，这些文件是使用弹性搜索索引的，我不知道如何准确地可视化它们，假设如果我选择wordcloud 并要求显示 pdf 文件中最常用的单词，我做不到！
如果您使用 kibana 并转到可视化菜单，请使用包含 pdf 数据的正确索引并在正确的字段上使用唯一计数聚合，您应该可以获得字数。如果您对此有问题，请指定 Elasticsearch 索引结构，我可以给出更准确的答案。

标签： pdf elasticsearch logstash kibana

【解决方案1】：

@MrSimple，我们看不到那里的确切格式。

{
  "test": {
    "aliases": {},
    "mappings": {
      "attachment": {
        "properties": {
          "analyzer": {
            "type": "text",
            "fields": {
              "keyword": {
                "type": "keyword",
                "ignore_above": 256
              }
            }
          },
          "field_statistics": {
            "type": "boolean"
          },
          "fields": {
            "type": "text",
            "fields": {
              "keyword": {
                "type": "keyword",
                "ignore_above": 256
              }
            }
          },
          "file": {
            "type": "text",
            "fields": {
              "keyword": {
                "type": "keyword",
                "ignore_above": 256
              }
            }
          },
          ...
}

【讨论】：