【问题标题】:Visualizing pdf data on kibana在 kibana 上可视化 pdf 数据
【发布时间】:2018-02-01 07:07:03
【问题描述】:

我有 ELK(Logstash、Elasticsearch、Kibana)堆栈设置工作。

使用 CSV 文件创建可视化,这些文件使用 logstash 加载到 kibana。

但是,我已经使用 elasticsearch 对 PDF、DOC 文件进行了索引,并且能够在 kibana 上查看数据并可以在其中进行搜索。但是,我需要在 kibana 上将 PDF 和 DOC 格式的文本可视化,就像最常见的单词一样。

有没有人这样做过或有想法?

提前致谢!

【问题讨论】:

  • 您在 Kibana 中尝试过可视化吗?如果您可以在 ES 中搜索文档,我认为您应该将其可视化。
  • 嗨,我必须像根据我从 PDF 文档中搜索的单词出现的单词计数一样可视化?这可能吗?
  • 我也是第一次明白你的问题。请回答我的。您是否尝试过基本的 Kibana 可视化?如果不是这样,您尝试过什么?你的进展如何?你是不是被什么地方卡住了?
  • 我已经完成了基本的可视化,在 kibana 上可视化了 csv 文件数据,但问题是 pdf 文件,这些文件是使用弹性搜索索引的,我不知道如何准确地可视化它们,假设如果我选择wordcloud 并要求显示 pdf 文件中最常用的单词,我做不到!
  • 如果您使用 kibana 并转到可视化菜单,请使用包含 pdf 数据的正确索引并在正确的字段上使用唯一计数聚合,您应该可以获得字数。如果您对此有问题,请指定 Elasticsearch 索引结构,我可以给出更准确的答案。

标签: pdf elasticsearch logstash kibana


【解决方案1】:

@MrSimple,我们看不到那里的确切格式。

{
  "test": {
    "aliases": {},
    "mappings": {
      "attachment": {
        "properties": {
          "analyzer": {
            "type": "text",
            "fields": {
              "keyword": {
                "type": "keyword",
                "ignore_above": 256
              }
            }
          },
          "field_statistics": {
            "type": "boolean"
          },
          "fields": {
            "type": "text",
            "fields": {
              "keyword": {
                "type": "keyword",
                "ignore_above": 256
              }
            }
          },
          "file": {
            "type": "text",
            "fields": {
              "keyword": {
                "type": "keyword",
                "ignore_above": 256
              }
            }
          },
          ...
}

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2017-06-21
    • 1970-01-01
    • 2020-04-04
    • 1970-01-01
    • 2016-02-07
    • 1970-01-01
    • 2017-03-08
    • 1970-01-01
    相关资源
    最近更新 更多