【发布时间】:2018-02-01 07:07:03
【问题描述】:
我有 ELK(Logstash、Elasticsearch、Kibana)堆栈设置工作。
使用 CSV 文件创建可视化,这些文件使用 logstash 加载到 kibana。
但是,我已经使用 elasticsearch 对 PDF、DOC 文件进行了索引,并且能够在 kibana 上查看数据并可以在其中进行搜索。但是,我需要在 kibana 上将 PDF 和 DOC 格式的文本可视化,就像最常见的单词一样。
有没有人这样做过或有想法?
提前致谢!
【问题讨论】:
-
您在 Kibana 中尝试过可视化吗?如果您可以在 ES 中搜索文档,我认为您应该将其可视化。
-
嗨,我必须像根据我从 PDF 文档中搜索的单词出现的单词计数一样可视化?这可能吗?
-
我也是第一次明白你的问题。请回答我的。您是否尝试过基本的 Kibana 可视化?如果不是这样,您尝试过什么?你的进展如何?你是不是被什么地方卡住了?
-
我已经完成了基本的可视化,在 kibana 上可视化了 csv 文件数据,但问题是 pdf 文件,这些文件是使用弹性搜索索引的,我不知道如何准确地可视化它们,假设如果我选择wordcloud 并要求显示 pdf 文件中最常用的单词,我做不到!
-
如果您使用 kibana 并转到可视化菜单,请使用包含 pdf 数据的正确索引并在正确的字段上使用唯一计数聚合,您应该可以获得字数。如果您对此有问题,请指定 Elasticsearch 索引结构,我可以给出更准确的答案。
标签: pdf elasticsearch logstash kibana