【问题标题】:Is there an open source tool based on perl or python to generate the summary of mindmap of documents [closed]是否有基于perl或python的开源工具来生成文档的思维导图摘要[关闭]
【发布时间】:2011-01-19 19:17:27
【问题描述】:

我真的在寻找一个工具包或现成的工具,它可以解析给定的文档,然后生成一个简短的摘要,更好地为文档的思维导图。我知道 Python 有 ntlk,而 perl 有很多模块可以帮助进行自然语言解析等。 编写一个工具来做到这一点甚至是可行的,使用类似 ntlk 的工具包,但时间不够。如果您知道一些此类工具或有一些指向此类工具的指针,如果您可以将其发布在这里,将不胜感激,并提前致谢。

【问题讨论】:

    标签: python perl nlp


    【解决方案1】:

    某人(在这里)已经有written it for youdiscussion)。另一个选项是TexLexAn(文本分析器分类器汇总器)。

    【讨论】:

      【解决方案2】:

      Google 的人可能已经在做这样的事情了。 ;-)

      如果我说得对,您需要一个工具,它可以为您阅读一本书,然后为您简要总结其中的内容,这样您就可以抽出时间自己阅读。也许您对内容不感兴趣,而是想对材料进行分类,例如作为图书管理员。

      对于非常结构化的文本,在非常专业的领域中包含许多非常相似的文档(例如论文的数学证明或实验结果或医学报告),这在技术上可能是可行的。当然,有一种工具可以区分小说和电话簿,从而对文学作品进行粗略分类。显然,提供页数或字数、识别书面语言等非常容易,因为这些参数可以明确定义。

      不过,可以肯定的是,计算机在尝试掌握实际故事时会失败,无论是对话式的还是随意的。因此,要决定谁是好人,谁是坏人,或者手头的作品是一部以侦探为主角的爱情小说,还是一部侦探爱上某人的犯罪惊悚片,机器将没有机会决定什么是什么。可行的内存量、CPU 能力和知识数据库。

      如果您能更具体地说明您想要使用此工具的实际目的,也许会有所帮助。

      【讨论】:

      • 感谢您的回复。实际上,我目前对解析生物信息学和基因组学领域的文档/论文更感兴趣,所以如果我们可以这样说,该领域是“受限制的”:-)。目前我正在寻找一个简单的实用程序,它将对内容进行简单的解析并以树的方式生成文档的地图。随着时间的推移,我可以为它提供一个短语列表,或者应该被认为是相关的单词等。如果没有出现,我可能不得不把一些东西放在一起。
      猜你喜欢
      • 2014-11-10
      • 2011-08-21
      • 1970-01-01
      • 2011-06-26
      • 1970-01-01
      • 2013-11-27
      • 1970-01-01
      • 2010-11-06
      • 1970-01-01
      相关资源
      最近更新 更多