【问题标题】:Text summarization using deep learning techniques使用深度学习技术的文本摘要
【发布时间】:2014-05-19 04:53:35
【问题描述】:

我正在尝试总结属于法律领域的文本文档。

我指的是关于如何实施深度学习架构的网站 deeplearning.net。我已经阅读了很多关于文档摘要(单文档和多文档)的研究论文,但我无法弄清楚每个文档的摘要是如何生成的。

一旦训练完成,网络就会在测试阶段稳定下来。因此,即使我知道在训练阶段学习的一组特征(我已经弄清楚了),在测试期间也很难找出每个特征的重要性(因为网络的权重向量是稳定的)我将尝试为每个文档生成摘要的阶段。

我试图解决这个问题很长时间,但徒劳无功。

如果有人对此进行过研究或对此有任何想法,请给我一些指示。我真的很感谢你的帮助。谢谢。

【问题讨论】:

标签: python theano summarization deep-learning


【解决方案1】:

我认为你需要更具体一点。当您说“我无法弄清楚每个文档的摘要是如何生成的”时,您的意思是您不知道如何解释学习到的特征,还是不理解算法?此外,“深度学习技术”涵盖了非常广泛的模型——您实际尝试使用哪一个?

在一般情况下,深度学习模型不会学习人类可解释的特征(尽管您当然可以尝试寻找给定输入与模型中相应激活之间的相关性)。所以,如果这就是你要问的,那真的没有好的答案。如果您在理解您使用的模型时遇到困难,我可能会帮助您:-) 让我知道。

【讨论】:

  • 我正在使用深度信念网络。该算法基本上微调了特征向量,我只会有那些在某种意义上对算法很重要的东西(就像你说的那样,它对人类可能没有意义)。在训练网络之后,我有一组基本上是一元组(单词)的特征,但我需要找到一种方法来使用这些特征为每个文档生成摘要。我该怎么做是我的问题。
【解决方案2】:

这是一个blog series,从一开始就详细讨论了文本摘要的工作原理,最近的研究使用了基于 seq2seq 深度学习的模型,这个博客系列从解释这种架构开始,直到达到最新的研究方法

另外这个repo收集了构建文本摘要模型的多个实现,它在google colab上运行这些模型,并将数据托管在google drive上,所以无论你的计算机有多强大,你都可以使用google colab,它是一个免费的系统来训练你的深度模型

如果您想查看实际的文本摘要,可以使用此free api

我真的希望这会有所帮助

【讨论】:

  • 我在 2014 年解决了这个问题 :) 在那之后发生了很多事情。不过感谢您的回复!
猜你喜欢
  • 2013-11-07
  • 2017-09-24
  • 2015-01-16
  • 2015-04-21
  • 1970-01-01
  • 2021-06-17
  • 1970-01-01
  • 1970-01-01
  • 2011-05-27
相关资源
最近更新 更多