【问题标题】:where to get News summarization corpus?哪里可以获得新闻摘要语料库?
【发布时间】:2013-09-01 09:07:29
【问题描述】:

是否有公开可用的新闻+摘要语料库进行自动摘要。如果可以,能否提供一下获取途径?

【问题讨论】:

标签: nlp text-mining


【解决方案1】:

有 Open Text Summarizer,可在 Sourceforge 下载。更多想法,请查看this问题的答案。

【讨论】:

    【解决方案2】:

    您还可以在这里免费获得 Priberam Compressive Summarization Corpus,它是葡萄牙语的:

    http://labs.priberam.com/Resources/PCSC.aspx

    这个语料库包含 801 个文档,分为 80 个主题,每个主题有 10 个文档(一个有 11 个)。这些文件是葡萄牙主要报纸、广播和电视台的新闻报道。每个主题还有两个人工生成的摘要,最多 100 个单词。人工摘要具有压缩性:注释器仅执行句子和单词删除操作。

    【讨论】:

      猜你喜欢
      • 2011-08-01
      • 2011-01-22
      • 2010-10-10
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2010-10-09
      • 1970-01-01
      • 2016-05-17
      相关资源
      最近更新 更多