【发布时间】:2012-07-18 08:02:03
【问题描述】:
我正在同时寻找文本和语音(转录)中英语新闻领域的命名实体标记语料库。如果有人有任何关于语料库的信息,请将链接发给我。
谢谢 卡达卡
【问题讨论】:
我正在同时寻找文本和语音(转录)中英语新闻领域的命名实体标记语料库。如果有人有任何关于语料库的信息,请将链接发给我。
谢谢 卡达卡
【问题讨论】:
我发现Open American National Corpus 非常有用。他们确实提供了包含新闻文本和转录语音的named-entity tagged portion,但请注意,它是使用 BBN NE 标记器标记的,而不是一群人。不过,我在使用这种语料库引导其他模型时取得了不错的结果。
祝你好运。我很想知道你的结果。
【讨论】: