【发布时间】:2017-03-13 09:47:19
【问题描述】:
我在检测以小写字母开头的命名实体时遇到问题。如果我只用小写单词训练模型,那么准确率是合理的;但是,当模型使用完全大写的标记或什至小写和大写混合进行训练时,结果非常糟糕。我尝试了斯坦福 NLP 小组Class NERFeatureFactory 提供的一些功能以及各种句子,但我无法得到我期望的结果。 我面临的问题的一个例子如下:
“阿里在密歇根大学学习,现在他为我们海军工作。”
我希望模型能够识别如下实体:
- “大学”:“设施”,
- “密歇根州”:“设施”,
- “阿里”:“人”
- “我们”:“组织”
- “海军”:“组织”
如果用作训练数据的 .TSV 文件只包含小写字母,那么我可以得到上述结果,否则结果令人惊讶。
任何帮助都非常感谢。
【问题讨论】:
标签: nlp stanford-nlp named-entity-recognition