【发布时间】:2018-06-07 17:25:06
【问题描述】:
我有一个非常简单的方法可以从字符串中提取名称、组织和位置。我正在为斯坦福 NLP 使用 .NET Nuget 库。它看起来像这样。
CRFClassifier Classifier = CRFClassifier.getClassifier(StanfordNLPConfig.NER.ClassifierModel);
List<IndexViewModel> ivms = new List<IndexViewModel>();
try
{
foreach (List sentence in Classifier.classify(content).toArray())
{
NLPTranslator translator = new NLPTranslator();
ivms.AddRange(translator.NERTranslate(sentence));
}
}
catch (Exception ex)
{
throw ex;
// Error silently
}
return ivms;
模型是它附带的 3class jar 文件 - english.all.3class.dissim.crf.ser.gz。
这对我来说真的很好用,但我想做的是与模型交互,以便在我需要时能够添加我自己的实体,这似乎非常以美国为中心,我想成为能够放置我自己的英国公司、地点等。
有什么方法可以添加这些实体,因为我一直在阅读有关训练它的信息,但是您可能无法扩展模型,如果是这种情况,我可以组合分类器并通过英国的分类器运行它/美国等。如果可能的话,我怎样才能真正制作自己的分类器,因为如果可能的话,我想在.NET中制作这些。
【问题讨论】:
-
我目前有同样的问题,如果我能够找到如何做到这一点,我会在这里发布,如果你在我之前找到如何回答你自己的问题,我会问。谢谢。
标签: c# .net nlp stanford-nlp named-entity-recognition