【发布时间】:2014-12-16 04:21:21
【问题描述】:
我将OpenNLP 用于Name Entity Recognition(NER)。他们有自己的模型here。但是他们的NER域不适合myone。所以用这段代码训练了我自己的模型
FileReader fileReader = new FileReader("res/review_train");
ObjectStream fileStream = new PlainTextByLineStream(fileReader);
ObjectStream sampleStream = new NameSampleDataStream(fileStream);
TokenNameFinderModel model = NameFinderME.train("pt-br", "train", sampleStream, Collections.<String, Object>emptyMap());
nfm = new NameFinderME(model);
这里review_train 是包含训练文本的文本文件。问题 是每次我运行时都需要花费太多时间来训练数据。有没有办法保存这个训练好的模型并重复使用它?
【问题讨论】:
-
您是否正在通过 openNLP 向现有模型添加新的训练?