【问题标题】:Where can I find a list of class labels for pretrained SparkNLP NerDLModel?在哪里可以找到预训练 SparkNLP NerDLModel 的类标签列表?
【发布时间】:2018-12-10 03:50:33
【问题描述】:

我已经搜索了一段时间,但没有找到预训练的 NerDL(tensorflow) 模型中包含哪些 NER 标签。我认为训练数据可以提供这样的信息,但我没有在任何文档中看到它。

可下载模型: https://s3.amazonaws.com/auxdata.johnsnowlabs.com/public/models/ner_precise_en_1.7.0_2_1539623388047.zip

任何方向都将不胜感激!

更新:

我确实按照此处的建议在 SparkNLP github 中提交了一个问题 :) 我刚收到他们的回复。答案如下:

出于实际目的,预训练的 NER 模型具有

B-ORG

I-ORG

B-PER

I-PER

B-LOC

I-LOC

并且它已经从以下位置训练: https://raw.githubusercontent.com/patverga/torch-ner-nlp-from-scratch/master/data/conll2003/eng.train

请参阅原始问题here

【问题讨论】:

    标签: tensorflow johnsnowlabs-spark-nlp


    【解决方案1】:

    该模型是在 CONLL2003 数据集上为 NER 训练的,

    http://aclweb.org/anthology/W03-0419

    该数据集基本上包含 PERSON、ORGANIZATION 和 LOCATION。

    希望这会有所帮助, 阿尔贝托。

    【讨论】:

    • 嗨 AlbertoAndreotti,是否有任何文档提到 NerDLModel.pretrained() 是使用本文讨论的数据集进行训练的?我在任何地方都找不到它,只是想确定一下。 (我确实在Named Entity Recognition Deep Learning annotator 下看到了CoNLL 2003 IOB NER file,但这并不能真正确认预训练版本来自该数据集)
    • 这是真的,他们没有提到。我建议你向 github 项目提交一个问题,以便澄清细节。
    猜你喜欢
    • 1970-01-01
    • 2017-07-24
    • 1970-01-01
    • 2020-10-10
    • 2019-05-20
    • 2020-11-17
    • 2016-09-07
    相关资源
    最近更新 更多