【发布时间】:2017-03-25 11:00:58
【问题描述】:
我想用更多适合我用例的数据来训练现有的 Stanford core-nlp 的 english-left3words-distsim.bin 模型。我想为 run 之类的某些词分配自定义标签将是 COMMAND。
我在哪里可以获得训练数据集?我可以关注model training
【问题讨论】:
标签: stanford-nlp
我想用更多适合我用例的数据来训练现有的 Stanford core-nlp 的 english-left3words-distsim.bin 模型。我想为 run 之类的某些词分配自定义标签将是 COMMAND。
我在哪里可以获得训练数据集?我可以关注model training
【问题讨论】:
标签: stanford-nlp
大部分是 WSJ Penn Treebank 的第 0-18 节。
链接:https://catalog.ldc.upenn.edu/ldc99t42
我们有一些额外的数据集没有分发,我们添加到 WSJ 数据中。
【讨论】: