【发布时间】:2022-01-09 07:34:57
【问题描述】:
如何将 Stanza 导出为 ONNX 格式? 简单地训练模型似乎是不可能的。
【问题讨论】:
标签: machine-learning nlp onnx onnxruntime stanza
如何将 Stanza 导出为 ONNX 格式? 简单地训练模型似乎是不可能的。
【问题讨论】:
标签: machine-learning nlp onnx onnxruntime stanza
这里有解释:https://pytorch.org/tutorials/advanced/super_resolution_with_onnxruntime.html
我在https://github.com/vivkvv/stanza 为这个实验从节创建了一个分支。另请参阅我的提交 https://github.com/vivkvv/stanza/commits?author=vivkvv。
我使用 pipeline_demo.py 进行测试。我添加的主要内容是位于第 77 行下方的 models/tokanization/trainer.py 中的代码
pred = self.model(units, features)
由于解释,我添加了
torch.onnx.export(
self.model,
(units, features),
onnx_export_file_name,
opset_version=9,
export_params=True,
do_constant_folding=True,
input_names=['input'],
output_names=['output'],
dynamic_axes={
'input': {0: 'batch_size'},
'output': {0: 'batch_size'}
}
)
它适用于标记化。但同样不适用于例如pos 或 lemmatizer(参见我对 PartOfSpeech 的提交)。对于不同的 opset_version,我会得到不同的错误。
我在 github/stanza 上创建了一个问题,你可以在那里看到 https://github.com/stanfordnlp/stanza/issues/893
【讨论】: