【发布时间】:2021-10-16 01:01:12
【问题描述】:
我有一个corpus object,我将其转换为tokens object。然后我过滤了这个对象以删除单词并统一它们的拼写。 对于我进一步的工作流程,我再次需要一个语料库对象。如何从令牌对象构造它?
【问题讨论】:
-
你需要一个“标记化的语料库对象”是什么意思?如果您将标记对象转换为语料库,那么它将不再被标记。
-
谢谢,我的错误 - 我需要一个语料库对象,然后使用 corpus_reshape 进行转换。