【发布时间】:2021-07-19 17:20:22
【问题描述】:
我目前正在研究 fastText 无监督学习。我想澄清一些出现在 fastText 文档中的上下文窗口。
在用于训练 fastText 模型的 python https://github.com/facebookresearch/fastText/tree/master/python 的 fasttext 库的描述中有不同的参数,其中一个参数是,
- ws:上下文窗口的大小
我的输入文件包含带有 2 - 3 个标记的行。
例如,
- 高级数据库管理员
- 高级 DotNet 程序员
- 网络管理员
- 首席程序员(大型机)
默认窗口大小 5。在这里,在上面的示例中,我有标记计数小于窗口大小的行。如果窗口大小大于文档长度会怎样?
【问题讨论】:
标签: fasttext