【发布时间】:2022-01-28 17:28:03
【问题描述】:
我想从一系列标记中生成生成 n-grams:
bigram:: "1 3 4 5" --> { (1,3), (3,4), (4,5) }
搜索后发现this线程使用:
def find_ngrams(input_list, n):
return zip(*[input_list[i:] for i in range(n)])
如果我在训练期间使用这段代码,我认为它会影响性能。所以我在寻找更好的选择。
【问题讨论】:
标签: machine-learning tensorflow deep-learning keras