【发布时间】:2020-04-23 23:37:29
【问题描述】:
我有一个如下所示的文本序列列表:
sequences = [
['okay', ''],
['ahead', 'fred', ''],
['i', 'dont', 'remember', 'you', 'want', 'to', 'go', ''],
['um', ''],
['let', 'me', 'think', '']
]
我想为每个序列创建一个热向量,用于计算列表中某些单词的出现次数。要查找的单词列表在这里:
keywords = ['i', 'you', 'we']
最终,我想遍历每个文本序列并返回以下内容(其中 0 表示关键字不存在,1 表示存在):
seq_to_vec = [
[0,0,0],
[0,0,0],
[1,1,0],
[0,0,0],
[0,0,0]
]
我该怎么做?
【问题讨论】: