【发布时间】:2021-06-20 20:32:09
【问题描述】:
我是机器学习的新手。我从 IMDB 看到了带有电影评论的二进制分类代码。我试图对我自己的数据集使用相同的代码(其中列是“文本”:这是我的情感句子,“标签”:0 或 1)。
我想做一个词嵌入,叫word_index,类似于tf.keras.datasets.imdb.get_word_index
{'fawn': 34701, 'tsukino': 52006, 'nunnery': 52007, 'sonja': 16816, 'vani': 63951, 'woods': 1408, ...}
我尝试的是这个,但我不确定是否与 get_word_index 给出的结果相同
{k: v for k, v in enumerate(my_dataset)}
【问题讨论】:
标签: python tensorflow keras embedding