【发布时间】:2019-07-26 05:02:05
【问题描述】:
我使用 Watson Studio 完成了一些基本的课程作业;是否可以将二进制形式 (.bin) 的 Google Word Vectors 加载到 Watson Studio 中?
【问题讨论】:
标签: watson-studio
我使用 Watson Studio 完成了一些基本的课程作业;是否可以将二进制形式 (.bin) 的 Google Word Vectors 加载到 Watson Studio 中?
【问题讨论】:
标签: watson-studio
您当然可以在 watson studio Notebook 中读取二进制格式的文件和技术上任何类型的文件。
首先,你需要上传二进制 zip 文件
GoogleNews-vectors-negative300.bin.gz 到 watson studio 数据资产,您可以拖放到文件部分。
完成后,您可以使用project-lib 将该文件读入二进制对象。
插入项目令牌,请参阅以下文档了解如何操作。
获取文件
my_file = project.get_file("GoogleNews-vectors-negative300.bin.gz")
由于是gzip,所以需要使用gzip
import gzip
gzip_f = gzip.GzipFile(fileobj=my_file)
安装gensim !pip install gensim
导入 gensim
# Load Google's pre-trained Word2Vec model.
model = gensim.models.KeyedVectors.load_word2vec_format(gzip_f,binary=True)
【讨论】: