【发布时间】:2019-10-28 09:41:36
【问题描述】:
我正在尝试运行涉及使用 NLTK 的 Google 云功能。我添加了 文本块 == 0.15.3 nltk == 3.4.3 到requirement.txt。但是每次我运行脚本时它都会崩溃,并且日志显示“请使用 NLTK 下载器获取资源:”。
我知道我们需要下载 NLTK 语料库才能在本地系统中运行脚本。但不确定如何在 Google Cloud Functions 中下载它。任何帮助将不胜感激。提前致谢。
【问题讨论】:
-
Akhil 你能分享一下你是如何解决这个问题的吗?我面临同样的问题。正确答案似乎没有抓住您面临的问题,因为您无法在云功能上以交互方式下载任何内容。
-
Mkey,因为我只需要使用文本 blob,我只需要下载 2 个语料库而不是整个语料库。所以我在脚本开头特别提到了 nltk.download('brown') 。最初它会减慢我的脚本速度(比如冷启动),但我能够使用它。另一种选择是将其部署在基本计算引擎而不是云功能中。希望这会有所帮助
-
我居然解决了。答案是,至少在我的情况下,您需要像
nltk.download("twitter_samples", download_dir = "/nltk_data")一样下载它;) -
很高兴知道这一点。如果可能,请将其添加为答案,以帮助其他面临相同问题的开发人员。
标签: python-3.x google-cloud-platform google-cloud-functions google-cloud-storage nltk