【发布时间】:2022-03-15 03:35:40
【问题描述】:
我知道这个问题在很多地方都得到了回答,但不幸的是,没有一个提到的解决方案对我有用。所以我在这里详细说明我的挑战:
我用以下导入编写了一个本地 Python 程序,效果很好。第一次下载nltk数据后,我基本上已经把最后3行注释掉了。
import nltk
logging.info(nltk.data.path)
from nltk.stem import WordNetLemmatizer
nltk.data.path.append("/tmp")
nltk.download("wordnet", download_dir = "/tmp")
nltk.download("omw-1.4", download_dir = "/tmp")
后来我将nltk包和nltk数据复制为nltk_data,压缩并上传到架构为x86_64的lambda函数:
当我上传到 lambda 函数并测试该函数时,我收到以下错误消息:
找不到资源wordnet。
我在谷歌上搜索并尝试了不同的选项来解决这个挑战:
-
重命名 NLTK 的 data.py 中的路径
-
在 lambda 函数中创建环境变量
-
在运行 lambda 函数时尝试下载 nltk 数据。这是行不通的,因为我们无法访问互联网。
-
我已经下载了完整的 NLTK 数据并尝试了。
-
我在 AWS Lambda 中尝试过不同的 python 版本。
如果有任何我没有尝试过的选项或者我做错了什么,请告诉我。
提前感谢您的支持。
问候, 柴坦尼亚
【问题讨论】:
标签: aws-lambda nltk