【问题标题】:import torch not defined on gcp导入火炬未在 gcp 上定义
【发布时间】:2026-02-24 06:50:01
【问题描述】:

尝试在 GCP 上运行“import torch”。

我收到了ModuleNotFoundError: No module named 'torch'的消息

尝试创建具有以下属性的新集群(通过 api,而不是终端):

dataproc->conda.packages->pytorch==1.7.1,visions==0.7.1

dataproc->pip.packages->tokenizers==0.10.1,datasets==1.5.0

集群创建超时,未创建。 即使尝试过也会发生同样的情况

dataproc -> conda.packages -> pytorch==1.7.1

尝试使用以下命令手动在 master 上安装 conda:

conda install -c pytorch pytorch

差不多一个小时后,我得到了:

Collecting package metadata (current_repodata.json): done
Solving environment: failed with initial frozen solve. Retrying with flexible solve.
Solving environment: failed with repodata from current_repodata.json, will retry with next repodata source.
Collecting package metadata (repodata.json): done
Solving environment -/

感谢任何帮助或建议 即,除了手电筒我还需要: 从变形金刚导入 LongformerModel、LongformerTokenizer 从模型导入 RedditModel

【问题讨论】:

标签: python torch google-cloud-dataproc


【解决方案1】:

您只需要使用更新/最新的PyTorch version available in conda-forge channel(现在是 1.8.0):

gcloud dataproc clusters create ${CLUSTER_NAME} \
  --image-version=2.0 \
  --region=${REGION} \
  --properties='^#^dataproc:conda.packages=pytorch==1.8.0,torchvision==0.9.0'

【讨论】:

  • 感谢您的帮助。现在可以正常使用了。
【解决方案2】:

尝试使用 conda forge,而不是使用 conda install。那应该行得通。 https://anaconda.org/conda-forge/pytorch

【讨论】: