【问题标题】:TPU RetinaNet - TypeErrorTPU RetinaNet - 类型错误
【发布时间】:2019-12-12 00:08:32
【问题描述】:

我创建了我的数据集并转换为 COCO。 RetinaNet 已安装在 TPU(官方)中。我想用这个 RetinaNet 用我自己的数据集训练一个模型,但总是遇到同样的错误。

export MODEL_DIR=${STORAGE_BUCKET}/retinanet-train-eval; \
export RESNET_CHECKPOINT=gs://cloud-tpu-artifacts/resnet/resnet-nhwc-2018-10-14/model.ckpt-112602; \
export TRAIN_FILE_PATTERN=${STORAGE_BUCKET}/coco/coco_train*; \
export EVAL_FILE_PATTERN=${STORAGE_BUCKET}/coco/coco_val*; \
export VAL_JSON_FILE=${STORAGE_BUCKET}/coco/instances_val.json; \
export EVAL_SAMPLES=613 \
export NUM_STEPS_PER_EVAL=868

python /usr/share/tpu/models/official/detection/main.py \
--use_tpu=True \
--tpu="${TPU_NAME?}" \
--num_cores=8 \
--model_dir="${MODEL_DIR?}" \
--mode="train_and_eval" \
--params_override="{
  type: retinanet,
  train: {
    checkpoint: {
      path: $ {
        RESNET_CHECKPOINT ?
      },
      prefix: resnet50 /
    },
    train_file_pattern: $ {
      TRAIN_FILE_PATTERN ?
    }
  },
  eval: {
    val_json_file: $ {
      VAL_JSON_FILE ?
    },
    eval_file_pattern: $ {
      EVAL_FILE_PATTERN ?
    },
    eval_samples: $ {
      EVAL_SAMPLES ?
    },
    num_steps_per_eval: $ {
      NUM_STEPS_PER_EVAL ?
    }
  }
}"

使用这些设置我收到此错误...

【问题讨论】:

    标签: google-compute-engine google-cloud-tpu tpu


    【解决方案1】:

    这不是一条非常明确的错误消息,但一个可能的原因是您的 TPU 名称不正确。请验证您的 TPU 名称是否有效。

    【讨论】:

    • @Dharman:这不只是一个表达为问题的答案吗?这可以改写为“这可能是由于 TPU 名称不正确造成的;请验证名称是否正确。”我已经编辑了答案以帮助澄清这是一个建议,而不是“我也是”风格的评论。
    • 我不确定这个问题是否仍然存在,但我知道名称是正确的。我可能已经尝试了一切,在这个过程中,TPU 吃掉了我所有的钱。所以,我现在不能尝试。
    【解决方案2】:

    该问题应该使用最新的 Tensorflow 2.x Retinanet 模型解决,如果仍然出现错误,请尝试并评论: https://cloud.google.com/tpu/docs/tutorials/retinanet-2.x

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2021-03-30
      • 2019-05-06
      • 2021-01-05
      • 1970-01-01
      • 2019-12-05
      • 1970-01-01
      • 2023-03-13
      • 2019-03-30
      相关资源
      最近更新 更多