【问题标题】:Sagemaker Java client generate IOrecordSagemaker Java 客户端生成 IOrecord
【发布时间】:2018-05-18 22:17:53
【问题描述】:

我正在尝试使用线性学习器算法为 Sagemaker 构建训练集。该算法支持 recordIO 包装的 protobuf 和 csv 作为训练数据的格式。由于训练数据是使用 spark 生成的,因此我在从数据帧生成 csv 文件时遇到了问题(现在这似乎已损坏),因此我正在尝试使用 protobuf。

我设法使用 Protostuff 为训练数据集创建了一个二进制文件,Protostuff 是一个允许从 POJO 对象生成 protobuf 消息的库。问题是在触发训练作业时,我从 SageMaker 收到该消息: ClientError:未处理任何训练数据。要么是训练通道是空的,要么是小批量太大。验证训练数据是否包含非空文件,并且小批量大小小于每个训练主机的记录数。

训练文件肯定不为空。我怀疑我生成训练数据的方式不正确,因为我能够使用 libsvm 格式训练模型。有没有办法使用 Sagemaker java 客户端生成 IOrecord?

【问题讨论】:

    标签: amazon-sagemaker


    【解决方案1】:

    回答我自己的问题。这是算法配置中的一个问题。我减小了 mini batch 大小,效果很好。

    【讨论】:

      猜你喜欢
      • 2022-10-05
      • 1970-01-01
      • 2015-09-09
      • 2012-12-12
      • 1970-01-01
      • 2012-01-29
      • 2019-07-26
      • 2016-02-13
      • 1970-01-01
      相关资源
      最近更新 更多