【发布时间】:2018-09-25 04:15:18
【问题描述】:
我有一个 tf.data.Dataset 实例,它拥有 3 个不同的功能
-
label是一个标量 -
sequence_feature是一个标量序列 -
seq_of_seqs_feature是序列特征的序列
我正在尝试使用 tf.data.Dataset.padded_batch() 生成填充数据作为模型的输入 - 我想以不同的方式填充每个功能。
示例批次:
[{'label': 24,
'sequence_feature': [1, 2],
'seq_of_seqs_feature': [[11.1, 22.2],
[33.3, 44.4]]},
{'label': 32,
'sequence_feature': [3, 4, 5],
'seq_of_seqs_feature': [[55.55, 66.66]]}]
预期输出:
[{'label': 24,
'sequence_feature': [1, 2, 0],
'seq_of_seqs_feature': [[11.1, 22.2],
[33.3, 44.4]]},
{'label': 32,
'sequence_feature': [3, 4, 5],
'seq_of_seqs_feature': [[55.55, 66.66],
0.0, 0.0 ]}]
如您所见,label 特性不应被填充,sequence_feature 和 seq_of_seqs_feature 应由给定批次中对应的最长条目填充。
【问题讨论】:
标签: python tensorflow tensorflow-datasets