【发布时间】:2017-04-21 20:51:27
【问题描述】:
我正在寻找使用 apache beam 执行以下操作。
专门针对张量流神经网络的预处理。
- 用于文件夹中的每个文件。
- 对于文件中的每一行
- 处理线到一维浮点列表
- 对于文件中的每一行
我需要每个返回是每个文件的二维浮点列表。
我想我可以通过创建嵌套管道来实现这一点。
我可以在另一个管道的 ParDo 中创建和运行管道。
这似乎效率低下,但我的问题似乎是一个非常标准的用例。
- 在 Apache Beam 中是否有工具可以更好地做到这一点?
- 有没有办法重组我的问题以使其在 apache Beam 中更好地工作?
- 嵌套管道没有我想的那么糟糕吗?
谢谢
【问题讨论】:
标签: tensorflow apache-beam tensorflow-transform