【发布时间】:2021-09-10 09:04:11
【问题描述】:
我想使用不同的输入运行 kedro 管道并将结果保存在输出文件夹中,其中输入路径和输出路径通过命令行提供
我播种了使用 kedro.config.TemplatedConfigLoader 将新变量传递给 jinja2 模板目录的可能性,但这样我只能手动定义挂钩中的 globals_dict 变量,如 kedro 文档中所示。
理想情况下,我想运行这样的东西:
kedro run --pipeline="my_pipeline" --input="path_to_input_1" --output="path_to_output_1"
kedro run --pipeline="my_pipeline" --input="path_to_input_2" --output="path_to_output_2"
有这样的目录:
input_df:
type: pandas.CSVDataSet
filepath: "${ input_path }"
load_args:
sep: "\t"
index_col: 0
save_args:
index: True
encoding: "utf-8"
output_df:
type: pandas.CSVDataSet
filepath: "${ output_path }"
load_args:
sep: "\t"
index_col: 0
save_args:
index: True
encoding: "utf-8"
并分析正确的输入并将结果存储在正确的输出路径中。
实现它的 kedro 方法是什么?
【问题讨论】:
标签: command-line kedro