【问题标题】:How do I select which columns to load in a Kedro CSVLocalDataSet?如何选择在 Kedro CSVLocalDataSet 中加载哪些列?
【发布时间】:2019-11-08 12:36:12
【问题描述】:

我有一个csv 文件,看起来像

a,b,c,d
1,2,3,4
5,6,7,8

我想将它作为 Kedro CSVLocalDataSet 加载,但我不想阅读整个文件。我只想要几列(例如 ab)。

我有什么方法可以指定要读取/加载的列列表吗?

【问题讨论】:

  • 在提出家庭作业问题时,请表现出您最好的诚意尝试解决它,并告诉我们您遇到了哪些问题,以便我们更好地了解您的意图、您可能做错的事情以及您的目标。请浏览tourhelpHow to Ask 部分,了解本网站的工作原理并帮助您改进当前和未来的问题。也请看看How do I ask and answer Homework questions?

标签: python pandas csv kedro


【解决方案1】:

CSVLocalDataSet 使用pandas.read_csv,它采用“usecols”参数。它可以通过使用load_args 数据集参数轻松代理(所有数据集都支持通过load_argssave_args 传递的附加参数):

my_cool_data:
  type: CSVLocalDataSet
  filepath: data/path.csv
  load_args: 
    usecols: ['a', 'b']

另请注意,相同的参数适用于任何基于 pandas 的数据集。

【讨论】:

    猜你喜欢
    • 2019-02-09
    • 2021-06-15
    • 2014-10-31
    • 1970-01-01
    • 2023-03-25
    • 1970-01-01
    • 2010-10-31
    • 2011-07-16
    • 1970-01-01
    相关资源
    最近更新 更多