【问题标题】:How to make minibatch data out of pandas dataframe?如何从熊猫数据框中制作小批量数据?
【发布时间】:2021-11-08 10:56:39
【问题描述】:

我有一个如下所示的数据框。 我只为两个资产(A00033、A00034)和一天 2012-01-01 编写了示例。

date etf data_nmae value
2012-01-01 A00033 open 3
2012-01-01 A00033 high 4
2012-01-01 A00033 close 2
2012-01-01 A00033 volume 1
2012-01-01 A00033 low 1
2012-01-01 A00034 open 31
2012-01-01 A00034 high 43
2012-01-01 A00034 close 32
2012-01-01 A00034 volume 3
2012-01-01 A00034 low 11

在这种情况下,我想生成具有形状 (n_channel, lookback, n_assets) 的 numpy 数据集,其中回顾是训练期,n_assets 是我拥有的所有资产的数量,n_channel 是 5(开盘、高盘、收盘、低盘、成交量)。

如何操作 numpy 和 pandas 制作这个 minibatch 数据?

【问题讨论】:

  • 什么是批处理、n_channel 和 n_assets?
  • 更好:请提供(样本)预期输出和需求描述
  • @anon01 我在上面更新了。谢谢!

标签: pandas numpy


【解决方案1】:

这就是你要找的答案吗:

>>> df.groupby('date')[['etf', 'data_nmae']].nunique().reset_index().rename(columns={'date': 'lookback', 'etf': 'n_assets', 'data_nmae': 'n_channel'})

    lookback    n_assets    n_channel
0   2012-01-01  2           5

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2017-01-13
    • 2013-12-12
    • 2018-03-11
    • 2018-02-10
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多