【问题标题】:how to merge lists? (pandas DataFrame)如何合并列表? (熊猫数据框)
【发布时间】:2020-05-30 06:37:34
【问题描述】:

我有 3 个不同的列表,分别命名为:“pos_date_data”、“neu_date_data”、“neg_date_data”。 (分别表示正面、中性和负面)

它们包含数据框形状中的日期时间值。

下面是它们在打印列表时的样子。并且它们每个都有不同的长度。

 datetime
0   2018-07-04
1   2018-07-04
2   2018-07-04
3   2018-07-04
4   2018-07-04
..         ...
212 2020-02-02
213 2020-02-02
214 2020-02-03
215 2020-02-04
216 2020-02-07

[217 rows x 1 columns]

    datetime
0    2018-07-04
1    2018-07-04
2    2018-07-04
3    2018-07-04
4    2018-07-04
...         ...
1527 2020-02-09
1528 2020-02-10
1529 2020-02-11
1530 2020-02-11
1531 2020-02-12

[1532 rows x 1 columns]

我正在尝试使用 pandas、python 将它们合并到一个 DataFrame 中。

为此,我必须在整个范围内(2018-07 ~ 2020.03)按日期计算月份。 例如 : 如果 neu_date_data 中 2019-05 的总日期数为 15,我想在表格中将其显示为整数。

我试过这段代码:

df = pd.crosstab(neg_date_data['datetime'].dt.month.rename('m'),
                 neg_date_data['datetime'].dt.year.rename('y'))

并打印为: 以交叉表的形式,每个项目代表月份的日期数。

y   2018  2019  2020
m                   
1      0     1    17
2      0     0     2
3      0     1     0
4      0     3     0
5      0    12     0
6      0    13     0
7     25    16     0
8      0    36     0
9      0     2     0
10     1     8     0
11     1     5     0
12     2     4     0

我想通过 3 种方式修复代码:

  1. 合并 3 个列表并显示一次。

  2. 将整个“年”和“月”数据作为

  3. 对于 3 个,每个列表的标题:'pos'、'neu'、'neg',而不是年份。

【问题讨论】:

    标签: python pandas dataframe pivot crosstab


    【解决方案1】:

    首先通过Series.dt.to_period 将日期时间转换为月份周期,然后使用Series.value_counts,最后一起使用concat

    我认为对于绘图应该更好地使用行中的月份和列中的类型:

    neg = neg_date_data['datetime'].dt.to_period('m').value_counts()
    neu = neu_date_data['datetime'].dt.to_period('m').value_counts()
    
    df = pd.concat([neg, neu], axis=1, keys=('neg','neu'))
    print (df)
             neg  neu
    2020-02    5    5
    2018-07    5    5
    
    df.plot()
    

    【讨论】:

      猜你喜欢
      • 2016-10-31
      • 1970-01-01
      • 2018-11-18
      • 2013-09-26
      • 1970-01-01
      • 2019-09-27
      • 2019-06-29
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多