【发布时间】:2014-07-11 16:33:09
【问题描述】:
我刚开始使用 pandas 来分析一段时间内的地下水井数据。
我在文本文件中的数据看起来像 (site_no, date, well_level):
485438103132901 19800417 -7.1
485438103132901 19800506 -6.8
483622101085001 19790910 -6.7
485438103132901 19790731 -6.2
483845101112801 19801111 -5.37
484123101124601 19801111 -5.3
485438103132901 19770706 -4.98
我想要一个按 5 年增量划分的平均井水平和计数的输出:
site_no avg 1960-end1964 count avg 1965-end1969 count avg 1970-end1974 count
我正在读取数据:
names = ['site_no','date','wtr_lvl']
df = pd.read_csv('D:\info.txt', sep='\t',names=names)
我可以通过以下方式找到网站的总体平均值:
avg = df.groupby(['site_no'])['wtr_lvl'].mean().reset_index()
我的原始垃圾箱尝试使用:
a1 = df[df.date > 19600000]
a2 = a1[a1.date < 19650000]
avga2 = a2.groupby(['site_no'])['wtr_lvl'].mean()
我的问题:如何加入结果以根据需要显示?我尝试了合并、连接和追加,但它们不允许空数据框(发生这种情况)。此外,我确信有一种简单的方法可以按日期对数据进行分类。谢谢。
【问题讨论】: