【发布时间】:2012-11-16 04:37:11
【问题描述】:
我有来自三个不同 GPS 接收器的冰速 GPS 数据。数据位于 pandas 数据框中,索引为 julian day(从 2009 年初开始递增)。
这是数据的一个子集(主数据集是 3487235 行...):
R2 R7 R8
1235.000000 116.321959 100.805197 96.519977
1235.000116 NaN 100.771133 96.234957
1235.000231 NaN 100.584559 97.249262
1235.000347 118.823610 100.169055 96.777833
1235.000463 NaN 99.753551 96.598350
1235.000579 NaN 99.338048 95.283989
1235.000694 113.995003 98.922544 95.154067
数据框的格式为:
索引:6071320 个条目,127.67291667 到 1338.51805556 数据列: R2 3487235 非空值 R7 3875864 非空值 R8 1092430 非空值 数据类型:float64(3)R2 以与 R7 和 R8 不同的速率采样,因此 NaN 系统地出现在该间距处。
尝试df.plot() 绘制整个数据框(或其索引行位置)在绘制 R7 和 R8 方面效果很好,但不绘制 R2。同样,只做df.R2.plot() 也行不通。绘制 R2 的唯一方法是执行 df.R2.dropna().plot(),但这也会删除表示无数据周期的 NaN(而不是比其他接收器更粗略的采样频率)。
还有其他人遇到过这个吗?任何关于这个问题的想法都将不胜感激:)
【问题讨论】:
-
您应该将您的时间步长转换为
DatetiemIndex,然后重新采样 R2
标签: pandas ipython data-analysis