【发布时间】:2020-01-10 15:52:42
【问题描述】:
我正在处理 python 上的 pandas 项目。我收到这样的 .csv 文件作为输入:
Name Timestamp Data
A1 259 [1.1,1.0,0.1]
A1 260 [-0.1,1.2,0.3]
A1 261 [0.1,0.2,-0.3]
...
A1 14895 [1.4,0.3,1.8]
...
A2 278 [-1.1,1.2,0.4]
A2 353 [-0.1,1.2,0.3]
A2 409 [-0.1,1.2,0.3]
...
A2 14900 [-0.1,1.2,0.3]
...
A1140 107 [-0.5,-1.0,-1.0]
A1140 107 [0.6,0.1,0.3]
A1140 114 [-1.1,-1.2,0.3]
...
A1140 14995 [-1,1.2,0.4]
我有 1140 多个名字,每个名字都有成百上千的数据。 数据以 200 赫兹的频率记录,我认为时间戳数字表示毫秒,虽然我不确定,但我无权访问此信息。 我必须重新采样到 50 Hz 频率。
我该怎么做?我是否需要将时间戳转换为实际秒数,然后使用 0.25 秒的.resample() 函数?我应该使用.groupby["Name"] 函数吗?
提前谢谢!
【问题讨论】:
-
200 Hz 表示每 5 毫秒一个样本。您的数据没有反映出来,有不同时间戳的样本相差不等于 5 毫秒。
-
我不确定是毫秒,我编辑了,谢谢。
-
您是如何获得 200 Hz 信息的?采样似乎非常不一致,因此说采样以一定的频率发生至少会让人感到困惑。
-
例如,在 A1140 中,您有两个具有相同时间戳的测量值。
-
另外,你的目标是什么?您想要一个格式相同但频率不同的文件,还是(例如)每个名称的不同文件?
标签: python pandas time-series data-science resampling