【发布时间】:2021-12-12 01:05:13
【问题描述】:
我有这样的数据:
| 2010-08-27 00:00:00 | SW |
| 2010-08-27 00:15:00 | SSW |
| 2010-08-27 00:30:00 | SSW |
| 2010-08-27 00:45:00 | SSE |
| 2010-08-27 01:00:00 | NNE |
等等。
所以这是我的问题,如何在 python 中创建一个函数来计算所有数据的平均值,pandas 中的正常含义不起作用,因为该列是一个字符串。也许 numpy 有一些向量选项来计算这个。 希望可以有人帮帮我。非常感谢!
【问题讨论】:
-
您希望如何计算平均值?例如,“N”和“S”的含义是什么?您的样本数据的平均值是多少?
-
您可能会将 SW/SSW/... 映射到度数,然后计算平均值,然后可以选择映射回一个方向。
-
您可能还需要风速来计算平均值,不是吗?因为来自南方的风和来自北方的风并不总是以相同的速度发生,所以平均风向需要由速度加权。
-
@not_speshal 指出了一个好问题,我第一次脸红时甚至都没有想到。我认为“平均风向”没有任何意义。如果你有 N、S、E、W 四个读数,平均值是多少?也许模式会是一个更有用的衡量标准。计算条目并找到最常见的
-
这个库将为您提供一种在姓名和学位之间切换的简单方法:pypi.org/project/compassheadinglib
标签: python database dataframe math