从传感器聚合时间序列
我有大约 500 个传感器,每个传感器大约每分钟发出一次值。可以假设传感器的值保持不变,直到发出下一个值,从而创建一个时间序列。传感器在何时发出数据时并不同步(因此观察时间戳会有所不同),但所有数据都集中收集并存储在每个传感器上(以允许按传感器子集进行过滤)。 如何生成一个汇总时间序列,以提供来自传感器的数据总和? n (需要在 1 天的一组观察中创建时间序列 - 因此需要考虑每天 24x60... »
我有大约 500 个传感器,每个传感器大约每分钟发出一次值。可以假设传感器的值保持不变,直到发出下一个值,从而创建一个时间序列。传感器在何时发出数据时并不同步(因此观察时间戳会有所不同),但所有数据都集中收集并存储在每个传感器上(以允许按传感器子集进行过滤)。 如何生成一个汇总时间序列,以提供来自传感器的数据总和? n (需要在 1 天的一组观察中创建时间序列 - 因此需要考虑每天 24x60... »
为什么这个 Pandas 系列给出 sum = .99999999 而答案是 1。在我的程序中,我需要断言“总和等于 1”。而且,即使条件正确,断言也会失败。 s = pd.Series([0.41,0.25,0.25,0.09]) print("Pandas version = " + pd.__version__) print(s) print(type(s)) print(type(s.v... »
问题:我正在处理患者数据,其中参数以不同的采样频率记录,因此具有不同的时间戳。 我想创建一个矩阵,其中数据由“最后一个已知值”插值,直到新的原始值随时间变化。所以最后我有一个统一的矩阵,其中每个参数在每个时间戳都有值。 数据格式如下: Time Hear Rate(Variable) 18:00:00 PM 74 18:02:00... »
我有这些货币兑换数据,我正在尝试将数据格式化为矩阵,以便我可以将此矩阵输入神经网络以预测第二天的兑换。为此,它需要知道以下值: 2 天前,1 天前,今天,预计在这个一维矩阵中。我正在尝试将此一维矩阵更改为可以正确显示数据的二维矩阵。我在下面创建了一个图表,说明我如何尝试格式化这些数据,但我不太明白如何做到这一点,我是 R 编程的新手。我发现 lag() 函数可用于在数据中创建此“滞后”并用于时间序... »
我有一个熊猫系列,我正在以这种方式应用字符串搜索 df['column_name'].str.contains('test1') 这给了我真/假列表,具体取决于字符串“test1”是否包含在“column_name”列中。 但是我无法测试两个字符串,我需要检查两个字符串是否都存在。类似的东西 df['column_name'].str.contains('test1' and 't... »
在某个时间段内可能存在或不存在个人的清理数据方法。我想看看随着时间的推移他们可能存在于第一个时间段或在第一个时间段以外的时间段开始的个人。个人可能在某个时间点之后没有数据,或者数据中有差距。数据中的间隙可能没有一行 NA,而是可能完全从数据集中丢失。我希望能够保留连续出现“n”次且时间间隔少于“n”个(或按特定列名)的个人。 Drop variable in panel data in R co... »
我有一个DataFrame .groupby() .cumsum(),一个DataFrame如下: Col_A Col_B Col_C 1 A 0 2 A 1 1 3 A 1 2 4 A 1 3 5 B 0 0 6 B ... »
我在 Keras 中有一个预先准备好的时间序列,并且也想从给定日期获得预测。像这样: from keras import load_model def predict(date, filename): model = load_model(filename) # Do domething to get input_data from date return model.p... »
从这个ts: australia_data <- tourism %>% select(Quarter, Trips) %>% summarise(TotalTrips = sum(Trips)) > head(australia_data) # A tsibble: 6 x 4 [1D] # Key: Region, Purpose [1] # Gr... »
问题 我有一个保存时间序列的 mysql 数据库(对于每个客户和客户帐户余额的日期)。每周可能有多个值。可以假定日期列是一个有效且完整的日期时间对象。每个客户和每周可能有多个条目,但我想每周只保留一个值。 我查询数据库并从中构造相应的 pandas 数据框。 约束: 大多数情况下,每周的星期二都会有值 有时星期二可能没有值,然后取该周的下一个可能值 +-------------+----... »
我想知道在 R 中存储(和处理)多元(特别是矩阵值)时间序列的最佳选择是什么。 我有一个大数据框,它存储所有数据以及时间变量(在本例中名为year,作为一列。) 这是我能想到的,但两种选择都有其缺点: 数据帧列表,例如通过my.list[[i]] <- my.df[,year==i],循环遍历i=2008:2011。但是,我不知道如何提取,例如所有这些列表条目的左上角条目的单变量系列... »
我有一个非常基本的问题,希望有人指导。 如果我有一个如下开始的较长时间序列,它会跳过某些日期(例如假期等)。我想读取每个日期的值并使用它们执行进一步的计算。索引列是日期时间格式,但是如果我使用 timedelta(1) 转到下一个日期,当我到达缺少的日期时,代码会变得混乱(例如 2017-12-18): 2017-12-15 -1.354562 2017-12-16 -0.911684 2... »
我有一个类似这样的df: print(df) A B C DATE_TIME 2016-10-08 13:57:00 in 5.61 0 2016-10-08 14:02:00 in 8.05 0 2016-10-08 14:07:00 out 7.92 0 2... »
我还没有找到解决 R 中的编码难题的正确方法,希望得到您的帮助。 首先,这是我的大型数据集的一个可重现的小示例: data <- data.frame( Date <- sample(c("8/7/2014 23:01", "8/8/2014 10:01", "8/7/2014 11:01", "8/7/2014 12:01", "8/7/2014 13:01")), `361` &l... »
所以我正在使用一个简单的数据集来绘制日期 x 频率 日期以人类可读的格式给出 > head(gb.day) [1] Sep 12, 2011 11:59 PM Sep 12, 2011 11:59 PM Sep 12, 2011 11:58 PM [4] Sep 12, 2011 11:56 PM Sep 12, 2011 11:55 PM Sep 12, 2011 11:55 PM 6... »
我在使用 ts() 函数时遇到了麻烦。如何创建带有天数的时间序列?你能给我检查一下吗?非常感谢!!! 欢迎来到 StackOverflow。你可以... »
我的数据集如下所示: ID | country 1 | USA 2 | USA 3 | Zimbabwe 4 | Germany 我执行以下操作来获取第一个国家/地区的名称及其对应的值。所以在我的情况下是: df.groupby(['country']).country.value_counts().nlargest(5).inde... »
我有正常的数据框。 id name age city date 1 Jane 43 London 2020-01-12 2 Jose 34 London 2020-01-12 3 Poul 53 Leed 2020-01-12 4 Mark 29 Manchester 2020-02-12 5... »
我正在研究 python 中的时间序列。我发现有用且有前途的库是 熊猫; statsmodel(用于 ARIMA); pandas 提供了简单的指数平滑。 也用于可视化:matplotlib 有人知道指数平滑的库吗?... »
我正在使用一个数据集,该数据集每小时 24 小时读取一次温度,持续 100 多年。我想获得每天的平均温度以减少数据集的大小。标题如下所示: YR MO DA HR MN TEMP 1943 6 19 10 0 73 1943 6 19 11 0 72 1943 6 19 12 0 76 1943 6 19 13 0 78 1943 ... »