【发布时间】:2015-01-27 00:28:19
【问题描述】:
我是 Python 新手,我正在尝试复制我在 SAS 中非常习惯的功能。我想创建一个新变量(数据列),其中包含使用同一行(记录)的现有变量(数据列)计算的结果。我希望这个新变量成为现有数据集的一部分。经过大量研究,我找不到关于这个特定主题的任何内容。数据集来自一个包含两列数值数据的 CSV 文件,行大小是先验未知的。我可以毫无问题地执行我需要的计算,但是试图扩展数据集以拥有第三列,我可以在其中放置结果是我卡住的地方。
import numpy as np
import pandas as pd
driver1_1_data = pd.read_csv(...)
for i in range(len(driver1_1_data.values[:,0])):
MPS = np.sqrt((driver1_1_data.values[i,0]-driver1_1_data.values[i-1,0])**2+(driver1_1_data.values[i,1]-driver1_1_data.values[i-1,1])**2)
【问题讨论】:
-
向我们展示几行 CSV 文件,以及计算第三列的公式
-
尝试在您的问题中包含您尝试过的代码。
-
有许多可能的不同解决方案,具体取决于您已经完成的工作......如果您向我们展示您的程序,您读取数据文件并准备计算的部分,您会变得更好答案。
-
“MPS”只是一个占位符,因为我还没有得到这个定义。
标签: python data-analysis