【发布时间】:2014-03-21 12:20:40
【问题描述】:
如何更改index 和column 以使我的值与第一个表中的值保持一致?我不明白为什么添加一些索引会将我的值更改为 NaN。
这就是我所拥有的:
Tabelle = pd.DataFrame(pd.read_csv(pfad, header = 2))
print Tabelle[:2]
0 1 81 60 5 63 73
0 2014-03-19T12:44:32.695Z 1395233072695 703425 0 2 1 13
1 2014-03-19T12:44:32.727Z 1395233072727 703425 0 2 1 13
这就是我想要的: (问题:loggerFile 没有dataFrame,见问题末尾)
Tabelle = pd.DataFrame(loggerFile, columns = ID_columns, index = RowIndex)
print Tabelle[:2]
ID ---> 0 1 81 60 5 63 73
Zeilen-Index
1395233072695 2014-03-19T12:44:32.695Z 1395233072695 703425 0 2 1 13
1395233072727 2014-03-19T12:44:32.727Z 1395233072727 703425 0 2 1 13
这就是我得到的:
----------------------------------------------------------------
Tabelle = pd.DataFrame(pd.read_csv(pfad), index = RowIndex)
print Tabelle[:2]
Time Unixtime Typ grunz quak bla blab Blub \
Zeilen-Index
1395233072695 NaN NaN NaN NaN NaN NaN NaN NaN NaN
1395233072727 NaN NaN NaN NaN NaN NaN NaN NaN NaN
----------------------------------------------------------------
Tabelle = pd.DataFrame(pd.read_csv(pfad), columns = ID_columns, index = RowIndex)
print Tabelle[:2]
ID ---> 0 1 81 60 5 63 73
Zeilen-Index
1395233072695 NaN NaN NaN NaN NaN NaN NaN
1395233072727 NaN NaN NaN NaN NaN NaN NaN
----------------------------------------------------------------
Tabelle = pd.DataFrame(pd.read_csv(pfad), columns = ID_columns)
print Tabelle[:2]
ID ---> 0 1 81 60 5 63 73
0 NaN NaN NaN NaN NaN NaN NaN
1 NaN NaN NaN NaN NaN NaN NaN
但如果我列一个这样的列表:
loggerFile =
[['2014-03-19T12:44:32.695Z', '1395233072695', '703425', '0', '2', '1', '13', '5', '21', '25', '0', '25', '209', '0', '145', '0', '0'], ['2014-03-19T12:44:32.727Z', '1395233072727', '703425', '0', '2', '1', '13', '5', '21', '25', '0', '25', '209', '0', '146', '0', '0'], ['2014-03-19T12:44:32.758Z', '1395233072758', '703425', '0', '2', '1', '13', '5', '21', '25', '0', '25', '209', '0', '145', '0', '0'], ['2014-03-19T12:44:32.790Z', '1395233072790', '703425', '0', '2', '1', '13', '5', '21', '25', '0', '25', '209', '0', '145', '0', '0'], ['2014-03-19T12:44:32.821Z', '1395233072821', '703425', '0', '2', '1', '13', '5', '21', '25', '0', '25', '209', '0', '145', '0', '0']]
并将其添加为数据,它可以工作:
Tabelle = pd.DataFrame(loggerFile, columns = ID_columns, index = RowIndex)
ID ---> 0 1 81 60 5 63 73
Zeilen-Index
1395233072695 2014-03-19T12:44:32.695Z 1395233072695 703425 0 2 1 13
1395233072727 2014-03-19T12:44:32.727Z 1395233072727 703425 0 2 1 13
我的ID_columns 是这样从列表中排除的:
ID_columns = pd.Index(ID_list, name="ID --->")
列表ID_list 的样子
['0', '1', '81', '60', '5', '63', '73', nan, '10', '11', '2', '16', '30', '20', '33', '94', '61']
【问题讨论】:
标签: python r dataframe ipython-notebook