【发布时间】:2017-10-20 21:51:20
【问题描述】:
假设我有这个 csv 文件,我想使用 pyplot 和 pandas 在 python 中导入和绘制图形。
1,2
2,4
3,3
4,4
5,6
6,3
7,5
8,6
1,3
2,5
3,7
4,4
5,3
6,5
7,4
8,5
1,3
2,2
3,5
4,4
5,3
6,5
7,6
8,7
如您所见,第 1 列在数字 8 处翻转。我怎样才能摆脱这种翻转,使其现在看起来像这样:
1,2
2,4
3,3
4,4
5,6
6,3
7,5
8,6
9,3
10,5
11,7
12,4
13,3
14,5
15,4
16,5
17,3
18,2
19,5
20,4
21,3
22,5
23,6
24,7
我尝试了一个 for 循环来搜索该列并跟踪每次找到一个小于上一个数字的数字...这一定意味着翻转!我正在遍历整个数据集(这是 95,000 个元素!),当我看到当前项目比上一个项目大时,我将它乘以一个计数器......当这是错误的时候,计数器会增加我添加它到当前条目,直到检测到另一个翻转。
但是,我做错了什么,我不确定是什么..我的索引最后搞砸了.. 用 Python 的方式来搜索这个烂摊子是什么?
【问题讨论】:
-
第一列的数字是连续的吗?如果是这种情况,您为什么不直接忽略它,因为您似乎已经知道第一列应该是什么?比如:
pd.read_csv('data.csv', usecols=[1])
标签: python performance loops pandas