【发布时间】:2017-11-30 03:29:38
【问题描述】:
这是我第一次使用 pandas 和 iPython 笔记本,但无法为我的问题找出正确的搜索词。
我有一个 .xls 文件,用于位于 3 个站点 A、B 和 C 的 3 个构建服务器的编译时间数据。这些构建服务器编译多个项目,所以我会选择任何特定的项目。因此我需要像这样绘制数据(对于一个特定的项目 - 不是全部在一个图表中,以保持简单):
X-axis = date
Y-axis = average build time on that date
3 lines for sites A, B and C
到目前为止我做了什么:
import pandas as pd
import numpy as np
import matplotlib as plt
file= r'/home/abc/Downloads/request.xls'
df = pd.read_excel(file,parse_dates=['Date'])
build_times = df[['Date','site','project','Duration']]
build_group = build_times.groupby(['Date','site','project']).mean()
我需要以下帮助:
我如何只选择成功的构建 如果有一列
status有 0 和 1。如何使用上述 X 轴和 Y 轴绘制站点
A、B和C(针对特定项目)的线。
编辑
经过@jezrael 的回答,我可以得到以下数据
2017-03-27 A project1 963.200000
B project2 4587.176471
C project2 1449.375000
C project1 1449.375000
.......
2017-03-28 A project1 93.200000
B project1 4787.176471
C project2 1339.375000
C project1 1749.375000
【问题讨论】:
-
可以添加一些示例数据吗?
标签: python pandas matplotlib ipython-notebook data-science