【发布时间】:2020-11-06 18:56:44
【问题描述】:
这是我正在尝试编辑的 CSV 文件的示例,您可以看到 L.A. Lakers 在第一行出现两次,在第 15 行再次出现。 我想做的是球队的详细信息,包括每支球队的最终比赛数量、输赢情况。 G 代表 csv 文件中的比赛,W 赢,L 输。
我的进口
import pandas as pd
import numpy as np
读取和排序文件
ranking = pd.read_csv("ranking.csv")
sortedranks = ranking.sort_values(["SEASON_ID"], ascending=False)
获得 2019 年的排名并删除重复但不起作用
rank19 = sortedranks[sortedranks.SEASON_ID == 22019]
rank19.drop_duplicates(subset="G", keep = False, inplace = True)
【问题讨论】:
-
此数据似乎没有重复。你有两个湖人队的条目,但每行的输赢总数不同。
-
哦,那我可以得到每个团队的最终记录,就像其他团队一样。
-
@JamesTollefson
-
您的意思是您想保留ROAD_RECORD 日期之后的记录吗?或者你说的最终记录是什么意思?从你的描述看不清楚。
-
@kate-melnykova 很抱歉,我正在努力为每支球队赢得最后一场比赛,输赢
标签: python pandas csv data-analysis