【发布时间】:2020-05-11 15:12:09
【问题描述】:
我在上面有一个 CSV 文件的以下链接,其中包含我希望处理的原始数据。
census_df = df = pd.read_csv('https://raw.githubusercontent.com/Qian-Han/coursera-Applied-Data-Science-with-Python/master/Introduction-to-Data-Science-in-Python/original_data/census.csv')
sortedit = census_df.sort_values(by = ['STNAME','CENSUS2010POP'],ascending=False)
我正在尝试按列 'CENSUS2010POP' 的降序排列数据。
我还想按“状态”的字母顺序对数据进行排序,因此我在上面的公式中包含 'STNAME' 列。
但是,我只想从每个州 ('STNAME') 中为 'CENSUS2010POP' 选择 3 个最高值。
因此,如果总共有 146 个州,我应该 (146 x 3) 行在我的新数据框中(因此在“CENSUS2010POP”列中)。
如果有人能帮我一把,我将不胜感激?
【问题讨论】:
标签: python pandas csv dataframe series