【发布时间】:2022-01-17 19:28:14
【问题描述】:
所以我有一个相当大的数据集,所以我需要编写一些高效的东西。 我的数据包含一个列表中各个艺术家的专辑发行年限和另一个列表中每张专辑的平均歌曲长度。
作为一个例子,这里是一些虚构的数据。此处以分钟为单位给出歌曲长度。
release_year=[2017,2017,2019,2020,2020,2021]
avg_songlength=[3,5,3,4,2,3]
我想获得一个数据集,它删除了 release_year 列表中的重复项,并且对于每个重复项,它再次平均歌曲长度。所以我想要得到的结果是:
years_without duplicates=[2017,2019,2020,2021]
avg_length_of_year=[3+5/2,3,4+2/2,3]
我发现 set() 可以有效地删除重复项,但我不知道如何在另一个列表中组合整个 有什么简单的方法可以做到这一点?
【问题讨论】:
-
制作一个字典,其中年份是键,值是歌曲长度列表
标签: python arrays list data-science