【发布时间】:2021-08-08 12:43:30
【问题描述】:
更新!!! 在尝试了评论中的代码之后。 结果显示了所有brand_id,review_score为5(最高分)。 虽然也有超过 10 条评论的数千个品牌 ID...
所以我仍然对此感到困惑
问题是我得到了一个包含许多列的数据框,我需要为不同的列找到具有不同条件的品牌。
这是数据框:
| Brand id | Brand name | review score |
|---|---|---|
| 1 | A | 1.0 |
| 2 | B | 2.0 |
| 2 | B | 3.0 |
| 3 | C | 1.0 |
| 3 | C | 1.5 |
| 3 | C | 2.0 |
并且我需要获得最高评分的商品的品牌 ID 是什么?还要过滤超过 10 条评论的商品?
我试过这样的代码:
item %>%
group_by(Brandid, review_score) %>%
summarise(idnumber = n()) %>%
filter(idnumber > 10)%>%
arrange(desc(review_scode))
我试过了,也失败了..
item %>%
group_by(Brand_id) %>%
mutate(n = n(), 'max' = max(review_overall, na.rm = TRUE))%>%
filter(n >= 10) %>%
arrange(desc('max'))
然后我得到了许多具有相同 review_scode 的项目... 但似乎这个问题应该只有一个答案。
那么你能帮帮我吗!
谢谢!
【问题讨论】: