【发布时间】:2018-01-07 00:44:15
【问题描述】:
我正在尝试过滤掉 R 中不需要的多行数据,但我不知道该怎么做。
我使用的数据看起来有点像这样:
Category Item Shop1 Shop2 Shop3
1 Fruit Apples 4 6 0
2 Fruit Oranges 0 2 7
3 Veg Potatoes 0 0 0
4 Veg Onions 0 0 0
5 Veg Carrots 0 0 0
6 Dairy Yoghurt 0 0 0
7 Dairy Milk 0 1 0
8 Dairy Cheese 0 0 0
我只想保留至少一件商品对至少一家商店具有正价值的类别。
在这种情况下,我想删除所有Veg 行,因为没有一家商店出售任何蔬菜。我想保留所有 Fruit 行,并且我想保留 all Dairy 行,即使是所有商店中值为零的行,因为 Dairy 行之一确实如此值大于 0。
我在使用group_by(Category) 之后尝试使用colSums,希望它每次都能将Category 的内容相加,但它不起作用。我还尝试在 rowSums 的末尾添加一列并根据频率进行过滤,但我只能通过这种方式过滤掉单个行,而不是基于整个 Category 的行。
虽然我可以过滤掉值为零的单个行(例如第 3 行),但我的困难是保留第 6 行和第 8 行这样的行,其中每个商店的所有值都为零,但我想保留这些行,因为其他 Dairy 行的值确实大于零。
【问题讨论】: