【发布时间】:2018-04-03 03:21:29
【问题描述】:
我在一个名为 Diamonds 的数据集上做 R 编程问题。首先是为了安装和加载数据集。输入以下命令
install.packages("ggplot2")
library(ggplot2)
diamonds
现在因为有这么多的值和名称,我需要找出理想切工钻石(数据集)的 7 个最昂贵的价格?
我所做的是,我创建了一个名为 diamond.ideal 的数据框,并在数据框内放置了来自数据集 diamonds 的 3 列和值。这是代码
diamond.ideal <- data.frame(diamonds$cut,diamonds$color, diamonds$price)
head(diamond.ideal) #or diamond.ideal
这是输出的截图
最后,我需要找出最贵的 7 种理想切工钻石的价格吗? 这是我的代码但不确定它是否正确
diamond.ideal[which(diamond.ideal$diamonds.cut == "Ideal", diamond.ideal$diamonds.price == max(diamond.cut$diamonds.price))[990:997],]
[990:997] 是行号(我认为) 这是截图
我不知道这些数字是否正确,数据集上有这么多值。 我只想知道最高值是否正确? 或者是否有其他方法可以通过使用 table() 或 cut() 等不同的函数来找到 Ideal 钻石的 7 个最昂贵的价格?
【问题讨论】: