【问题标题】:Histogram x-axis showing wrong range直方图 x 轴显示错误范围
【发布时间】:2021-07-20 20:17:08
【问题描述】:

我正在从 csv 中的列制作直方图,其值从 100,000 到 10,000,000 不等,但是当我将数据输入 r 并从该列制作直方图时,x 轴全部混乱,显示范围非常大当最大值为 10,000,000 时。

这是数据集的来源: https://www.kaggle.com/kmldas/hr-case-study

这是我用来制作直方图的代码:

hist(study_sample$Annual.Salary)

【问题讨论】:

  • 10,000,000 = 10^7 = 1e+07,对吗?在我看来是正确的。
  • 根据我能看到的有限数据,x 轴范围和直方图本身看起来可能是正确的。当然,如果没有任何数据可以使用,很难知道...mcve 会有所帮助。您是否尝试过调整 bin 以提供更高的分辨率?
  • @BillO'Brien 是的,你是对的,但是有什么方法可以让它对阅读的人更友好一点吗?也许显示 10,000,000 数字
  • 调整直方图是一门艺术。但是根据我在屏幕截图中看到的数据,您正在查看 3 个数量级。您可以尝试对数转换。

标签: r histogram


【解决方案1】:

您可以使用以下命令禁用 R 中的科学记数法:

options(scipen = 999)
hist(HR_Case_Study$`Annual Salary`)

数据负责人:

structure(list(Name = c("Aarti Panchal", "Aastha Behl", "Abhinaw Sinha", 
"Abhishek Dabb", "Abhishek Kumar Preetam", "Addi Studdeard"), 
    Gender = c("Female", "Female", "Male", "Male", "Male", "Female"
    ), Department = c("CEO", "Sales", "Engineering", "Legal", 
    "Support", "Support"), `Annual Salary` = c(10000000, 880500, 
    682200, 563700, 1070900, 1084500), Location = c("Mumbai", 
    "Bengaluru", "Bengaluru", "New Delhi", "New Delhi", "Mumbai"
    ), Rating = c("Very Good", "Very Good", "Good", "Very Good", 
    "Poor", "Poor"), `Distance to Office` = c(25, 7, 15, 5, 10, 
    6), Age = c(31, 40, 28, 39, 26, 38), `Tenure in Company` = c(10.4, 
    18.2, 6.6, 13.3, 4.8, 6.7)), row.names = c(NA, -6L), class = c("tbl_df", 
"tbl", "data.frame"))

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2011-08-23
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-04-11
    • 1970-01-01
    相关资源
    最近更新 更多