【问题标题】:Stacked bar plot : y axis gets堆积条形图:y轴得到
【发布时间】:2020-08-14 20:13:06
【问题描述】:

我有一组这样的测试数据

 week       reason         gross   
    2   Наличные            356.54
    6   FuelUp             1157.54
    7   Альянс              706.54
   10   FlashPay           1567.54
   10   Наличные            135.54
   19   FuelUp             3045.54
   19   Карты Сбербанка     723.54
   19   Наличные           1230.54
   24   FuelUp              875.54
   27   FlashPay           1260.54
   28   Альянс              556.54
   33   FlashPay           9756.54
   33   Ваучеры             756.54
   37   Ваучеры             473.54
   38   Ваучеры             358.54
   41   Карты Сбербанка     600.54
   49   Наличные            100.00

我用这段代码做了一个堆积条形图:

query$week = factor(query$week,ordered=TRUE)                       
p <- ggplot(query,aes(x=week,y=gross,fill=reason)) + theme_light() +
        geom_col(position="stack") +
        scale_fill_viridis(discrete = T) +
        labs(x="Неделя 2020")
print(p)

其中查询只是数据的一部分(来自 PostgrSQL。到目前为止,一切都很好,但是这样的代码会导致这样的图片具有不完整的 Y 轴。 为什么会这样?我应该怎么做才能“延长”轴上的抽动和标签?

【问题讨论】:

  • “总”变量的数据类型是什么?

标签: r ggplot2 bar-chart


【解决方案1】:

您的 gross 变量不是数字。

起始数据,其中gross 是字符串(或因子),而不是数字:

query <- structure(list(week = structure(c(1L, 2L, 3L, 4L, 4L, 5L, 5L, 
5L, 6L, 7L, 8L, 9L, 9L, 10L, 11L, 12L, 13L), .Label = c("2", 
"6", "7", "10", "19", "24", "27", "28", "33", "37", "38", "41", 
"49"), class = c("ordered", "factor")), reason = c("", "FuelUp", 
"", "FlashPay", "", "FuelUp", "_", "", "FuelUp", "FlashPay", 
"", "FlashPay", "", "", "", "_", ""), gross = c("356.54", "1157.54", 
"706.54", "1567.54", "135.54", "3045.54", "723.54", "1230.54", 
"875.54", "1260.54", "556.54", "9756.54", "756.54", "473.54", 
"358.54", "600.54", "100.00")), row.names = c(NA, -17L), class = "data.frame")

(我仓促的导入杀死了reason ...这会稍微歪曲显示/图例,但不会改变我回答的前提。)

剧情:

p <- ggplot(query,aes(x=week,y=gross,fill=reason)) + theme_light() +
        geom_col(position="stack") +
        scale_fill_viridis(discrete = T) +
        labs(x="Неделя 2020")

如果我们将其转换为numeric,情节看起来更正常。

query$gross <- as.numeric(query$gross)
p <- ggplot(query,aes(x=week,y=gross,fill=reason)) + theme_light() +
        geom_col(position="stack") +
        scale_fill_viridis(discrete = T) +
        labs(x="Неделя 2020")
p

【讨论】:

  • 啊……我明白了。它是否总是将它们视为字符串,所以我必须将它们显式转换为数字?
  • 它们是字符串 here 的事实可能是由于任何原因,包括:您如何阅读它们(例如,read.tableread_csvread_excel)和/或您在情节尝试之前所做的事情。我真的没有办法知道 为什么 与我们在这里所知道的。
  • 但是,由于您的绘图按数字顺序显示 y 值,而我的绘图按字母顺序显示它们,这表明您的是 factors,而不是 character。为此,您需要as.numeric(as.character(query$gross))。如果您使用的是 R read.table 和 data.frame 和朋友的默认值是 stringsAsFactors=TRUE,所以这可能是在哪里查找的线索。如果是这种情况,如果我是你,我会返回数据导入步骤并修复它首先然后重新运行所有中间代码......因为有时会出现“数学”因素正常工作。
  • 顺便说一句,这是您关于 SO 的第三个问题,已得到回答。如果答案解决了您的问题,请accept it;这样做不仅为回答者提供了一些积分,而且还为有类似问题的读者提供了一些关闭。尽管您只能接受一个答案,但您可以选择对您认为有帮助的人进行投票。 (如果仍有问题,您可能需要编辑您的问题并提供更多详细信息。)
  • 已接受。之前不知道我应该这样做。对不起。