【问题标题】:sankey flow diagram: links going one axis to another has multiple linkssankey流程图:从一个轴到另一个轴的链接有多个链接
【发布时间】:2026-02-14 20:00:02
【问题描述】:

我正在使用通用糖尿病数据,

datGluBMIAge <- dat[, .(freq = sum(freq)), by=list(Glucose_cat, BMI_cat, Age_cat, Outcome_cat)]
datGluBMIAge<- datGluBMIAge[!(is.na(datGluBMIAge$Age_cat))]
datGluBMIAge<- datGluBMIAge[!(is.na(datGluBMIAge$Glucose_cat))]
datGluBMIAge<- datGluBMIAge[!(is.na(datGluBMIAge$BMI_cat))]
setnames(datGluBMIAge, old = c('Glucose_cat', 'Age_cat','Outcome_cat', 'BMI_cat'), new = c('Glucose', 'Age','Diabetes','BMI'))

ggplot(datGluBMIAge,aes(axis1= Diabetes, axis2=Glucose, axis3 = BMI, axis4 = Age, y = freq)) +
geom_alluvium(aes(fill=Diabetes),aes.bind=TRUE, reverse = FALSE, alpha=0.9) +
scale_fill_manual(labels = c("Negative", "Positive"), values = c("#0066BA", "#FF9400")) +
scale_x_discrete(limits = c("Diabetes", "Glucose","BMI", "Age"), expand = c(0, 0)) +
scale_y_continuous(labels = NULL, expand = c(0,0))+
theme(axis.text.x=element_text(margin = margin(t = 0, unit='pt')),
    axis.title.x = element_text(vjust = 0),
    panel.grid.major = element_blank(),
    panel.grid.minor = element_blank(),
    panel.background = element_blank(),
    axis.line = element_blank(),
    axis.ticks = element_blank(),
    legend.position = "none")+
geom_stratum(alpha=1, reverse = FALSE) +
geom_text(stat="stratum", label.strata= TRUE, reverse = FALSE) +
ylab(NULL)+xlab(NULL) +
geom_vline(xintercept = 0)

上面的代码产生了这个图:

根据上面的情节我有两个问题

  1. 有从Glucose="Normal"BMI='30-35' 的各种链接,我如何安排它们以使我只看到一个从Glucose="Normal"BMI='30-35' 的链接以及所有其他链接

  2. 如何更改坐标轴之间的配色方案?例如,如果我想要 Glucose 和 BMI 之间的不同颜色,甚至 BMI 和 Age 之间的不同颜色?我如何使用 ggalluvial 库来做到这一点?

任何线索将不胜感激。感谢您的时间。问候,特鲁提

【问题讨论】:

  • @MrFlick 你能花点时间解决我的问题吗?我看到它非常类似于link

标签: r sankey-diagram


【解决方案1】:

由于层对每个轴都是唯一的,因此您可以通过首先转换为长格式然后使用geom_flow(aes(fill = stratum)) 来更改每对轴之间流的颜色方案。这是一个源自the cover illustration to ggalluvial的示例:

ggplot(data = titanic_long,
       aes(x = Demographic, stratum = stratum, alluvium = alluvium,
           y = Freq, label = stratum)) +
  geom_flow(aes(fill = stratum)) +
  geom_stratum() + geom_text(stat = "stratum") +
  theme_minimal() +
  ggtitle("passengers on the maiden voyage of the Titanic",
          "stratified by demographics and survival")

另一方面,如果您有一些分层出现在多个轴上,您需要采取额外的步骤将它们区分为单独的因子水平。您可以在转换为长格式后手动执行此操作,或者在转换为长格式时在to_lodes_form() 中设置discern = TRUE

【讨论】:

    【解决方案2】:

    而不是使用geom_alluvium 使用geom_flow 解决了问题1。我仍在探索解决问题2。谢谢,Trupti

    【讨论】:

      最近更新 更多