是否可以在 ggplot2 图例中包含一个变量子集？答案

【问题标题】：Is it possible to have a subset of variables in a ggplot2 legend with facets?是否可以在 ggplot2 图例中包含一个变量子集？
【发布时间】：2013-10-11 19:29:51
【问题描述】：

我有一个包含三个组的情节。我已经根据需要使用构面来获取图形，并且我设法将颜色和形状统一为一个图例（如下所示）。然而，问题是图例包含所有六个变量名，而只有两个就足够了。

这是我当前的输出：

是否可以获得只有两个键的图例：“分歧”和“女性百分比”（而不是当前的 6 个键）？

这是用于生成绘图的代码：

years <- c('97','98','99','00','01','02','03','04','05','06','07','08','09','10','11')
years <- factor(years, levels=years, ordered=T)             
phy_ratio <- c(0.124516129032258, 0.11545988258317,  0.115190784737221, 0.120919881305638, 0.132198952879581, 0.147636363636364, 0.171033478893741, 0.155994550408719, 0.150121065375303, 0.182989690721649, 0.19466515323496,  0.194550408719346, 0.203811540497618, 0.214399152991001, 0.195157384987893)
phy_kldiv <- c(0.040955264723678, 0.001463273151143, 0.011790601776013, 0.00575319295143,  0.003434619043043, 0.001405575036774, 0.012395353183334, 0.002864433864471, 0.006622155735437, 0.074859543690491, 0.013087320475828, 0.023585193439178, 0.08866626868359,  0.07879809266254,  0.04536730602564)
mat_ratio <- c(0.236086175942549,  0.253846153846154, 0.256481481481481, 0.246901811248808, 0.273267326732673, 0.290076335877863, 0.265861027190332, 0.283457249070632, 0.27098919368246,  0.296156744536549, 0.289834174477289, 0.309506790564689, 0.311612903225806, 0.293710691823899, 0.286604361370716)
mat_kldiv <- c(0.024935971694693,  0.012778283551598, 0.019350970177576, 0.00988763992456,  0.008284622131022, 0.014700010603506, 0.015235482499119, 0.023914776035294, 0.018878559121565, 0.073688344207842, 0.042784809873074, 0.052110805729914, 0.072367460713338, 0.017494663842138, 0.019605349179071)
psc_ratio <- c(0, 0, 0, 0.370182555780933, 0.325227963525836, 0.416528925619835, 0.379727685325265, 0.333901192504259, 0.396440129449838, 0.357142857142857, 0.412265758091993, 0.415605095541401, 0, 0, 0)
psc_kldiv <- c(0, 0, 0, 0.156958669813655, 0.02319115435268,  0.019560312744745, 0.142939013816555, 0.050687092785045, 0.030903744617805, 0.021234599637716, 0.049901381314152, 0.176930275568253, 0, 0, 0)
df <- data.frame("Years"=years,
                 '% of Women (Physics)'=phy_ratio,
                 'Divergence (Physics)'=phy_kldiv,
                 '% of Women (Maths)'=mat_ratio,
                 'Divergence (Maths)'=mat_kldiv,
                 '% of Women (Polit. Sci.)'=psc_ratio,
                 'Divergence (Polit. Sci.)'=psc_kldiv,
                 check.names=F)
df.m <- melt(df, id="Years")
df.m <- transform(df.m, facet=ifelse(variable %in% c('% of Women (Physics)',
                                                      'Divergence (Physics)'), 'phy',
                                 ifelse(variable %in% c('% of Women (Maths)',
                                                             'Divergence (Maths)'),'mat',
                                        ifelse(variable %in% c('% of Women (Polit. Sci.)', 'Divergence (Polit. Sci.)'), 'psc', 'mat'))))
g <- ggplot(df.m, aes(group=1, x=Years, y=value, colour=variable, shape=variable))
g <- g + scale_colour_manual(name='',
                             labels=c('Phy: % of Women', 'Phy: Divergence',
                                      'Maths: % of Women', 'Maths: Divergence',
                                      'Polit. Sci: % of Women', 'Polit. Sci: Divergence'),
                             values=c('chartreuse4', 'deepskyblue3', 'chartreuse4', 'deepskyblue3', 'chartreuse4', 'deepskyblue3'))
g <- g + scale_shape_manual(name='',
                            labels=c('Phy: % of Women', 'Phy: Divergence',
                                     'Maths: % of Women', 'Maths: Divergence',
                                     'Polit. Sci: % of Women', 'Polit. Sci: Divergence'),
                            values=c(19, 17, 19, 17, 19, 17))
g <- g + geom_point(aes(colour=variable), size=3)
g <- g + facet_grid(.~facet)
g <- g + coord_cartesian(ylim=(c(0.0,0.45)))
g <- g + scale_x_discrete("", expand=c(0.01, 0.01))
g <- g + scale_y_continuous(name="")
g <- g + guides(colour=guide_legend(title='', ncol=2, keywidth=unit(2,'lines')))
g <- g + theme(legend.position=c(0.33,0.72),
               legend.justification=c(0,0),
               legend.key=element_blank(),
               legend.background=element_rect(colour='black', fill='transparent'),
               legend.text=element_text(size=12),
               panel.grid.minor = element_blank(),
               panel.margin=unit(1, 'lines'),
               axis.text=element_text(size=12,color="black"),
               axis.title=element_text(size=16),
               strip.text.y = element_text(size = 14))

【问题讨论】：

是的，只需将颜色和形状映射到仅包含这两个值的变量。你能发布你的代码吗？
不知道你是如何做到这一点的，很难提供帮助。但是，我猜您只有一个列，其中包含有关部门（Phy、Maths、Polit. Sci）和变量（女性百分比、分歧）的信息。您必须将第一部分拆分出来才能对其进行刻面。现在您只需要拆分可变部分并将其用作形状/颜色的映射。可以通过可重现的示例给出更具体的答案。
根据您的两个 cmets，我已包含用于生成此图的代码。

标签： r ggplot2 legend

【解决方案1】：

在你定义df之后继续

明确使用的库：

library("ggplot2")
library("reshape2")
library("grid")

制作df.m 的另一种方法，其中还包括将两个不同的度量（“女性百分比”和“分歧”）拉到一个列和部门（“数学”、“物理”、“政治。科学” .") 到另一列中。

df.m <- melt(df, id="Years")
df.m$measure <- gsub("(.*) \\(.*", "\\1", df.m$variable)
df.m$facet <- gsub(".*\\((.*)\\)", "\\1", df.m$variable)

您的绘图代码，放入单个语句中。 colour 和 shape 现在映射到度量，而不是 variable。手册shape 和colour 刻度也只有两个条目。我将图例移到顶部只是因为它不再是相同的大小/形状，因此没有像以前那样排列整齐；你可以把它放在任何你想要的地方。

ggplot(df.m, aes(group=1, x=Years, y=value, colour=measure, shape=measure)) +
    scale_colour_manual(name='', values=c('chartreuse4', 'deepskyblue3')) +
    scale_shape_manual(name='', values=c(19, 17)) +
    geom_point(size=3) +
    facet_grid(.~facet) +
    coord_cartesian(ylim=(c(0.0,0.45))) +
    scale_x_discrete("", expand=c(0.01, 0.01)) +
    scale_y_continuous(name="") +
    guides(colour=guide_legend(title='', ncol=2, keywidth=unit(2,'lines'))) +
    theme(legend.position="top",
          legend.key=element_blank(),
          legend.background=element_rect(colour='black', fill='transparent'),
          legend.text=element_text(size=12),
          panel.grid.minor = element_blank(),
          panel.margin=unit(1, 'lines'),
          axis.text=element_text(size=12,color="black"),
          axis.title=element_text(size=16),
          strip.text.y = element_text(size = 14))

要回答关于仅在图例中显示某些值的确切问题，您可以使用 breaks 参数来调整比例。请改用这些 scale_colour_manual 和 scale_shape_manual 行：

g <- g + scale_colour_manual(name='',
                             breaks=c('% of Women (Physics)', 'Divergence (Physics)'),
                             labels=c('% of Women', 'Divergence'),
                             values=c('chartreuse4', 'deepskyblue3','chartreuse4', 
                                      'deepskyblue3', 'chartreuse4', 'deepskyblue3'))
g <- g + scale_shape_manual(name='',
                            breaks=c('% of Women (Physics)', 'Divergence (Physics)'),
                            labels=c('% of Women', 'Divergence'),
                            values=c(19, 17, 19, 17, 19, 17))

但是，从长远来看，让您的数据准确地反映您试图映射到美学的事物会更好。

【讨论】：

感谢您对答案的精美解释。代码更短、更简单，而且能做我想做的事。

【解决方案2】：

我会通过简单地为“女性百分比”和“分歧”创建一个分组变量来做到这一点。您的案例特别简单，因为这两个术语的长度完全相同。您可以使用substr 从整个字符串中拆分出您想要的术语。希望其他人会在 ggplot2 本身内加入如何做到这一点。

这里我只是创建了一个新变量来代表你想要着色的两个组。

df.m$groups = substr(df.m$variable, 1, 10)

然后只需将此变量用作您的color 和shape 美学而不是variable。

ggplot(df.m, aes(x=Years, y=value, colour=groups, shape=groups)) +
    geom_point(size=3) + 
    facet_grid(.~facet) +
    scale_colour_manual(values = c("chartreuse4", "deepskyblue3"))

【讨论】：

+1 为答案。但是，我会同意布赖恩的回答。对于像我这样的 R 新手来说，这些解释真的很有帮助。

【解决方案3】：

您应该能够通过使用带有参数 guide='none' 的 scale_* 调用或附加例如+ 指南（颜色=FALSE）

http://docs.ggplot2.org/0.9.2.1/guides.html

【讨论】：