【发布时间】:2018-07-06 13:07:45
【问题描述】:
我是 R 的初学者。我想做一个简单的绘图。我有一个从 twitter 数据集中提取的包含 2 列的数据集:“关注者”显示用户拥有的关注者数量,“计数”显示有多少用户拥有那么多关注者。我正在尝试绘制这个数据集。到目前为止我能想到的最好的绘图是:
p<-ggplot(df, aes(x=df$user_followersCount, y= df$x )) +
geom_area(alpha=0.6) +
scale_x_continuous(name="Followers", limits=c(0, 30000000)) +
scale_y_continuous(name="Count") +
scale_x_sqrt()
因为长尾巴,剧情不好。我希望以更大的比例显示前 1000 个关注者,并压缩尾部。但我不知道怎么做。请帮我。 或者您有什么建议可以更好地绘制这些数据?
【问题讨论】:
-
是的,答案是绘制 log(data +1) 而不是绘制原始数据。
-
请发布您的数据的代表性样本,最好是
dput的输出 -
另外,在
ggplot函数中使用dataframe$column可能会导致错误;相反,它只需要裸列名称