r语言文章/教程

R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。R是统计领域广泛使用的诞生于1980年左右的S语言的一个分支。可以认为R是S语言的一种实现。而S语言是由AT&T贝尔实验室开发的一种用来进行数据探索、统计分析和作图的解释型语言。

R语言-基本图形

目的:   1.将变量的分布进行可视化展示   2.通过结果进行跨组比较 内容:   1.条形图,箱线图,点图   2.饼图和扇形图   3.直方图与核密度图 1.条形图          条形图通过垂直和水平的条形展示了类别型变量的分布     1.1普通条形图 1 library(vcd) 2 counts <- table(Arthritis$Improved) 3 barplot( »

R语言学习笔记(二)词云图绘制

运用wordcloud函数 一、wordcloud函数介绍 函数帮助:通过help("wordcloud")查看 wordcloud(words,freq,scale=c(4,.5),min.freq=3,max.words=Inf,random.order=TRUE, random.color=FALSE, rot.per=.1,colors="black",ordered.colors=FAL »

独家 | R语言中K邻近算法的初学者指南:从菜鸟到大神(附代码&链接)

作者:Leihua Ye, UC Santa Barbara 翻译:陈超 校对:冯羽 本文约2300字,建议阅读10分钟 本文介绍了一种针对初学者的K临近算法在R语言中的实现方法。 本文呈现了一种在R语言中建立起KNN模型的方式,其中包含了多种测量指标。 Mathyas Kurmann拍摄,来自于Unsplash “如果你有5分钟时间可以离开比尔·盖茨生活,我敢打赌你很富有。” 背景 在机器学习 »

学数据分析/挖掘应该先学Python,还是R语言?

  导读:学数据分析/挖掘应该先学哪门语言?大家在选择统计工具时,大多会在R语言、SPSS和SAS三者之间纠结。那为什么一般更爱选R语言呢?本文会给你答案。 作者:木羊同学 来源:华章计算机(ID:hzbook_jsj) 今天聊R语言。R语言的知名度很玄学,介乎于热门首选和无人知晓之间。你对R语言的印象,完全取决于你是谁,你问的是谁以及什么时候问。如果早个两三年,你问“学数据分析/挖掘应该先学哪 »

用R语言实现密度聚类dbscan

作者:张丹,R语言中文社区专栏特邀作者,《R的极客理想》系列图书作者,民生银行大数据中心数据分析师,前况客创始人兼CTO。个人博客 http://fens.me, Alexa全球排名70k。 前言 聚类是一种将数据点按一定规则分群的机器学习技术,k-Means聚类是被用的最广泛的也最容易理解的一种。除了K-Means的方法,其实还有很多种不同的聚类方法,本文将给大家介绍基于密度的聚类,我们可以通 »

【配置】使用Java调用R语言

机器配置:64位win7,R-3-3-3; 步骤如下: 一,下载R-3-3-3,并安装 首先下载,直接在网上搜索R语言官网下载下来的都是一些.tar.gz文件,不知道怎么弄。不过下面这个网址可以下载exe的文件: http://cran.r-project.org/ 安装很简单,一直下一步就行,但是中间有一步需要注意,就是要根据自己电脑是32位的还是64位的来选择软件的位数,如下所示: 理论上6 »

R语言基本数据结构

1、向量 向量是R语言中最基本的数据类型,在R语言中没有单独的变量。 (1)  创建向量 R语言中可以用 = 或者 <- 来赋值。 向量名 <- 向量 或  向量名 = 向量 向量的创建方式有c()函数,seq()函数等。 注:R中的向量默认为列向量,如果要得到行向量需要对其进行转置。       (2)  引用 待引用向量为:test = c(6,7,8,9,10)。 a、用下标 »

使用R语言把火灾数据可视化

  最近几周,有关四川凉山部分地区发生毁灭性野火的新闻在新闻中尤为突出。尽管大多数野火是人为意外引发的,但诸如风和干旱之类的天气条件会加剧火势的蔓延和强度。更好地了解历史野火趋势和原因可以为火灾管理提供信息并挽救生命和财产。在本使用R语言把火灾数据可视化练习中,我们将使用R进行探索性数据可视化我们了解了凉山的野火历史数据。在决定对新数据集进行进一步分析时,探索性数据可视化是重要的第一步。如果您愿意 »

白话空间统计之二十五:空间权重矩阵(四)R语言中的空间权重矩阵(2):不同空间关系对莫兰指数的影响...

上一篇,讲了R语言中的空间权重矩阵的结构,这一节讲讲R语言里面空间权重矩阵的自定义。先做一个默认的空间关系对象,然后再进行修改。这种方式,用牛爵爷的话来说,叫做“踩在巨人的肩膀上”(当年,牛爵爷说这句话的时候,绝对不是谦虚,而是说:你们就算是巨人,也得老老实实被我踩在脚下)—— #东北 db <- c("吉林","辽宁","黑龙江") #华北 hb <-c("内蒙古","北京", »

R语言mFilter包的安装

在对数据进行HP滤波时,用到了mFilter包,直接通过指令未安装成功,下面是自己找的一安装方法: 在下面地址下载包的压缩文件 https://cran.r-project.org/src/contrib/Archive/mFilter/?C=N;O=D 然后进行手动本地安装,在菜单栏,程序包→”Install package from local zip file…”; 在弹出的窗口,选择自 »

2016天善智能交流会第22场: R语言为量化而生

跨界知识聚会系列文章,“知识是用来分享和传承的”,各种会议、论坛、沙龙都是分享知识的绝佳场所。我也有幸作为演讲嘉宾参加了一些国内的大型会议,向大家展示我所做的一些成果。从听众到演讲感觉是不一样的,把知识分享出来,你才能收获更多。 关于作者 张丹(Conan), 程序员Java,R,Nodejs weibo:@Conan_Z blog: http://blog.fens.me email: [e »

解密R语言函数的环境空间

R的极客理想系列文章,涵盖了R的思想,使用,工具,创新等的一系列要点,以我个人的学习和体验去诠释R的强大。 R语言作为统计学一门语言,一直在小众领域闪耀着光芒。直到大数据的爆发,R语言变成了一门炙手可热的数据分析的利器。随着越来越多的工程背景的人的加入,R语言的社区在迅速扩大成长。现在已不仅仅是统计领域,教育,银行,电商,互联网….都在使用R语言。 要成为有理想的极客,我们不能停留在语法上,要掌握 »

R语言可视化学习笔记之ggrepel包

作者简介Introductiontaoyan:伪码农,R语言爱好者,爱开源。 个人博客: https://ytlogos.github.io/ 往期回顾 R语言学习笔记之聚类分析 R语言可视化学习笔记之ggpubr包 R语言可视化学习笔记之添加p-value和显著性标记 R语言可视化学习笔记之相关矩阵可视化包ggcorrplot library(ggplot2) #使用数据集mtcars演示 »

半折预售:新书-R语言数据可视化之美|ggplot2作者推荐

我本来想等正式发售的时候,再告诉大家我的新书《R语言数据可视化之美》已经出版,奈何新书还太贵,这几天刚好京东有买100减50的活动,所以想想还是赶紧告诉大家吧,不然平时购买的话,太真有点小贵哦。 领券折上折,原价300再减30,400再减60,600再减100。 作者介绍 张杰,数据分析与可视化达人;EasyCharts微信公众号联合主创;著有15篇SCI(E)和SSCI学术论文;出版专著《Ex »

《R语言编程艺术》——2.4 常用的向量运算

2.4 常用的向量运算 接下来将介绍一些常用的向量运算,包括算术和逻辑运算、向量索引以及一些创建向量的有用方法。然后将给出两个使用这些运算的扩展案例。2.4.1 向量运算和逻辑运算记住R是一种函数式语言,它的每一个运算符,包括下例中的+,实际上也是函数。 再回顾一次,标量实际上是一元向量,因此向量也可以相加,+算子按元素逐一进行运算。 如果你熟悉线性代数,当将两个向量相乘时,你也许会对所发生的感 »

R语言热力图渐变分析——西班牙开店选址

在芝加哥开一家店铺,主要为西班牙人进行服务,因此考虑芝加哥位置下的:城市的西班牙创造收入,西班牙家庭数量,西班牙人口数量,西班牙的祖辈习俗,西班牙语言的普及程度区域,周围西班牙的经济能力。 1.城市人口总平均值分析 不同城市下的西班牙人口总平均值 city Inc_Race_Hispanic_Aggr_Average CHICAGO 2,580,915,057 CICERO 403,886,62 »

《数据科学:R语言实现》——3.3 转换数据类型

本节书摘来自华章出版社《数据科学:R语言实现》一 书中的第3章,第3.3节,作者:R for Data Science Cookbook 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.3 转换数据类型 如果我们在数据导入阶段不指定数据类型,R会自动地给导入的数据集分配一个数据类型。但是,如果分配的数据类型和事实不符,我们可能会在后续的数据操作中遇到困难 »

R语言关于自编函数的常见问题

构造求均值的函数 上图中函数的名称为mean_x,他只有一个变量就是x,我们先对数据进行预处理,我们先把x转换为逻辑向量,然后使用which语句找到空值的下标,当他没有空值的时候,就不对原数据进行处理,如果有空值,我们就把空值去掉,得到新的数据。然后我们计算出新的数据的长度,先把sum_ x赋值为零,构造for循环对数据进行累加处理,那么我们就得到了数据的总和,用总和除数据的长度就是我们要得到的 »

R语言安装包出现的问题:关于package'***' is not available

最近下载了最新的R版本后,在下载包的时候经常碰到这样的错误:package'***' is not available(for R version 3.4.1) 可使用下面的代码进行安装: source("http://bioconductor.org/biocLite.R") biocLite("包名") 将会下载BiocInstaller包,通过该包可以更好的下载或更新Bioconductor »

大数据之R语言速成与实战

什么是R语言? R语言由新西兰奥克兰大学的Ross Ihaka和Robert Gentleman两人共同发明。其词法和语法分别源自Scheme和S语言。   R定义:一个能够自有有效的用于统计计算和绘图的语言和环境,它提供了广泛的统计分析和绘图技术。   R是用于统计分析、绘图的语言和操作环境,属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。   R语言 »