R语言入门手册

1 什么是R语言
R语言是一个开源的数据分析环境,起初是由数位统计学家建立起来,以更好的进行统计计算和绘图,这篇wiki中包含了一些基本情况的介绍。由于R可以通过安装扩展包(Packages)而得到增强,所以其功能已经远远不限于统计分析,如果感兴趣的话可以到官方网站了解关于其功能的更多信息。

至于R语言名称的由来则是根据两位主要作者的首字母(Robert Gentleman and Ross Ihaka),但过于简短的关键词也造成在搜索引擎中很不容易找到相关的资料。不过这个专门的搜索网站可以帮到你。

640

2 为什么要学习R语言点我,给你一千个R的理由
可能你想说,“我已经学会了spss/sas/stata…,为什么还要去学习R呢?”如下几方面可能会吸引到你:

  • 编程入门语言: 如果你之前没有编程经验,但是学习工作中经常需要计算、统计、绘图,那R是你的首选(Python也许不太同意,不管他)。语法结构简单,上手较快,而且函数和pckages都有很好的实例文档。R是一门自学型语言,来R吧,你不会孤独。
  • R是免费开源软件:现在很多学术期刊都对分析软件有版权要求,而免费的分析工具可以使你在这方面不会有什么担心。另一方面,如果学术界出现一种新的数据分析方法,那么要过很长一段时间才会出现在商业软件中。但开源软件的好处就在于,很快就会有人将这种方法编写成扩展包,或者你自己就可以做这件工作。
  • 命令行工作方式:许多人喜欢类似SPSS菜单式的操作,这对于初学者来说很方便入门,但对于数据分析来说,命令行操作会更加的灵活,更容易进行编程和自动化处理。而且命令行操作会更容易耍酷,不是嘛,一般人看到你在狂敲一推代码后得到一个分析结果,对你投来的目光是会不一样的。
  • 小巧而精悍:R语言的安装包更小,大约不到40M,相比其它几个大家伙它算是非常小巧精悍了。目前R语言非常受到专业人士欢迎,根据对数据挖掘大赛胜出者的调查可以发现,他们用的工具基本上都是R语言。此外,从最近几次R语言大会上可以了解到,咨询业、金融业、医药业都在大量的使用R语言,包括google/facebook的大公司都在用它。因此,学习R语言对你的职业发展一定是有帮助的。
    64

3 R语言的学习方法
学习R是一件非常轻松的事情,初学者需要记住的就是:

利用丰富的帮助文档
亲手键入代码并理解其意义
在笔记里记下一些重点或心得(个人推荐Evernote)
坚持练习,对手边的数据进行应用分析
理解背景知识,细节很重要。

R的获取
640
1000
R包(package)

R包(package):R函数、数据、帮助文件、预编译代码以一种定义完善的格式组成的集合

2000
100

1 基础数据结构

1.1 向量

4000

1.2 矩阵

3000

1.3 数组

1.4 数据框

6000
84

1.4.1 因子变量

变量:类别变量,数值变量
类别数据对于分组数据研究非常有用。(男女,高中低)
R中的因子变量类似于类别数据。

59

类别变量,有序变量称为因子,决定了数据的分析方式和视觉呈现形式
Attach()可以将数据框添加到R的搜索路径中,当R遇到一个变量名后,将检测搜索路径中的数据框,定位这个变量

1.5 列表

列表以一种简单的方式组织和调用不相干的信息
R函数的许多运行结果都是以列表的形式返回

常用函数
5000
7000

R流程控制

89

91

8000

9000

2.5 R函数

函数是组织好的,可重复使用的,用来实现单一,或相关联功能的代码段

3读写数据

其他常用函数

100001

4 数据清理

110001

4.1 tidyr包

tidyr包的四个函数
宽数据转为长数据:gather()
长数据转为宽数据:spread()
多列合并为一列: unite()
将一列分离为多列:separate()

120001

4.2 dplyr包

dplyr包五个函数用法:
筛选: filter
排列: arrange()
选择: select()
变形: mutate()
汇总: summarise()
分组: group_by()

130001

5 绘图

140001

5.1 长数据与宽数据

89

77

5.2 图形参数位置

86

55
  • 图形参数:
    符号和线条:pch、cex、lty、lwd
    颜色:col、col.axis、col.lab、col.main、col.sub、fg、bg
    文本属性:cex、cex.axis、cex.lab、cex.main、cex.sub、font、font.axis、font.lab、font.main、font.sub
  • 文本添加、坐标轴的自定义和图例
    title()、main、sub、xlab、ylab、text()
    axis()、abline()
    legend()
  • 多图绘制时候,可使用par()设置默认的图形参数
    par(lwd=2, cex=1.5)
  • 图形参数设置:
    par(optionname=value,…)
    par(pin=c(width,height)) 图形尺寸
    par(mfrow=c(nr,nc)) 图形组合,一页多图
    layout(mat) 图形组合,一页多图
    par(mar=c(bottom,left,top,right)) 边界尺寸
    par(fig=c(x1,x2,y1,y2),new=TURE) 多图叠加或排布成一幅图

63

5.3 柱形图

54

实例

5.4 二元图

72
图片.png

56

5.5 饼状图

556

5.6 直方图

59

5.7 聚类图

150001

5.8 维恩图

40

图片输出

  • 直接导出
    160001
  • 命令

作者:周运来就是我
链接:https://www.jianshu.com/p/2a1a2ca1a916
来源:简书

承接各种网站开发与修改、爬虫、数据采集分析、小程序等任务

Html+Css+JS+PHP+Nodejs+Python

专治网站各种不服

一起探讨,互相学习,共同进步!有事儿您说话。

This entry was posted in R语言 by 织梦先生. Bookmark the permalink.