通常,工作组织到目录中:
脚本/ brfsss-visualize.r
)extdata / brfss-subset.csv
)Saverds()
(.rds.
文件)表示最终结果或中间'检查点'(extdata /全清除.rds
)。将数据读成一个R.会话使用readrds()
。setwd()
导航到包含脚本/,extdata /文件夹的文件夹源(“脚本/ brfss-iscusization.r”)
。R.还可以保存当前会话的状态(选择时提示放弃()
R.),并查看和保存历史()
当前会议;我没有发现这些在自己的工作流动中有用。
我们使用过的所有功能来自包那是自动的装了什么时候R.开始。装载的包装是搜索()
小路。
搜索()
## [1]“.globalenv”包装:ggplot2“包装:生存”## [4]“包:生物发言”包装:统计“包:图形”## [7]“包:grdevices”“包:Utils“包:数据集”## [10]“包:方法”“AutoLoads”“包:基础”
额外的包可能是安装了在R.的图书馆。使用`已安装.packages()或rstudio.接口查看已安装的包。要使用这些包,有必要将它们附加到搜索路径,例如,用于生存分析
图书馆(“生存”)
有很多数千个R.包,而不是所有包装都安装在一个安装中。重要的存储库是
包装可以以各种方式发现,包括CRAN任务观点和生物体网页和生物体支持网站。
安装包,使用install.packages()
或者生物体包,在包装页面上的说明,例如,Genomicranges.。我们在这里安装ggplot2.包裹。
install.packages(“ggplot2”,repos =“https://cran.r-project.org”)
需要安装一次包,然后可以在任何内使用R.会议。
加载brfss-subset.csv数据
path < - “extdata / brfss-subset.csv”#或file.choose()brfss < - read.csv(路径)
通过胁迫清洁它年
因子
BRFSS $年< - 因素(BRFSS $年)
在正常的工作流程期间可快速探索。
阴谋()
那stay()
那箱形图()
,......?
,但经常作为论点提供阴谋()
, 等等。通过分层信息构建复杂的曲线,例如点,回归线,注释。
BRFSS2010MALE < - 子集(BRFSS,(年== 2010)&(SEX ==“男性”))FIT < - LM(重量〜高度,BRFSS2010MALE)绘图(重量〜高度,BRFSS2010MALE,MAIN =“2010,MALES”)abline(拟合,lwd = 2,col =“蓝色”)点(180,90,pch = 20,cex = 3,col =“红色”)
复杂图形方法:创建一个面板网格(例如,par(mfrows = c(1,2))
,用绘图填充,恢复原始布局。
brfssfemale < - subset(brfss,sex ==“meary”)opar = par(mfrow = c(2,1))#布局:2'行'和1'列'hist(#first panel - 1990 brfssfemale [brfssfemale$年== 1990,“重量”],Main =“Mealan,1990”)SIGR(#第二面板 - 2010年BRFSSFemale [BRFSSFemale $年== 2010,“重量”,Main =“Memale,2010”)
par(opar)#恢复原始布局
图书馆(GGPLOT2)
'图形语法'
AES()
)被绘制添加图层(geom _ *()
)信息
GGPLOT(BRFSS2010MALE,AES(X =高度,Y =重量))+ GEOM_POINT()+ GEOM_SMOOTH(方法=“LM”)
捕捉一个情节并增加它
PLT < - GGPLOT(BRFSS2010MALE,AES(x =高度,Y =重量))+ GEOM_POINT()+ GEOM_SMOOTH(方法=“LM”)PLT + LABS(TITLE =“2010男性”)
用面部_ *()
对于布局
ggplot(brfssfemale,aes(x =高度,y = weigh))+ geom_point()+ geom_smooth(方法=“lm”)+ facet_grid(。〜年)
选择显示以强调数据的相关方面
ggplot(brfssfemale,aes(重量,填充=年))+ geom_dentions(alpha = .2)