内容

1使用R.在真实生活中

1.1组织工作

通常,工作组织到目录中:

  • 包含一个文件夹R.脚本(脚本/ brfsss-visualize.r
  • “外部”数据如我们使用的CSV文件,通常在单独的文件夹中(extdata / brfss-subset.csv
  • (有时)R.用磁盘写入的对象Saverds().rds.文件)表示最终结果或中间'检查点'(extdata /全清除.rds)。将数据读成一个R.会话使用readrds()
  • setwd()导航到包含脚本/,extdata /文件夹的文件夹
  • 源整个脚本源(“脚本/ brfss-iscusization.r”)

R.还可以保存当前会话的状态(选择时提示放弃()R.),并查看和保存历史()当前会议;我没有发现这些在自己的工作流动中有用。

1.2R.

我们使用过的所有功能来自那是自动的装了什么时候R.开始。装载的包装是搜索()小路。

搜索()
## [1]“.globalenv”包装:ggplot2“包装:生存”## [4]“包:生物发言”包装:统计“包:图形”## [7]“包:grdevices”“包:Utils“包:数据集”## [10]“包:方法”“AutoLoads”“包:基础”

额外的包可能是安装了R.的图书馆。使用`已安装.packages()或rstudio.接口查看已安装的包。要使用这些包,有必要将它们附加到搜索路径,例如,用于生存分析

图书馆(“生存”)

有很多数千个R.包,而不是所有包装都安装在一个安装中。重要的存储库是

包装可以以各种方式发现,包括CRAN任务观点生物体网页生物体支持网站。

安装包,使用install.packages()或者生物体包,在包装页面上的说明,例如,Genomicranges.。我们在这里安装ggplot2.包裹。

install.packages(“ggplot2”,repos =“https://cran.r-project.org”)

需要安装一次包,然后可以在任何内使用R.会议。

2图形和可视化

加载brfss-subset.csv数据

path < - “extdata / brfss-subset.csv”#或file.choose()brfss < -  read.csv(路径)

通过胁迫清洁它因子

BRFSS $年< - 因素(BRFSS $年)

2.1根据R.图形

在正常的工作流程期间可快速探索。

  • 主要功能:阴谋()stay()箱形图(),......
  • 图形参数 - 请参阅,但经常作为论点提供阴谋(), 等等。
  • 通过分层信息构建复杂的曲线,例如点,回归线,注释。

    BRFSS2010MALE < - 子集(BRFSS,(年== 2010)&(SEX ==“男性”))FIT < -  LM(重量〜高度,BRFSS2010MALE)绘图(重量〜高度,BRFSS2010MALE,MAIN =“2010,MALES”)abline(拟合,lwd = 2,col =“蓝色”)点(180,90,pch = 20,cex = 3,col =“红色”)

  • 复杂图形方法:创建一个面板网格(例如,par(mfrows = c(1,2)),用绘图填充,恢复原始布局。

    brfssfemale < -  subset(brfss,sex ==“meary”)opar = par(mfrow = c(2,1))#布局:2'行'和1'列'hist(#first panel  -  1990 brfssfemale [brfssfemale$年== 1990,“重量”],Main =“Mealan,1990”)SIGR(#第二面板 -  2010年BRFSSFemale [BRFSSFemale $年== 2010,“重量”,Main =“Memale,2010”)

    par(opar)#恢复原始布局

2.2什么是良好的图形显示?

  • 常见规模进行比较
  • 高效使用空间
  • 仔细的颜色选择 - 定性,渐变,不同的方案;颜色盲目意识;......
  • 重点是数据而不是标签
  • 传达统计不确定性

2.3图形语法:GGPlot2

图书馆(GGPLOT2)

'图形语法'

  • 指定数据和“美学”(AES())被绘制
  • 添加图层(geom _ *())信息

    GGPLOT(BRFSS2010MALE,AES(X =高度,Y =重量))+ GEOM_POINT()+ GEOM_SMOOTH(方法=“LM”)

  • 捕捉一个情节并增加它

    PLT < -  GGPLOT(BRFSS2010MALE,AES(x =高度,Y =重量))+ GEOM_POINT()+ GEOM_SMOOTH(方法=“LM”)PLT + LABS(TITLE =“2010男性”)

  • 面部_ *()对于布局

    ggplot(brfssfemale,aes(x =高度,y = weigh))+ geom_point()+ geom_smooth(方法=“lm”)+ facet_grid(。〜年)

  • 选择显示以强调数据的相关方面

    ggplot(brfssfemale,aes(重量,填充=年))+ geom_dentions(alpha = .2)