内容

1rstudio.:快速游览

窗子

选项

帮助

环境,历史和文件

2R.: 第一印象

类型值和数学公式R.命令提示符

1 + 1
## [1] 2

将值分配给符号(变量)

x = 1 x + x
## [1] 2

调用诸如C(),它占用了任何数量的值并返回一个单个向量

x = c(1,2,3)x
## [1] 1 2 3

R.功能,如sqrt(),通常在向量上有效地运行

y = sqrt(x)y
## [1] 1.000000 1.414214 1.732051

通常有几种方法可以完成一项任务R.

x = c(1,2,3)x
## [1] 1 2 3
x < -  c(4,5,6)x
## [1] 4 5 6
x < -  7:9 x
## [1] 7 8 9
10:12  - > x x
## [1] 10 11 12

有时R.弄清楚的东西是有趣的吗?

x < -  c(1,2,3) - > y x
## [1] 1 2 3
y
## [1] 1 2 3

2.1R.数据类型:矢量和列表

'原子'vectors

  • 类型包括整数,数字(浮点数;真实),复杂,逻辑,字符,原始(字节)

    人们< -  C(“Lori”,“Nitesh”,“Valerie”,“Herve”)人
    ## [1]“Lori”“Nitesh”“Valerie”“Herve”
  • 可以命名原子矢量

    人口< -  c(水牛= 259000,罗切斯特= 210000,`纽约`= 8400000)人口
    ##布法罗罗切斯特纽约## 259000 210000 8400000
    log10(人口)
    ##布法罗罗切斯特纽约## 5.413300 5.322219 6.924279
  • 统计概念喜欢NA.(“无法使用”)

    真实性< -  c(真实,假,na)的真实性
    ## [1]真假NA
  • 像'和'这样的逻辑概念(), '或者' (|), 并不是' (!!

    !真的
    ## [1]假真NA
    真实性|!真的
    ## [1]真正的na
    真实&!真实性
    ## [1]假假NA
  • infinity等数值概念(INF.)或不 - a-number(,例如,0/0)

    undefined_numeric_values < -  C(NA,0/0,NAN,INF,-INF)undefined_numeric_values
    ## [1] Na Nan NaN Inf-inff
    sqrt(undefined_numeric_values)
    ##警告SQRT(UNDEFINED_NUMERIC_VALUES):NANS生产
    ## [1] Na Nan Nan Inf Nan
  • 共同的字符串操纵

    帖特罗普尔(人)
    ## [1]“Lori”“Nitesh”“Valerie”“Herve”
    Substr(人,1,3)
    ## [1]“lor”“nit”“val”“她”
  • R.是一种绿色消费者 - 回收短矢量,可与长向量对齐

    x < -  1:3 x * 2#'2'(长度向量1)回收到c(2,2,2)
    ## [1] 2 4 6
    真实性|NA.
    ## [1]真正的na na
    真实&na
    ## [1] na false na
  • 嵌套操作非常常见,可以同时紧凑,混淆和表现力([:子集;<: 少于)

    Substr(Tolower(人),1,3)
    ## [1]“lor”“nit”“val”“她”
    人口[人口<1000000]
    ## Buffalo Rochester ## 259000 210000

清单

  • 列表类型可以包含其他向量,包括其他列表

    Frenemies = list(friends = c(“Larry”,“Richard”,“Vivian”),敌人= C(“迪克”,“迈克”))果岭
    ## $ Friends ## [1]“Larry”“Richard”“Vivian”## ## $敌人## [1]“迪克”“迈克”
  • [将一个列表分配以创建另一个列表,[[提取列表元素

    Frenemies [1]
    ## $ Friends ## [1]“Larry”“Richard”“Vivian”
    Frenemies [C(“敌人”,“朋友”)]
    ## $敌人## [1]“迪克”“迈克”## ## $ Friends ## [1]“Larry”“Richard”“Vivian”
    Frenemies [[敌人“]]
    ## [1]“迪克”“迈克”

因素

  • 字符类似的矢量,但有值限于特定级别

    性别=因素(C(“男性”,“男性”,“女性”),水平= C(“女性”,“男性”,“雌雄同体”))性别
    ## [1]男性女性##水平:女性雌性雌雄同体
    性==“女性”
    ## [1]假误真实
    表(性)
    ##性爱##女性雌性雌雄同体## 1 2 0
    性爱[性==“女”]
    ## [1]女性##水平:女性男性雌雄同体

2.2课程:data.frame及以后

变量通常以高度结构化的方式彼此相关,例如,电子表格中的数据的两个“列”

x = rnorm(1000)#1000随机正常偏差y = x + rnorm(1000)#另一1000偏离,作为x图之间的函数(y x)#x和y之间的关系

方便把它们操纵在一起

  • data.frame():在电子表格中的列

    df = data.frame(x = x,y = y)头部(df)#前6行
    ## x y ## 1 0.4319017 -0.9987349 ## 2 0.8354825 0.5375856 0.5375856 0.5375856 0.5375856 0.5375856 0.5375856 0.5375856 0.5375856 0.5375856 0.5375856 0.5375856 0.5375856 0.5375856 0.5375856 ## 4 -9015924 ## 4 -0.6308896 -1.1659811#5 1.5897967 0.5246667 0.5246667 0.524669#6 2.7946085 1.6279334 1.6279334 1.6279334
    图(Y〜x,df)#与上面相同

  • 查看所有数据查看(DF)。汇总数据摘要(DF)

    摘要(DF)
    ## x y ## min。:-3.37638分钟。:-4.61834 ## 1ST曲.:--0.69195第1章:0.0.87559 ##中位数:0.03476中位数:0.03680 ##均值:0.02679平均值:0.05026 ## 3RD曲。:0.04620 3rd qu。:1.04719 ## max。:最多3.41133。:5.23651
  • 易于以协调的方式操纵数据,例如访问列X$并且仅仅是那些大于0的值

    kids = df [df $ x> 0,] head(solderx)
    ## X Y ## 1 0.4319017 -0.99873488 ## 2 0.8354825 0.53758570 0.53758570 0.5246689#6 2.7946085 1.62793340#6 0.6262119 0.05052979 0.05052979 0.05052979 0.05052979 0.050529790 1.05262119 0.05052979 0.050582119 0.05052979#
    绘图(Y〜x,施加)

  • R.是内省 - 问自己

    班级(DF)
    ## [1]“data.frame”
    昏暗(DF)
    ## [1] 1000 2
    Colnames(DF)
    ## [1]“x”“y”
  • 矩阵()一个相关的类,所有元素具有相同类型(adata.frame()需要列中的元素为相同类型,但列之间的元素可以是不同的类型)。

散点图让人想适合线性模型(进行回归分析)

  • 用一个公式描述变量之间的关系
  • 在第二个论点中找到的变量

    适合< -  lm(y〜x,df)
  • 可视化点,并添加回归线

    绘图(y〜x,df)abline(fit,col =“红色”,lwd = 3)

  • 将适合作为ANOVA表汇总

    ANOVA(适合)
    ##方差表的分析## ##响应:Y ## DF SUM SQ平均SQ F值Pr(> F)## x 111131.95 1132 1132.6 <2.2E-16 *** ##残差998 997.46 1 ##--- ## signif。代码:0'***'0.001'**'0.01'*'0.05'。'0.1''1
  • N.B.- '键入I'的平方和,所以独立变量的顺序很重要;用drop1()对于'type III'。看Datacamp Quick-R

  • 内省 - 什么课程是合身?什么方法我可以申请这个课堂的对象吗?

    班级(适合)
    ## [1]“lm”
    方法(class = class(fit))
    ## [1] Add1别名Anova Case.names ## [5]强制困难烹饪。Distance偏差## [9] DFBETA DFBETAS DROP1 Dummy.Coef ## [13]效果提取物族公式## [17] Hatvalues影响初始化kappa ## [21]标签loglik model.frame model.matrix ## [25] nobs plot预测print ## [29] proj qr残差rstandard ## [33] Rstudent Show Simulate Slotsfroms3 ## [37]摘要变量.NamesVcov ##查看“?方法”用于访问帮助和源代码

2.3帮助!

帮助可用rstudio.或交互式

  • 查看帮助页面rnorm()

    ?rnorm.
  • '使用'部分介绍如何使用该功能

    rnorm(n,平均值= 0,sd = 1)
  • 参数,有些具有默认值。参数首先按名称匹配,然后是位置

  • “参数”部分介绍了应该是什么参数

  • “值”部分介绍返回值

  • “示例”部分说明了使用

  • 通常包括相关技术文件的引用,参考相关功能,晦涩的细节

  • 可能是恐吓,但最终实际上非常有用