内容

1RStudio:快速游览

窗格

选项

帮助

环境、历史和文件

2R:第一印象

类型值和数学公式R的命令提示符

1 + 1
# # 2 [1]

给符号(变量)赋值

x = 1 x + x
# # 2 [1]

调用函数,例如c (),它接受任意数量的值并返回单个值向量

x = c(1,2,3) x
## [1] 1 2 3

R功能,比如sqrt (),通常对病媒有效

y =√x y
## [1] 1.000000 1.414214 1.732051

完成一项任务通常有几种方法R

x = c(1,2,3) x
## [1] 1 2 3
x <- c(4,5,6) x
## [1] 4 5 6
x <- 7:9 x
## [1] 7 8 9
10:12 -> x x
## [1] 10 11 12

有时R“惊喜”的事情会让你觉得有趣吗

x <- c(1,2,3) -> y x
## [1] 1 2 3
y
## [1] 1 2 3

2.1R数据类型:vector和list

原子的矢量

  • 类型包括整数、数字(浮点数;真实)、复杂、逻辑、字符、原始(字节)

    人们<- c(“Lori”,“Nitesh”,“Valerie”,“Herve”)的人
    ##[1]“Lori”“Nitesh”“Valerie”“Herve”
  • 可以命名原子向量

    人口<- c(水牛=259000,罗切斯特=210000,纽约=8400000)人口
    ## Buffalo Rochester纽约## 259000 210000 8400000
    log10(人口)
    ## Buffalo Rochester纽约## 413300 5.322219 6.924279
  • 统计概念NA(不可用)

    真实度<- c(TRUE, FALSE, NA)真实度
    ## [1] TRUE FALSE NA
  • 像“和”这样的逻辑概念(&)”或“(|)和' not ' (!)

    !真实
    ## [1] FALSE TRUE NA
    真实| !真实
    ## [1] TRUE TRUE NA
    真实& !真实
    ## [1] FALSE FALSE NA
  • 像无穷这样的数字概念()或非a-number (,例如0 / 0)

    undefined_numeric_values <- c(NA, 0/0, NaN, Inf, -Inf
    ## [1] NA NaN NaN Inf -Inf
    √undefined_numeric_values
    ##在sqrt(undefined_numeric_values): NaNs产生
    ## [1] NA NaN NaN Inf NaN
  • 常见的字符串操作

    toupper(人)
    ##[1]“LORI”“NITESH”“VALERIE”“HERVE”
    substr(人,1,3)
    ##[1]“Lor”“Nit”“Val”“她”
  • R绿色消费者——回收短矢量与长矢量对齐

    x <- 1:3 x * 2 # '2' (vector of length 1)回收到c(2,2,2)
    ## [1] 2 4 6
    真实| NA
    ## [1] TRUE NA NA
    真实和NA
    ## [1] NA FALSE NA
  • 嵌套操作很常见,它可以同时紧凑、令人困惑和富有表现力((:子集;<:不到)

    substr(低(人),1,3)
    ##[1]“lor”“nit”“val”“她”
    人口(人口< 1000000)
    ## Buffalo Rochester ## 259000 210000

列表

  • 列表类型可以包含其他向量,包括其他列表

    友敌= list(friends=c(“Larry”,“Richard”,“Vivian”),enemy =c(“Dick”,“Mike”)
    # # # #朋友美元[1]“拉里”“理查德”“维维安”# # # # # # $敌人[1]“迪克”“迈克”
  • (将一个列表子集来创建另一个列表,[[提取一个列表元素

    友敌[1]
    ## $friends ##[1]“Larry”“Richard”“Vivian”
    友敌[c(“敌人”、“朋友”)]
    # # # # $敌人[1]“迪克”“迈克”# # # # # #朋友美元[1]“拉里”“理查德”“维维安”
    友敌[["敌人"]]
    ##[1]“迪克”“迈克”

因素

  • 类似字符的向量,但值限制在特定级别

    性=因子(c(“男性”,“男性”,“女性”),等级=c(“女性”,“男性”,“雌雄同体”))性
    ##[1]男性男性女性级别:女性男性雌雄同体
    性= =“女性”
    ## [1] FALSE FALSE TRUE
    表(性)
    ##性## #雌性雄性雌雄同体# 1 2 0
    性[性= =“女性”)
    ##[1]女性等级:女性男性雌雄同体

2.2类:data.frame和beyond

变量通常以一种高度结构化的方式相互关联,例如,电子表格中的两列数据

x = rnorm(1000) # 1000随机正常偏差y = x + rnorm(1000) #另1000偏差,作为x与y关系的函数

方便一起操作

  • data.frame ():就像电子表格中的列一样

    df = data.frame(X= X, Y= Y) head(df) #前6行
    ## X ## 1 -1.03278893 -3.68339332 ## 2 1.52890241 -0.03821038 ## 3 0.09607513 0.19225389 ## 4 0.25224108 0.67252467 ## 5 -0.31291377 0.57568412 ## 6 1.76355837 0.66167142
    plot(Y ~ X, df) #与上面相同

  • 查看所有数据视图(df)。总结数据总结(df)

    总结(df)
    ## X Y ## Min.:-3.44631 Min.:-4.18143 ## 1st Qu.:-0.63470 1st Qu.:-0.87538 ## Median: 0.11961 Median: 0.06751 ## Mean: 0.05908 Mean: 0.07693 ## 3rd Qu.: 0.75172 3rd Qu.: 1.01160 ## Max: 3.08440马克斯。: 4.62605
  • 易于以协调的方式操作数据,例如,访问列X美元以及那些大于0的值的子集

    positiveX = df[df$X > 0,]头(positiveX)
    ## X Y ## 2 1.52890241 -0.03821038 ## 3 0.09607513 0.19225389 ## 4 0.25224108 0.67252467 ## 6 1.76355837 0.66167142 ## 9 0.52269290 2.14571411 ## 10 0.07547879 -0.11688563
    plot(Y ~ X, positiveX)

  • R反省——问问它本身

    类(df)
    # #[1]“data.frame”
    暗(df)
    ## [1] 1000
    colnames (df)
    ## [1] "X" "Y"
  • 矩阵()一个相关的类,其中所有的元素都具有相同的类型(adata.frame ()要求列内的元素为相同类型,但列间的元素可以为不同类型)。

散点图使人想要拟合线性模型(做回归分析)

  • 使用一个公式来描述变量之间的关系
  • 变量在第二个参数中找到

    配合<- lm(Y ~ X, df)
  • 将这些点可视化,并添加回归线

    plot(Y ~ X, df) abline(fit, col=“red”,lwd=3)

  • 用方差分析表总结适合度

    方差分析(适合)
    ##方差分析表## ## Response: y# # Df Sum Sq Mean Sq F value Pr(>F) ## X 1 1077.91 1077.91 1127.3 < 2.2e-16 *** ##残差998 954.31 0.96 ##——## Signif。编码:0 '***' 0.001 '**' 0.01 '*' 0.05 '。“0.1”1
  • 注意- ' Type I '平方和,所以自变量的顺序很重要;使用drop1 ()III型的。看到DataCamp Quick-R

  • 内省——什么是类适合吗?什么方法我可以应用到这个类的对象吗?

    类(适合)
    # #[1]“lm”
    方法(类=类(合适的))
    ## [1] add1 alias anova case.names ## [5] coerce confine cooks. ## [1] add1 alias anova case.names距离设备## [9]dfbeta dfbetas drop1假人。cef# #[13]影响初始化kappa ##[21]标签logLik模型。框架模型。矩阵## [25]nobs plot predict print ## [29] proj qr residual rstandard ## [33] rstudent show simulate slotsFromS3 ## [37] summary variable.names vcov ## see '?用于访问帮助和源代码的方法

2.3的帮助!

帮助中可用Rstudio或交互

  • 请查看帮助页面rnorm ()

    rnorm ?
  • “用法”部分描述如何使用该函数

    rnorm(n, mean = 0, sd = 1)
  • 参数,有些带有默认值。参数先按名称匹配,然后按位置匹配

  • ' Arguments '部分描述了参数应该是什么

  • ' Value '部分描述了返回值

  • “例子”部分说明了使用方法

  • 经常包括对相关技术文档的引用,对相关功能的参考,模糊的细节

  • 可能会令人生畏,但到最后呢非常有用的