窗格
选项
帮助
环境、历史和文件
类型值和数学公式R的命令提示符
1 + 1
# # 2 [1]
给符号(变量)赋值
x = 1 x + x
# # 2 [1]
调用函数,例如c ()
,它接受任意数量的值并返回单个值向量
x = c(1,2,3) x
## [1] 1 2 3
R功能,比如sqrt ()
,通常对病媒有效
y =√x y
## [1] 1.000000 1.414214 1.732051
完成一项任务通常有几种方法R
x = c(1,2,3) x
## [1] 1 2 3
x <- c(4,5,6) x
## [1] 4 5 6
x <- 7:9 x
## [1] 7 8 9
10:12 -> x x
## [1] 10 11 12
有时R“惊喜”的事情会让你觉得有趣吗
x <- c(1,2,3) -> y x
## [1] 1 2 3
y
## [1] 1 2 3
原子的矢量
类型包括整数、数字(浮点数;真实)、复杂、逻辑、字符、原始(字节)
人们<- c(“Lori”,“Nitesh”,“Valerie”,“Herve”)的人
##[1]“Lori”“Nitesh”“Valerie”“Herve”
可以命名原子向量
人口<- c(水牛=259000,罗切斯特=210000,纽约=8400000)人口
## Buffalo Rochester纽约## 259000 210000 8400000
log10(人口)
## Buffalo Rochester纽约## 413300 5.322219 6.924279
统计概念NA
(不可用)
真实度<- c(TRUE, FALSE, NA)真实度
## [1] TRUE FALSE NA
像“和”这样的逻辑概念(&
)”或“(|
)和' not ' (!
)
!真实
## [1] FALSE TRUE NA
真实| !真实
## [1] TRUE TRUE NA
真实& !真实
## [1] FALSE FALSE NA
像无穷这样的数字概念(正
)或非a-number (南
,例如0 / 0)
undefined_numeric_values <- c(NA, 0/0, NaN, Inf, -Inf
## [1] NA NaN NaN Inf -Inf
√undefined_numeric_values
##在sqrt(undefined_numeric_values): NaNs产生
## [1] NA NaN NaN Inf NaN
常见的字符串操作
toupper(人)
##[1]“LORI”“NITESH”“VALERIE”“HERVE”
substr(人,1,3)
##[1]“Lor”“Nit”“Val”“她”
R绿色消费者——回收短矢量与长矢量对齐
x <- 1:3 x * 2 # '2' (vector of length 1)回收到c(2,2,2)
## [1] 2 4 6
真实| NA
## [1] TRUE NA NA
真实和NA
## [1] NA FALSE NA
嵌套操作很常见,它可以同时紧凑、令人困惑和富有表现力((
:子集;<
:不到)
substr(低(人),1,3)
##[1]“lor”“nit”“val”“她”
人口(人口< 1000000)
## Buffalo Rochester ## 259000 210000
列表
列表类型可以包含其他向量,包括其他列表
友敌= list(friends=c(“Larry”,“Richard”,“Vivian”),enemy =c(“Dick”,“Mike”)
# # # #朋友美元[1]“拉里”“理查德”“维维安”# # # # # # $敌人[1]“迪克”“迈克”
(
将一个列表子集来创建另一个列表,[[
提取一个列表元素
友敌[1]
## $friends ##[1]“Larry”“Richard”“Vivian”
友敌[c(“敌人”、“朋友”)]
# # # # $敌人[1]“迪克”“迈克”# # # # # #朋友美元[1]“拉里”“理查德”“维维安”
友敌[["敌人"]]
##[1]“迪克”“迈克”
因素
类似字符的向量,但值限制在特定级别
性=因子(c(“男性”,“男性”,“女性”),等级=c(“女性”,“男性”,“雌雄同体”))性
##[1]男性男性女性级别:女性男性雌雄同体
性= =“女性”
## [1] FALSE FALSE TRUE
表(性)
##性## #雌性雄性雌雄同体# 1 2 0
性[性= =“女性”)
##[1]女性等级:女性男性雌雄同体
变量通常以一种高度结构化的方式相互关联,例如,电子表格中的两列数据
x = rnorm(1000) # 1000随机正常偏差y = x + rnorm(1000) #另1000偏差,作为x与y关系的函数
方便一起操作
data.frame ()
:就像电子表格中的列一样
df = data.frame(X= X, Y= Y) head(df) #前6行
## X ## 1 -1.03278893 -3.68339332 ## 2 1.52890241 -0.03821038 ## 3 0.09607513 0.19225389 ## 4 0.25224108 0.67252467 ## 5 -0.31291377 0.57568412 ## 6 1.76355837 0.66167142
plot(Y ~ X, df) #与上面相同
查看所有数据视图(df)
。总结数据总结(df)
总结(df)
## X Y ## Min.:-3.44631 Min.:-4.18143 ## 1st Qu.:-0.63470 1st Qu.:-0.87538 ## Median: 0.11961 Median: 0.06751 ## Mean: 0.05908 Mean: 0.07693 ## 3rd Qu.: 0.75172 3rd Qu.: 1.01160 ## Max: 3.08440马克斯。: 4.62605
易于以协调的方式操作数据,例如,访问列X
与美元
以及那些大于0的值的子集
positiveX = df[df$X > 0,]头(positiveX)
## X Y ## 2 1.52890241 -0.03821038 ## 3 0.09607513 0.19225389 ## 4 0.25224108 0.67252467 ## 6 1.76355837 0.66167142 ## 9 0.52269290 2.14571411 ## 10 0.07547879 -0.11688563
plot(Y ~ X, positiveX)
R反省——问问它本身
类(df)
# #[1]“data.frame”
暗(df)
## [1] 1000
colnames (df)
## [1] "X" "Y"
矩阵()
一个相关的类,其中所有的元素都具有相同的类型(adata.frame ()
要求列内的元素为相同类型,但列间的元素可以为不同类型)。
散点图使人想要拟合线性模型(做回归分析)
变量在第二个参数中找到
配合<- lm(Y ~ X, df)
将这些点可视化,并添加回归线
plot(Y ~ X, df) abline(fit, col=“red”,lwd=3)
用方差分析表总结适合度
方差分析(适合)
##方差分析表## ## Response: y# # Df Sum Sq Mean Sq F value Pr(>F) ## X 1 1077.91 1077.91 1127.3 < 2.2e-16 *** ##残差998 954.31 0.96 ##——## Signif。编码:0 '***' 0.001 '**' 0.01 '*' 0.05 '。“0.1”1
注意- ' Type I '平方和,所以自变量的顺序很重要;使用drop1 ()
III型的。看到DataCamp Quick-R
内省——什么是类适合
吗?什么方法我可以应用到这个类的对象吗?
类(适合)
# #[1]“lm”
方法(类=类(合适的))
## [1] add1 alias anova case.names ## [5] coerce confine cooks. ## [1] add1 alias anova case.names距离设备## [9]dfbeta dfbetas drop1假人。cef# #[13]影响初始化kappa ##[21]标签logLik模型。框架模型。矩阵## [25]nobs plot predict print ## [29] proj qr residual rstandard ## [33] rstudent show simulate slotsFromS3 ## [37] summary variable.names vcov ## see '?用于访问帮助和源代码的方法
帮助中可用Rstudio或交互
请查看帮助页面rnorm ()
rnorm ?
“用法”部分描述如何使用该函数
rnorm(n, mean = 0, sd = 1)
参数,有些带有默认值。参数先按名称匹配,然后按位置匹配
' Arguments '部分描述了参数应该是什么
' Value '部分描述了返回值
“例子”部分说明了使用方法
经常包括对相关技术文档的引用,对相关功能的参考,模糊的细节
可能会令人生畏,但到最后呢非常有用的