类型值和数学公式r的命令提示
1 + 1
## [1] 2
将值分配给符号(变量)
x = 1 x + x
## [1] 2
调用函数,例如C()
,占用任意数量的值并返回单个值向量
x = c(1,2,3)x
## [1] 1 2 3
r功能,例如sqrt()
,通常在向量上有效地运行
y = sqrt(x)y
## [1] 1.000000 1.414214 1.732051
通常有几种方法可以完成任务r
x = c(1,2,3)x
## [1] 1 2 3
x <-c(4,5,6)x
## [1] 4 5 6
X <-7:9 x
## [1] 7 8 9
10:12-> x x
## [1] 10 11 12
有时r确实可以弄清楚“令人惊讶的”事情
x <-c(1,2,3) - > y x
## [1] 1 2 3
y
## [1] 1 2 3
“原子”向量
类型包括整数,数字(浮点数;真实),复杂,逻辑,角色,原始(字节)
人<-c(“ Brian”,“ Jim”,“ Herve”,“ Dan”,“ Val”,“ Martin”)人
## [1]“ Brian”“ Jim”“ Herve”“ Dan”“ val”“ Martin”
原子量可以命名
人口<-c(Buffalo = 259000,Rochester = 210000,`New York` = 8400000)人口
##布法罗罗切斯特纽约## 259000 210000 8400000
log10(人口)
## Buffalo Rochester New York ## 5.413300 5.322219 6.924279
统计概念类似NA
(无法使用)
真实<-c(真,错误,na)真实性
## [1] true false na
诸如“和”之类的逻辑概念(和
), '或者' (|
), 并不是' (呢
)
!真实
## [1] false true na
真实|!真实
## [1]正确的na
真实与真实
## [1]错误na
诸如Infinity之类的数值概念(inf
)或不划分(南
,例如0 /0)
undefined_numeric_values <-c(na,0/0,nan,inf,-inf)undefined_numeric_values
## [1] Na Nan Nan Inf -Inf
sqrt(undefined_numeric_values)
##在SQRT中警告(undefined_numeric_values):NANS产生
## [1] Na Nan Nan Inf Nan
常见的弦乐操作
toupper(人)
## [1]“ Brian”“ Jim”“ Herve”“ Dan”“ val”“ Martin”
基德(People,1,3)
## [1]“ bri”“ jim”“她”“ dan”“ val”“ Mar”
r是绿色消费者 - 回收短量向量以与长向量保持一致
x <-1:3 x * 2#'2'(长度为1的向量)回收为C(2,2,2)
## [1] 2 4 6
真实|NA
## [1] true na na
真实与纳
## [1] na false na
筑巢操作非常常见,可以同时紧凑,混乱和表现力([[
:子集;<
: 少于)
基德(Tolower(People),1,3)
## [1]“ bri”“ jim”“她”“ dan”“ val”“ Mar”
人口[人口<1000000]
##布法罗·罗切斯特## 259000 210000
列表
列表类型可以包含其他向量,包括其他列表
frenemies = list(friends = c(“拉里”,“理查德”,“ vivian”),敌人= c(“ dick”,“ mik”))frenemies
## $朋友## [1]“ Larry”“ Richard”“ Vivian” ## ## $ enemies ## [1]“ Dick”“ Mik”
[[
子集一个列表以创建另一个列表,[[[
提取列表元素
Frenemies [1]
## $朋友## [1]“ Larry”“ Richard”“ Vivian”
Frenemies [C(“敌人”,“朋友”)]
## $敌人## [1]“ dick”“ mik” ## ## $ friends ## [1]“ larry”“ richard”“ vivian”
Frenemies [[“敌人”]]
## [1]“ Dick”“ Mik”
因素
类似角色的向量,但值仅限于特定水平
性别=因子(C(“男性”,“男性”,“女性”),级别= C(“女性”,“男性”,“雌雄同体”)性爱
## [1]男性女性##等级:女性男性雌雄同体
性==“女性”
## [1] false false true
表(性别)
##性##女性男性雌雄同体## 1 2 0
性[性==“女性”]
## [1]女性##级别:女性男性雌雄同体
变量通常以高度结构化的方式相互关联,例如电子表格中的两个“列”数据
x = rnorm(1000)#1000随机正常偏差y = x + rnorm(1000)#另一个1000偏差,作为x plot(y〜x)的函数(y〜x)#关系bewteen x and y
方便地操纵它们
data.frame()
:喜欢电子表格中的列
df = data.frame(x = x,y = y)头(df)#第一个6行
## X Y ## 1 -1.7569371 -0.70884344 ## 2 -1.6527157 -1.97487316 ## 3 -0.5161684 -1.36055768 ## 4 0.2218860 0.09724608 ## 5 -0.6661832 -1.82587026 ## 6 -0.5512824 0.71819197
情节(y〜x,df)#与上面相同
查看所有数据查看(DF)
。总结数据摘要(DF)
摘要(DF)
## x y ## min。:-3.27963分钟。:-5.20065 ## 1st Qu. :-0.71917 1st Qu.:1.02837 ##中间:-0.06830中位数:-0.08605 ## ##均值:-0.06072平均值:-0.09962# 最大限度。:2.77080最大:4.37988
易于以协调方式操纵数据,例如访问列X
和$
和仅对于这些值大于0的子集
正X = df [df $ x> 0,]头(正X)
## X Y ## 4 0.2218860 0.09724608 ## 9 0.6701959 0.82361589 ## 10 1.1216619 1.49955242 ## 14 0.6156470 0.11297448 ## 15 0.2805778 -1.84736727 ## 16 0.7633320 -1.63962235
情节(y〜x,正X)
r是内省的 - 询问自己
班级(DF)
## [1]“ data.frame”
昏暗(DF)
## [1] 1000 2
Colnames(DF)
## [1]“ x”“ y”
矩阵()
一个相关类别,所有元素都具有相同的类型(adata.frame()
需要列中的元素是相同的类型,但是列之间的元素可能是不同的类型)。
散点图使人们想拟合线性模型(进行回归分析)
第二个参数中发现的变量
拟合<-lm(y〜x,df)
可视化点并添加回归线
图(y〜x,df)abline(fit,col =“ red”,lwd = 3)
总结拟合为方差分析表
方差分析(合适)
##方差表分析## ##响应:y ## df sum sq平均sq f值pr(> f)## x 1 1040.0 1039.96 1022.2 <2.2e-16 *** ## ##残留998 1015.4 1.02 ##--- ##标志。代码:0'***'0.001'**'0.01'*'0.05'。0.1''1
内省 - 什么是什么类合身
?什么方法我可以应用于该课程的对象吗?
班级(合适)
## [1]“ LM”
方法(class = class(fit))
## [1] add1别名ANOVA CASE.NAMES COLECER CONCINT ## [7] COOKS.DISTANCE偏差DFBETA DFBETAS DRED1 DUMMY.COEF ## [13]效果ExtractaiC家族公式的影响## [19]初始化Kappa Labels Loglik模型。帧模型。matrix## [25] NOBS图预测打印proj qr ## [31]残差rstudent rstudent show show simulate slotsfroms3 ## [37] summary variable.names vcov ##请参阅'?meads'?
可用的帮助rstudio或互动
查看帮助页面rnorm()
?rnorm
“用法”部分描述了如何使用该函数
rnorm(n,平均= 0,sd = 1)
参数,有些具有默认值。争论首先按名称匹配,然后位置
“参数”部分描述了该论点应该是什么
“价值”部分描述了返回值
“示例”部分说明了使用
通常包括对相关技术文档的引用,对相关功能的参考,晦涩的细节
可能令人生畏,但最终非常有用