一、选择镜像
在下载文件之前应用下述代码,并选择国内镜像,可以提升下载速度
chooseBioCmirror()
二、逻辑判断
==
# eg:5 == 5,返回T;5 == 6,返回F
c <- read.table() # 读取文本文档
write.table() # 输出文本文档
write.csv() # 输出csv文件
c <- read.csv # 读取csv文件
三、设置工作目录
setwd('')
# 注:只可以向下级更改设置,无法向同级/上级设置,注意是单引号
四、读取,输出数据
c <- read.table() # 读取文本文档
write.table() # 输出文本文档
write.csv() # 输出csv文件
c <- read.csv # 读取csv文件
## 也可以从右上角点击Import Dataset导入数据集
五、数据处理
x <- t(a) # 行列反转,将a数据框的行和列交换为t
y <- as.data.frame(x) # 将x转换为数据框形式
class(x) # 判断数据类型(数字、字符、数据框)
class(x$aaaaaa) # 判断x中的aaaaaa列数据类型,$用于提取数据框中的某列
substr("abcdefg", 1, 4) # 提取特定字符串(如“abcdefg”)的第一位到第四位
a <- c("a", "b", "c") # 创建集合,包含abc三个字符
q = x[,1:3] # 提取x数据框中的1~3列
q = x[1:3,] # 提取x数据框中的1~3行
q = x[1:3,4:6] # 提取x数据框中的1~3行,4~6列
q = x[-1,] # 删除x的第一行
q = x[-(1:3),] # 删除x的1~3行
q = x[,c(1,3)] # 删除x的1和3列
duplicated(a) # 判断a集合中各元素是否为重复
a <- a[!duplicated(a)] # 将duplicated(a)的结果取Boolean相反值,即T变F,F变T,再提取(只能提取所有T值)
inner_join(class1, class2, by = "名字") # 合并数据框
left_join() # 以括号中靠左边的数据为基础(仅会出现基础中出现的列)进行合并,缺失值显示NA,少用
right_join() # 以括号中靠右边的数据为基础进行合并,缺失值显示NA,少用
六、数据传导符
%>% 快捷键 ctrl+shift+M
# 作用:将变量继续向后传至下一个括号
# eg: x <- x %>% t() %>% as.data.frame()
七、代码结构
# a ---- #设置一级标题
## a ---- #设置二级标题
八、创建数据框
class1 <- tribble(
~'名次', ~'姓名', # 限定列数和列名
'1', 'a', # 填充列内容
'2', 'b',
'3', 'c'
)
## 九、快速比较两个数据集的内容是否有区别
a <- c("a", "b", "a", "b", "c")
b <- c("a", "b", "b", "a", "c")
identical(a, b) # 要求两个数据集内容、顺序完全相同才返回T,否则返回F(如本例中即返回F)
评论