问题3
数据读取处理,有read.table read
SRE实战 互联网时代守护先锋,助力企业售后服务体系运筹帷幄!一键直达领取阿里云限量特价优惠。
R—读取数据(导入csv,txt,excel文件)
read.table函数:read.table函数以数据框的格式读入数据,所以适合读取混合模式的数据,但是要求每列的数据数据类型相同。
read.table读取数据非常方便,通常只需要文件路径、URL或连接对象就可以了,也接受非常丰富的参数设置:
- file参数:这是必须的,可以是相对路径或者绝对路径(注意:Windows下路径要用斜杠'/'或者双反斜杠'\\')。
- header参数:默认为FALSE即数据框的列名为V1,V2...,设置为TRUE时第一行作为列名。
data1<-
read.table
(
'item.csv'
)
#默认header=FALSE
data2<-
read.table
(
'item.csv'
,header=
TRUE
)
- read.csv、read.csv2、read.delim是read.table函数的包装,分隔符分别对应逗号,分号,制表符,同样接受read.table所有参数。
- read.csv函数header参数默认为TRUE,不同于read.table。
data3<-
read.csv
(
'item.csv'
,sep=
','
,header=
TRUE
)
data4<-
read.table
(
'item.csv'
)
#下文示例采用read.csv函数,两种写法效果相同
gc.data=read.table("count_new.txt",header=TRUE,sep="\t")#
# head(gc.data)
read.csv()
exprSet = as.matrix(gc.data[,-1])
as.num
library("DESeq2")
coldata<-data.frame(c(rep("normal",30),rep("tumor",377)))
"condition"->names(coldata)
names(coldata)
rownames(coldata) = colnames(exprSet)
rownames() 行名
colnames() 列名
原数据csv转成txt后再做
矩阵提取相应的行,现在还在越界
id=up_diff_result$Row.names
name=gc.data[id,1]
出图的时候出现
gctestnew=gc.data[seq(1,10),seq(1,4)]
exprSet = as.matrix(gc.data[,-1])
向日葵,语言,用微信在电脑上接,然后打开向日葵声音
cox lung数据
merge数据
要不要把前两列去掉
Lasso
cox
luadCox.All <- coxph(Surv(Overall.Survival,Vital_status)~RP11.433M22.1+。。。, data =merge) summary(luadCox.All) # Plot the baseline survival function ggsurvplot(survfit(luadCox.All), data=merge,color = "#2E9FDF", ggtheme = theme_minimal()) #stepwise screening luadCox.step=stepAIC(luadCox.All,~.,direction="both") # 运行时间很长
和生存时间的关系,下降,最后面会凸出一块(电脑的原因,还是程序的原因)
coxph
最后删选出的结果,回归系数吗,怎么分析,
程序一个一个的弄,弄的乱了
lasso
train<-sample(1:nrow(x),nrow(x)/2) # 随机取样
grid<-10^seq(10,-2,length = 100) # grid值,从而得出lasso.mod
## the lasso lasso.mod<-glmnet(x[train,],y[train],alpha = 1,lambda = grid) plot(lasso.mod, main = "The lasso")
cox 没有训练集和测试集,stepAIC运行时间很长
lasso
问题:writer 发布 没有更新 (先把账户更新一下,不行的话就重装,应该就可以了。先重装了一下,不行,让后更新了一下就可以了)
生信盒子
运行过程,每15分钟运行一次
