melt函数可以将宽数据转化为长数据
dcast函数可以将长数据转化为宽数据
> DT = fread("melt_default.csv")
> DT
family_id age_mother dob_child1 dob_child2 dob_child3
1:
使用ggplot2包绘制ROC曲线
rocplot<- function(pred, truth, ...){
predob<- prediction(pred, truth)
#打印AUc
perf.auc<- performance(predob, me
使用wordcloud2绘制词云图
library(wordcloud2)
findwords<-function(tf){
txt<-scan(tf,"")
wl<-list()
for(i in 1:length(txt)){
使用pROC包绘制ROC曲线
#####***绘制ROC曲线***#####
library("pROC")
N <- dim(data2)[1]
使用ggplot2绘制箱线图
######*****绘制箱线图代码*****#######
data1$学区房 <- factor(data1$school, levels = 0:1, labels = c("否", "是"))
#设置学区房数据为因子类型
dat
使用ggplot2包绘制直方图
######*****绘制直方图代码*****#######
data1 <- data0[(data0[, 2] <= 500) & (data0[, 4] <= 150000), ]
#提取面积500以下且单价十五万以
前期处理
perl脚本统计RC(RC(read counts))
读入control baseline 和 sigma(最后baseline 预测的mad值)
将gc < 0.28或gc > 0.68,sigma乘上1.5,后来又乘以6,对于小于0.01或者大于0.99分位数,sigma
R语言真是博大精深
方法一
Acf(gold[,2], type = "correlation",lag.max = 100)
Acf(gold[,2], type = "partial")
方法二
library(ggfortify)
autoplot(acf(gold[,2], plot = F
使用fmsb包绘制雷达图
library("fmsb")
radarfig <- rbind(rep(90, 4), rep(60, 4), c(86.17, 73.96, 82.70, 69.55)) #求平均值
radarfig <- as.data.frame(radarf
如果要使用新版本的R,除了直接安装,也可以直接拷贝R的文件夹。这样既可以保留原始的R版本和R包,也可以使用新版本的R和R包,R包存放在R目录下的library文件夹。
文件放路径
R: /usr/lib64/R
llibrary: 系统R library目录:/usr/lib64/R/libra
版权声明:本文为博主原创文章,转载请注明出处
机器学习的研究领域是发明计算机算法,把数据转变为智能行为。机器学习和数据挖掘的区别可能是机器学习侧重于执行一个已知的任务,而数据发掘是在大数据中寻找有价值的东西。
机器学习一般步骤
收集数据,将数据转化为适合分析的电子数据
探索和准备数据,机器学
方差分析(Analysis of Variance,简称ANOVA),又称“ 变异数分析”,是R.A.Fisher发明的,用于两个及两个以上 样本均数差别的 显著性检验。 由于各种因素的影响,研究所得的数据呈现波动状。造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的
file.info() 参数是表示文件名称的字符串向量,函数会给出每个文件的大小、创建时间、是否为目录等信息。
> file.info("z.txt")
size isdir mode mtime
z.txt 15 FALSE 666 2017-0
41--ls( )
ls()可以用来列出现存的所有对象。
pattern是一个具名参数,可以列出所有名称中含有字符串“s”的对象。
> ls()
[1] "s"
> ls(pattern = "a")
character(0)
> ls(pattern = "s")
[1] "s"
36--diag()
如果它的参数是一个矩阵,它返回的是一个向量
如果它的参数是一个向量,它返回的是一个向量
如果它的参数是一个标量,它返回的是指定大小的单位矩阵
> diag(2)
[,1] [,2]
[1,] 1 0
[2,] 0 1
> diag(
31--round(),floor()和ceiling()
round()四舍五入取整
floor()向下取整
ceiling()向上取整
> round(3.5)
[1] 4
> floor(3.5)
[1] 3
> ceiling(3.5)
[1] 4
32--factoria
例1:y'=ry(1-y/K)
y(0)=2
对应的R代码为:
library(deSolve)#parameters and initial valuesr<-1K<-10yini<-2#the function derivs<-function(t,y
26--aggregate( )
函数aggregate()对分组中的每一个变量调用tapply()函数。
aggregate(a,list,f)
第二个参数必须是列表。也就是因子部分。
第三个参数即函数 f 并不是面向数据框
> aggregate(iris[, -5], list(iris
21--assign()
assign函数可以通过变量名的字符串来赋值
> assign('a', 1:3)
> a
[1] 1 2 3
> b <- c('a')
> assign(b, 1:5)
> b
[1] "a"
> a
[1] 1 2 3 4 5
fivenum()
fivenum(x, na.rm = TRUE)
x 为数值型向量,可以包含NA以及Inf,-Inf
na.rm = TRUE 默认将NA和NaN去除,但是Inf还保留。
fivenum()函数返回5个值:最大值最小值中位数以及 lower-hinge, upper-hinge。