IT学院

28

12月

R语言利器之ddply和aggregate

　　ddply和aggregate是两个用来整合数据的功能强大的函数。　　aggregate(x, ...) 　　关于aggregate()函数的使用在《R语言实战》中P105有简单描述，这里重新说一下。此函数主要有一下几种用法：　　 ## Default S3 method: 　　ag

28

12月

其他

R语言数据处理包dplyr、tidyr笔记

dplyr包是Hadley Wickham的新作，主要用于数据清洗和整理，该包专注dataframe数据格式，从而大幅提高了数据处理速度，并且提供了与其它数据库的接口；tidyr包的作者是Hadley Wickham，该包用于“tidy”你的数据，这个包常跟dplyr结合使用。本文将介绍dp

28

12月

其他

从零开始系列--R语言基础学习笔记之一环境搭建

R是免费开源的软件，具有强大的数据处理和绘图等功能。下面是R开发环境的搭建过程。一、点击网址 https://www.r-project.org/ ，进入“The R Project for Statistical Computing”界面。二、点击加粗字体的“download R”，进行“CR

28

12月

其他

从零开始系列-R语言基础学习笔记之二数据结构（一）

在上一篇中我们一起学习了R语言的环境搭建，这次我们开始学习R语言的数据结构第一部分：向量、数组和矩阵。一、向量向量是一维数组，其内容可以是数值、字符或布尔值，但所有数据的类型必须一致。创建向量使用的关键字是c，访问向量中的元素使用[]，具体如下：创建数值向量a<-c(1,2,3,4,5,

28

12月

其他

从零开始系列-R语言基础学习笔记之二数据结构（二）

在上一篇中我们一起学习了R语言的数据结构第一部分：向量、数组和矩阵，这次我们开始学习R语言的数据结构第二部分：数据框、因子和列表。一、数据框类似于二维数组，但不同的列可以有不同的数据类型（每一列内的数据类型应当一致）。创建数据框使用的关键字是data.frame，用法是： data.fr

28

12月

其他

R abalone data set

#鲍鱼数据集aburl <- 'http://archive.ics.uci.edu/ml/machine-learning-databases/abalone/abalone.data' abnames <- c('sex','length','diameter'

28

12月

其他

Iris的R语言命令工具箱(1)

28

12月

其他

R语言从小木虫网页批量提取考研调剂信息

一、从URL读取并返回html树 1.1 Rcurl包使用Rcurl包可以方便的向服务器发出请求，捕获URI，get 和 post 表单。比R socktet连接要提供更高水平的交互，并且支持 FTP/FTPS/TFTP，SSL/HTTPS,telnet 和cookies等

28

12月

其他

logistic回归和probit回归预测公司被ST的概率(应用)

1.适合阅读人群：知道以下知识点：盒状图、假设检验、逻辑回归的理论、probit的理论、看过回归分析，了解AIC和BIC判别准则、能自己跑R语言程序 2.本文目的：用R语言演示一个相对完整的逻辑回归和probit回归建模过程，同时让自己复习一遍在学校时学的知识，记载下来，以后经常翻阅。 3.本文不

28

12月

其他

R系列：分词、去停用词、画词云（词云形状可自定义）

附注：不要问我为什么写这么快，是16年写的。 R的优点：免费、界面友好（个人认为没有matlab友好，matlab在我心中就是统计软件中极简主义的代表）、小（压缩包就几十M，MATLAB.R2009b的压缩包是1.46G）、包多（是真的多，各路好友会经常上传新的包）。 R的麻烦之处：经常升级，是经常

28

12月

其他