一、简介   作为集成学习中非常著名的方法,随机森林被誉为“代表集成学习技术水平的方法”,由于其简单、容易实现、计算开销小,使得它在现实任务中得到广泛使用,因为其来源于决策树和bagging,决策树我在前面的一篇博客中已经详细介绍,下面就来简单介绍一下集成学习与Bagging;   二、集成学习  
利用2018年政府工作报告的例子向大家展示一下R语言如何进行文本挖掘的~用到的包有jiebaR和wordcloud2。 1、安装并加载jiebaR install.packages("jiebaR") library(jiebaR)   2、以2018年政府工作报告为文本,进行分词 (1)首先要
网上有安装完anaconda后可以直接使用conda 命令安装R的kernal,本人电脑上已经安装了anaconda和R,因此使用手动安装的方式安装。 安装环境: windows 8.1 企业版 Anaconda 3 (64-bit) R x64 3.4.2 具体步骤如下: 1、确保电脑上已经安装好
  使用R语言做逻辑回归的时候,当自变量中有分类变量(大于两个)的时候,对于回归模型的结果有一点困惑,搜索相关知识发现不少人也有相同的疑问,通过查阅资料这里给出自己的理解。   首先看一个实例(数据下载自:http://freakonometrics.free.fr/db.txt) > db
K近邻算法(KNN)是指一个样本如果在特征空间中的K个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。即每个样本都可以用它最接近的k个邻居来代表。KNN算法适合分类,也适合回归。KNN算法广泛应用在推荐系统、语义搜索、异常检测。   KNN算法分类原理图:
  R语言使用向量化计算,因此非常容易在集群上进行并行计算。parallel 包提供了非常方便的函数用来进行并行计算,但有一个问题是并行时对于内存中的对象会拷贝多份,因此会比较占内存,这里提供一个比较简易的方法在内存中共享对象从而达到降低内存占用的目的。 cl<-makeCluster(10
R是一种专门用于数据分析和统计的脚本语言,广泛应用在每一个需要统计和数据分析的领域。PowerBI支持R脚本,两者强强结合,使PowerBI的功能更加强大。PowerBI Desktop默认没有安装R,在使用R脚本之前,必须向PowerBI Desktop中安装R引擎。用户可以使用R脚本加载数据、对
版权声明:本文为博主原创文章,转载请注明出处   我们平常多见的基因突变热图是一个基因一个格子,一种突变类型,但实际上在同一个病人中,同一个基因往往具有多种突变类型,因此传统的热图绘制工具并不能满足我们绘图的需要。应研究需要,本人自己写了一个热图绘制函数,内部调用image 进行热图的绘制, b
lavaan简明教程 [中文翻译版] 译者注:此文档原作者为比利时Ghent大学的Yves Rosseel博士,lavaan亦为其开发,完全开源、免费。我在学习的时候顺手翻译了一下,向Yves的开源精神致敬。此翻译因偷懒部分删减,但也有增加,有错误请留言 「转载请注明出处」 目录 lavaan简明教
目录 R 中的设计模式不动点算法 包装器模式 接口模式柯里化(Currying) 闭包(Closures) 缓存模式 计数器模式 R 中的设计模式 本文翻译自 Design Patterns in R(By Sebastian Warnholz)。 本文的灵感来源于: Stuart Sier
fread中nThread 参数的使用   注意默认nThread=getDTthreads(),即使用所有能用的核心,但并不是核心用的越多越好,本人亲自测试的情况下,其实单核具有较强的性能,只有在数据大于3Gb的情况下,开启11核(我的机器全部核心30多核)效率才比一个核心更高,而默认使用全部的核
目录 时间序列分析工具箱——tidyquanttidyquant 的用途 加载包 tq_get:获得数据从 Yahoo! Finance 获得股票数据 从 FRED 获得经济数据 使用 tq_transmute 和 tq_mutate 转换数据tq_transmute tq_mutate 可用函
.all_aesthetics <- c("adj", "alpha", "angle", "bg", "cex", "col", "color", "colour", "fg", "fill", "group", "hjust", "label", "linetype", "lower",
来源:Medium,Github,KDnuggets等 作者:李静怡,克雷格 【新智元导读】2018年世界杯开幕在即,谁会赢得最后的冠军?机器学习预测是巴西,而统计方法则认为德国会赢。 3天后,2018年俄罗斯世界杯开打,首场比赛是东道主俄罗斯对阵沙特阿拉伯,将于6月14日拉开序幕。 每届世
R语言类 R语言的类有S3类和S4类,S3类用的比较广,创建简单粗糙但是灵活,而S4类比较精细,具有跟C++一样严格的结构。这里我们主要讲S3类。 S3类的结构 S3类内部是一个list,append某个list类名称,就能成为该类。list里面的内容就是我们所说的属性. 首先创建一个list me
目录 时间序列深度学习:状态 LSTM 模型预测太阳黑子教程概览 商业应用 长短期记忆(LSTM)模型 太阳黑子数据集 构建 LSTM 模型预测太阳黑子1 若干相关包 2 数据 3 探索性数据分析 4 回测:时间序列交叉验证 5 用 Keras 构建状态 LSTM 模型 结论 时间序列深度学习:
马克-to-win:在讲授Servlet之前,我们先回顾一下,我们在讲 第九章:网络编程(Socket)那章时,留过的一个作业: 课外作业:(视频下载) (全部书籍) 6)请做一个Web服务器,客户端能打印出一个html文件。 马克-to-win:在 讲Socket网络编程时,在一次请求(reque
一 简介:Spring Security是一个能够为基于Spring的企业应用系统提供声明式的安全访问控制解决方案的安全框架。它提供了一组可以在Spring应用上下文中配置的Bean,充分利用了Spring IoC,DI(控制反转Inversion of Control ,DI:Dependency

推荐文章