标签:AI
作者|LAKSHAY ARORA 编译|VK 来源|Analytics Vidhya 概述 流数据是机器学习领域的一个新兴概念 学习如何使用机器学习模型(如logistic回归)使用PySpark对流数据进行预测 我们将介绍流数据和Spark流的基础知识,然后深入到实现部分 介
作者|Conor O'Sullivan 编译|VK 来源|Towards Data Science 主成分分析(PCA)是一个很好的工具,可以用来降低特征空间的维数。PCA的显著优点是它能产生不相关的特征,并能提高模型的性能。 它可以帮助你深入了解数据的分类能力。在本文中,我将带你了解如何
作者|Félix Revert 编译|VK 来源|Towards Data Science 介绍 我翻阅了CatBoost的文档之后,我被这个强大的框架震惊了。CatBoost不仅在你提供给它的任何数据集上构建了一个最精确的模型,其中只需要最少的数据准备。它还提供了迄今为止最好的开源解释工
作者|OngKoonHan 编译|Flin 来源|towardsdatascience 在我大学的Android开发课程的组项目部分中,我们的团队构建并部署了一个认证系统,通过说话人的语音配置文件进行认证。 在我上一篇文章(请参阅下一部分)描述了语音认证系统的高级体系结构之后,本文将深入
spaCy教程学习 作者|PRATEEK JOSHI 编译|VK 来源|Analytics Vidhya 介绍 spaCy是我的自然语言处理(NLP)任务的必备库。我冒昧地说,大多数专家都是这样! 如今,在众多的NLP库中,spaCy确实独树一帜。如果你在NLP上用过spaCy,你就会知道
作者|Robin White 编译|Flin 来源|towardsdatascience 我最喜欢的YouTuber之一,CodeBullet,曾经尝试创建一个乒乓球 AI来统治所有人。可悲的是,他遇到了麻烦,不是因为他没有能力,而是我认为他当时的经验对计算机视觉没有太大影响。他绝对是个
作者|GUEST BLOG 编译|Flin 来源|analyticsvidhya 总览 熟悉类失衡 了解处理不平衡类的各种技术,例如- 随机欠采样 随机过采样 NearMiss 你可以检查代码的执行在我的GitHub库在这里 介绍 当一个类的观察值高于其他类的观察值时,则存在类
作者|Nidhi punj 编译|Flin 来源|medium 第1步:获取大量汽车图片 第2步:把它们都变成黑白图片 灰度图像使算法更快。颜色增加了模型的复杂性,或者我们可以说灰色图像是用来简化数学的。例如,我们可以谈论亮度、对比度、边缘、形状、轮廓、纹理、透视、阴影等,而不必讨论颜
作者|SAURABH JAJU 编译|Flin 来源|analyticsvidhya 介绍 时间序列预测与建模在数据分析中起着重要的作用。时间序列分析是统计学的一个分支,广泛应用于计量经济学和运筹学等领域。这篇技能测试文章是为了测试你对时间序列概念的了解程度。 共有1094人报名参加了这次
作者|Towards AI Team 编译|Flin 来源|medium 此资源不断更新。如果你知道任何其他合适且开放的数据集,请通过电子邮件通知我们:pub@towardsai.net 或者在下面发表评论。 数据集查找器 Google Dataset Search:与Google Sch
作者|Jacob Solawetz, Joseph Nelson 编译|Flin 来源|blog YOLO系列的目标检测模型随着YOLOv5的引入变得越来越强大。在这篇文章中,我们将介绍如何训练YOLOv5为你的定制用例识别定制对象。 非常感谢Ultralytics将此存储库组合在一起
最近发布了一系列台湾大学资讯工程系林軒田(Hsuan-Tien Lin)教授开设的《机器学习基石》的课程总结,分为4个部分,点击标题可查看: 机器什么时候能够学习?(When Can Machines Learn?) 机器为什么能够学习?(Why Can Machines Learn?)
 1、 前言     前几个月,看到园子里面一篇介绍逻辑编程语言的文章《逻辑式编程语言极简实现(使用C#)》,觉得作者写得很有趣,用讲故事的方式来讲述了一个极简逻辑编程语言的设计,于是我也萌生了写一篇有关逻辑编程语言的文章。说实话,我很早就接触了逻辑编程的概念,最开始学编程的时候就想着有朝
张量的概念 TensorFlow中的Tensor就是张量,张量是数学对象,是对标量、向量、矩阵的泛化。我们可以直接理解成张量就是列表,就是多维数组。   张量的维数用阶来表示: 0阶张量 标量 单个值 例:a = 11阶张量 向量 1维数组 例:a = [1,2,3]2阶张量 矩阵
本系列是台湾大学资讯工程系林軒田(Hsuan-Tien Lin)教授开设的《机器学习基石》课程的梳理。重在梳理,而非详细的笔记,因此可能会略去一些细节。 该课程共16讲,分为4个部分: 机器什么时候能够学习?(When Can Machines Learn?) 机器为什么能够学习?(Why
本系列是台湾大学资讯工程系林軒田(Hsuan-Tien Lin)教授开设的《机器学习基石》课程的梳理。重在梳理,而非详细的笔记,因此可能会略去一些细节。 该课程共16讲,分为4个部分: 机器什么时候能够学习?(When Can Machines Learn?) 机器为什么能够学习?(Why
本系列是台湾大学资讯工程系林軒田(Hsuan-Tien Lin)教授开设的《机器学习基石》课程的梳理。重在梳理,而非详细的笔记,因此可能会略去一些细节。 该课程共16讲,分为4个部分: 机器什么时候能够学习?(When Can Machines Learn?) 机器为什么能够学习?(Why
     今天,仔细阅读了园子里面的一个朋友写的《一缕阳光:DDD(领域驱动设计)应对具体业务场景,如何聚焦 Domain Model(领域模型)?》(http://www.cnblogs.com/xishuai/p/3800656.html)这篇博客,觉得这是一篇对DDD的分析总结性质的
  主要的编程范式有三种:命令式编程,声明式编程和函数式编程。   命令式编程:   命令式编程的主要思想是关注计算机执行的步骤,即一步一步告诉计算机先做什么再做什么。 比如:如果你想在一个数字集合 collection(变量名) 中筛选大于 5 的数字,你需要这样告诉计算机: 第一步