技术文章 - IT学院

18

09月

利用机器学习模型对PySpark流数据进行预测

作者|LAKSHAY ARORA 编译|VK 来源|Analytics Vidhya 概述流数据是机器学习领域的一个新兴概念学习如何使用机器学习模型（如logistic回归）使用PySpark对流数据进行预测我们将介绍流数据和Spark流的基础知识，然后深入到实现部分介

18

09月

人工智能

使用PCA可视化数据

作者|Conor O'Sullivan 编译|VK 来源|Towards Data Science 主成分分析（PCA）是一个很好的工具，可以用来降低特征空间的维数。PCA的显著优点是它能产生不相关的特征，并能提高模型的性能。它可以帮助你深入了解数据的分类能力。在本文中，我将带你了解如何

18

09月

人工智能

深度学习框架 CatBoost 介绍

作者|Félix Revert 编译|VK 来源|Towards Data Science 介绍我翻阅了CatBoost的文档之后，我被这个强大的框架震惊了。CatBoost不仅在你提供给它的任何数据集上构建了一个最精确的模型，其中只需要最少的数据准备。它还提供了迄今为止最好的开源解释工

19

09月

人工智能

用对比学习训练说话人初步验证模型

作者|OngKoonHan 编译|Flin 来源|towardsdatascience 在我大学的Android开发课程的组项目部分中，我们的团队构建并部署了一个认证系统，通过说话人的语音配置文件进行认证。在我上一篇文章（请参阅下一部分）描述了语音认证系统的高级体系结构之后，本文将深入

20

09月

人工智能

spaCy教程学习

spaCy教程学习作者|PRATEEK JOSHI 编译|VK 来源|Analytics Vidhya 介绍 spaCy是我的自然语言处理（NLP）任务的必备库。我冒昧地说，大多数专家都是这样！如今，在众多的NLP库中，spaCy确实独树一帜。如果你在NLP上用过spaCy，你就会知道

20

09月

人工智能

使用Python和OpenCV在线打乒乓球

作者|Robin White 编译|Flin 来源|towardsdatascience 我最喜欢的YouTuber之一，CodeBullet，曾经尝试创建一个乒乓球 AI来统治所有人。可悲的是，他遇到了麻烦，不是因为他没有能力，而是我认为他当时的经验对计算机视觉没有太大影响。他绝对是个

20

09月

人工智能

通过迁移学习建立一个易于使用的图像分割工具

在Jupyter notebook中为图像添加标签，预测新图像并可视化神经网络（并使用Docker Hub共享它们！）作者|Jenny Huang 编译|Flin 来源|towardsdatascience 作者：Jenny Huang, Ian Hunt-Isaak, William

20

09月

人工智能

应对机器学习中类不平衡的10种技巧

作者|GUEST BLOG 编译|Flin 来源|analyticsvidhya 总览熟悉类失衡了解处理不平衡类的各种技术，例如- 随机欠采样随机过采样 NearMiss 你可以检查代码的执行在我的GitHub库在这里介绍当一个类的观察值高于其他类的观察值时，则存在类

21

09月

人工智能

使用Python为初学者构建AI汽车和行人跟踪

作者|Nidhi punj 编译|Flin 来源|medium 第1步：获取大量汽车图片第2步：把它们都变成黑白图片灰度图像使算法更快。颜色增加了模型的复杂性，或者我们可以说灰色图像是用来简化数学的。例如，我们可以谈论亮度、对比度、边缘、形状、轮廓、纹理、透视、阴影等，而不必讨论颜

22

09月

人工智能

测试时间序列的40个问题

作者|SAURABH JAJU 编译|Flin 来源|analyticsvidhya 介绍时间序列预测与建模在数据分析中起着重要的作用。时间序列分析是统计学的一个分支，广泛应用于计量经济学和运筹学等领域。这篇技能测试文章是为了测试你对时间序列概念的了解程度。共有1094人报名参加了这次

22

09月

人工智能

机器学习和数据科学的最佳公共数据集

作者|Towards AI Team 编译|Flin 来源|medium 此资源不断更新。如果你知道任何其他合适且开放的数据集，请通过电子邮件通知我们：pub@towardsai.net 或者在下面发表评论。数据集查找器 Google Dataset Search：与Google Sch

22

09月

人工智能

如何在自定义数据集上训练YOLOv5

作者|Jacob Solawetz, Joseph Nelson 编译|Flin 来源|blog YOLO系列的目标检测模型随着YOLOv5的引入变得越来越强大。在这篇文章中，我们将介绍如何训练YOLOv5为你的定制用例识别定制对象。非常感谢Ultralytics将此存储库组合在一起

23

09月

人工智能

林軒田《机器学习基石》课程总结

最近发布了一系列台湾大学资讯工程系林軒田（Hsuan-Tien Lin）教授开设的《机器学习基石》的课程总结，分为4个部分，点击标题可查看：机器什么时候能够学习？（When Can Machines Learn？）机器为什么能够学习？（Why Can Machines Learn？）

23

09月

人工智能

用写文章的方式写程序--“三维度”逻辑编程语言的设计（1）

1、前言前几个月，看到园子里面一篇介绍逻辑编程语言的文章《逻辑式编程语言极简实现（使用C#）》，觉得作者写得很有趣，用讲故事的方式来讲述了一个极简逻辑编程语言的设计，于是我也萌生了写一篇有关逻辑编程语言的文章。说实话，我很早就接触了逻辑编程的概念，最开始学编程的时候就想着有朝

23

09月

人工智能

TensorFlow之张量

张量的概念 TensorFlow中的Tensor就是张量，张量是数学对象，是对标量、向量、矩阵的泛化。我们可以直接理解成张量就是列表，就是多维数组。张量的维数用阶来表示： 0阶张量标量单个值例：a = 11阶张量向量 1维数组例：a = [1,2,3]2阶张量矩阵

23

09月

人工智能

机器什么时候能够学习？

本系列是台湾大学资讯工程系林軒田（Hsuan-Tien Lin）教授开设的《机器学习基石》课程的梳理。重在梳理，而非详细的笔记，因此可能会略去一些细节。该课程共16讲，分为4个部分：机器什么时候能够学习？（When Can Machines Learn？）机器为什么能够学习？（Why

23

09月

人工智能

机器怎样学习？

本系列是台湾大学资讯工程系林軒田（Hsuan-Tien Lin）教授开设的《机器学习基石》课程的梳理。重在梳理，而非详细的笔记，因此可能会略去一些细节。该课程共16讲，分为4个部分：机器什么时候能够学习？（When Can Machines Learn？）机器为什么能够学习？（Why

23

09月

人工智能

机器怎样可以学得更好？

本系列是台湾大学资讯工程系林軒田（Hsuan-Tien Lin）教授开设的《机器学习基石》课程的梳理。重在梳理，而非详细的笔记，因此可能会略去一些细节。该课程共16讲，分为4个部分：机器什么时候能够学习？（When Can Machines Learn？）机器为什么能够学习？（Why

23

09月

人工智能

DDD为何叫好不叫座？兼论DCI与业务分析的方法论

今天，仔细阅读了园子里面的一个朋友写的《一缕阳光：DDD（领域驱动设计）应对具体业务场景，如何聚焦 Domain Model（领域模型）？》(http://www.cnblogs.com/xishuai/p/3800656.html)这篇博客，觉得这是一篇对DDD的分析总结性质的

23

09月

人工智能

编程范式：命令式编程(Imperative)、声明式编程(Declarative)和函数式编程(Functional)

主要的编程范式有三种：命令式编程，声明式编程和函数式编程。命令式编程：命令式编程的主要思想是关注计算机执行的步骤，即一步一步告诉计算机先做什么再做什么。比如：如果你想在一个数字集合 collection(变量名) 中筛选大于 5 的数字，你需要这样告诉计算机：第一步