技术文章 - IT学院

标签：AI

14

03月

机器学习之数据探索——数据特征分析（帕累托分析）

帕累托分析，即贡献度分析，在所有因素中找寻对结果起关键性或决定性作用的少部分因素。有一常见的法则————二八定律，各行各业都在诠释着该法则的深刻含义：例如： 1 公司的80%利润来自于20%的畅销产品，而其他80%的产品只产生了20%的利润； 2 世界上大约80％的资源是由世界上20％

14

03月

7个步骤建立可用的机器学习模型

Netflix或Amazon Prime推送您喜欢看的电影，这背后的逻辑你不觉得惊讶吗？或者，你不好奇是什么让Google地图可以预测您所行驶的路线上的路况？我们都知道机器学习是如何使用算法和统计模型来执行任务并提出完美的解决方案。同样，这种方法可以检测癌症，并有助于检测Facebook

15

03月

BERT实现QA中的问句语义相似度计算

1. BERT 语义相似度 BERT的全称是Bidirectional Encoder Representation from Transformers，是Google2018年提出的预训练模型，即双向Transformer的Encoder，因为decoder是不能获要预测的信息的。模型的

15

03月

反向传播算法详解

作者：Great Learning Team 神经网络什么是反向传播？反向传播是如何工作的？损失函数为什么我们需要反向传播？前馈网络反向传播的类型案例研究在典型的编程中，我们输入数据，执行处理逻辑并接收输出。如果输出数据可以某种方式影响处理逻辑怎么办？那就是反向传播算

17

03月

Boosting算法进化史

背景：当前的热门算法中，除了神经网络在图像和文字、音频等领域大放异彩之外，集成学习中的xgboost,lightGBM,CatBoost也在kaggle等机器学习平台上成为了炙手可热的工具。明确概念： 1、Boosting（提升） 2、Adaptive Boosting（自适应增强

17

03月

CTR学习笔记&代码实现1-深度学习的前奏LR->FFM

CTR学习笔记系列的第一篇，总结在深度模型称王之前经典LR，FM, FFM模型，这些经典模型后续也作为组件用于各个深度模型。模型分别用自定义Keras Layer和estimator来实现，哈哈一个是旧爱一个是新欢。特征工程依赖feature_column实现，这里做的比较简单在后面的深度

18

03月

利用mnist数据集进行深度神经网络

初始神经网络这里要解决的问题是，将手写数字的灰度图像（28 像素 x28 像素）划分到 10 个类别中（0~9)。我们将使用 MINST 数据集，它是机器学习领域的一个经典数据集，其历史几乎和这个领域一样长，而且已被人们深入研究。这个数据集包含 60000 张训练图像和 10000 张测

18

03月

从线性回归到神经网络

背景：一直想要梳理一下自己对广义线性模型的认识及思考，所有就有了这篇随笔。前提： 1、首先明确，介绍模型会按照模型的三要素来展开，即模型（模型的参数空间），策略（如何选择最优模型，一般指代价函数/损失函数），算法（模型学习参数的方法，包括最优化方法等） 2、因为介绍的模型都是线性模型及其

18

03月

大规模机器学习

这一节主要讲了一些适用于大规模机器学习的算法及策略，并比较了梯度下降、随机梯度下降和小批量梯度下降的优劣。目前来说，大规模机器学习中用的最多的还是小批量梯度下降，毕竟它在执行效率和性能之间达到了一个平衡。当然，对于小批量梯度下降来说，如何选择合适的批量大小又是一个值得深思的问题。梯度下降

19

03月

深度学习中的激活函数完全指南:在数据科学的诸多曲线上进行现代之旅

原文：Towards Data Sciencedeephub翻译组：zhangzc 自2012年以来，神经网络研逐渐成为了人工智能研究的主流，深度模型迅速取代了之前的各种benchmarks。在这些创新中，激活函数对神经网络的性能和稳定性起着至关重要的作用。这篇文章将尽可能简要地概述激

20

03月

一文带你解读：卷积神经网络自动判读胸部CT图像的机器学习原理

本文介绍了利用机器学习实现胸部CT扫描图像自动判读的任务，这对我来说是一个有趣的课题，因为它是我博士论文研究的重点。这篇文章的主要参考资料是我最近的预印本 “Machine-Learning-Based Multiple Abnormality Prediction with Lar

21

03月

第一个机器学习算法：线性回归与梯度下降

第一个机器学习算法：线性回归与梯度下降符号解释 (x^{(i)}),(y^{(i)})：某个训练样本 (m)：样本总数量 (h_{theta})：假设函数 Linear regression（线性回归）如何获得一个线性回归模型？将训练数据放入学习算法，算法通过计算得到一个假设函数。

21

03月

深度学习实战：tensorflow训练循环神经网络让AI创作出模仿莎士比亚风格的作品

AI创作莎士比亚风格的作品训练一个循环神经网络模仿莎士比亚 FLORIZEL:Should she kneel be?In shall not weep received; unleased meAnd unrespective greeting than dwell in, t

22

03月

更快的计算，更高的内存效率：PyTorch混合精度模型AMP介绍

作者：Rahul Agarwal 您是否知道反向传播算法是Geoffrey Hinton在1986年的《自然》杂志上提出的？同样的，卷积网络由Yann le cun于1998年首次提出，并进行了数字分类，他使用了单个卷积层。直到2012年下半年，Alexnet才通过使用多个卷

22

03月

线性代数基础知识的复习

线性代数基础知识的复习机器学习需要一些线性代数的基础知识。 matrix：矩阵 [ A= begin{bmatrix} 1402 & 191\ 1371 & 821\ 949 & 1437\ 147&1448\ end{bmatrix} ] [ B= be

23

03月

深度学习基础：为什么神经网络的感知机中的神经元需要偏置项？

神经元中不添加偏置项可以吗？答案是，不可以每个人都知道神经网络中的偏置（bias）是什么，而且从人类实现第一个感知器开始，每个人都知道神经元需要添加偏置项。但你是否考虑过我们为什么要使用偏置项呢?就我而言，直到不久前我才弄清楚这个问题。当时我和一个本科生讨论了一些神经网络模型，但不知何故她

23

03月

自然语言处理中预训练模型一览

预训练模型的梳理总结摘要本报告将从以下几个方面梳理预训练模型，陈述预训练(特指nlp领域)的what和how，总结预训练加微调模式的好处和弊端。通过时间线的方式梳理最近两年来预训练模型的发展脉络，重点阐述几个典型的预训练模型的做法和创新点。 chap1:预训练模型预训练模

24

03月

深度学习归一化：BN、GN与FRN

在深度学习中，使用归一化层成为了很多网络的标配。最近，研究了不同的归一化层，如BN，GN和FRN。接下来，介绍一下这三种归一化算法。 BN层 BN层是由谷歌提出的，其相关论文为《Batch Normalization: Accelerating Deep Network Training

24

03月

生物学中的机器学习：使用K-Means和PCA进行基因组序列分析 COVID-19接下来如何突变？

作者：Andre Yedeephub翻译组：孟翔杰许多人没有想到，病毒就像地球上为生存而挣扎的其他生物一样，它们会进化或变异。只要看一看人类病毒来源的蝙蝠携带的病毒RNA序列片段即可。 AAAATCAAAGCTTGTGTTGAAGAAGTTACAACAACTCTGGAAGAAACTAA

24

03月

Scikit-Learn 源码研读（第二期）基类的实现细节

目录BaseEstimator`get_params``set_params`ClassifierMixinRegressorMixin检查传入的对象检查样本数和权重系数实现$R^2$的计算细节TransformerMixin补充 sklearn项目可以看成一棵大树，各种estimator

官方群

服务时间：

https://imgs.itxueyuan.com/advPicture/adv-1662379508-4007-pic.jpeg