技术文章 - IT学院

11

09月

数据可视化实用教程

作者|Soner Yıldırım 编译|VK 来源|Towards Data Science 探索性数据分析（EDA）是数据科学或机器学习管道的重要组成部分。为了使用数据创建一个健壮且有价值的产品，你需要研究数据，理解变量之间的关系，以及数据的底层结构。数据可视化是EDA中最有效的工具

11

09月

人工智能

Windows安装tensorflow教程 GPU版

PS：这是GPU版本，CPU版会用笔记本环境另写一篇博客。前置准备查看GPU型号电脑桌面->右键我的电脑->选择管理->点击设备管理器如下图：如果不是英伟达显卡，那么不用往下看了，GAMEOVER！查看CUDA算力 gpu版本要求电脑的GP

12

09月

人工智能

神经网络训练中回调函数的实用教程

作者|Andre Ye 编译|VK 来源|Towards Data Science 回调函数是神经网络训练的重要组成部分回调操作可以在训练的各个阶段执行，可能是在epoch之间，在处理一个batch之后，甚至在满足某个条件的情况下。回调可以利用许多创造性的方法来改进训练和性能，节省计

13

09月

人工智能

生成式对抗网络

【任务一】视频学习生成式对抗网络基础学习视频，下载地址：https://www.jianguoyun.com/p/DdKFrbUQrKKIBhiavrkD 【任务二】代码练习在谷歌 Colab 上完成代码练习，关键步骤截图，并附一些自己的想法和解读。生成式对抗网络，阅读代码：ht

14

09月

人工智能

pytorch常用函数总结（持续更新)

pytorch常用函数总结 torch.max(input,dim) 求取指定维度上的最大值，,返回输入张量给定维度上每行的最大值，并同时返回每个最大值的位置索引。比如： demo.shape Out[7]: torch.Size([10, 3, 10, 10]) torch.max(d

14

09月

人工智能

numpy函数笔记（持续更新）

numpy函数笔记 np.isin用法 np.isin(a,b) 用于判定a中的元素在b中是否出现过，如果出现过返回True,否则返回False,最终结果为一个形状和a一模一样的数组。（注意：这里的a和b是像数组类型就行，比如列表的话，传入进去之后，numpy会自动将其转化为numpy数组

14

09月

人工智能

基础搜索算法

一. 算法的理解宽度优先搜索深度优先搜索具体见文件，内置画图文档https://files.cnblogs.com/files/Zhengfb/bfs_dfs.rar

14

09月

人工智能

2020年文档相似性算法：初学者教程

作者|Masatoshi Nishimura 编译|VK 来源|Towards Data Science 如果你想知道2020年文档相似性任务的最佳算法，你来对了地方。在33914篇《纽约时报》文章中，我测试了5种常见的文档相似性算法。从传统的统计方法到现代的深度学习方法。每个实现少

14

09月

人工智能

利用贝叶斯分类器检测虚假新闻

作者|Victor Sim 编译|VK 来源|Towards Data Science 现在假新闻太多了，很难找到准确无误的消息来源。本文旨在利用朴素贝叶斯分类器对真假新闻进行分类。什么是NaiveBayes分类器朴素贝叶斯分类器是一种利用贝叶斯定理对数据进行分类的确定性算法。让我们

14

09月

人工智能

【机器学习】：Kmeans均值聚类算法原理(附带Python代码实现)

这个算法中文名为k均值聚类算法，首先我们在二维的特殊条件下讨论其实现的过程，方便大家理解。第一步.随机生成质心由于这是一个无监督学习的算法，因此我们首先在一个二维的坐标轴下随机给定一堆点，并随即给定两个质心，我们这个算法的目的就是将这一堆点根据它们自身的坐标特征分为两类，因此选取了两个

15

09月

人工智能

基于LSTM和词嵌入的tweet文本分类

作者|Emmanuella Anggi 编译|VK 来源|Towards Data Science 在这篇文章中，我将详细介绍如何使用fastText和GloVe作单词嵌入到LSTM模型上进行文本分类。我在写关于自然语言生成的论文时对词嵌入产生了兴趣。词嵌入提高了模型的性能。在本文中，

15

09月

人工智能

使用深度学习识别狗的品种

作者|Nouman 编译|VK 来源|Towards Data Science 在这篇文章中，我将教你建立你自己的网页应用程序，它将接受你的狗的图片，并输出其品种。准确率超过80%！我们将使用深度学习来训练一个模型的数据集的狗图像与他们的品种，以学习的特征来区分每一个品种。数据分析

16

09月

人工智能

Mercari数据集——机器学习&深度学习视角

作者|Yogeeshwari S 编译|VK 来源|Towards Data Science 我很高兴与大家分享我的机器学习和深度学习经验，同时我们将在一个Kaggle竞赛得到解决方案。学习过程的分析也是非常直观，具有娱乐性和挑战性。希望这个博客最终能给读者一些有用的学习帮助。目录业

16

09月

人工智能

初学者教程：KNN分类器

作者|Rashida Nasrin Sucky 编译|VK 来源|Towards Data Science KNN分类器是一种非常流行的监督机器学习技术。本文将用一个例子来解释KNN分类器什么是监督学习？以下是百度百科：监督学习是指：利用一组已知类别的样本调整分类器的参数，使其达到

17

09月

人工智能

预训练词嵌入

作者|ARAVIND PAI 编译|VK 来源|Analytics Vidhya 概述理解预训练词嵌入的重要性了解两种流行的预训练词嵌入类型：Word2Vec和GloVe 预训练词嵌入与从头学习嵌入的性能比较介绍我们如何让机器理解文本数据？我们知道机器非常擅长处理和处理

17

09月

人工智能

变分自编码器如何淘汰经典的推荐系统

作者|Quentin Bacuet 编译|VK 来源|Medium 随着信息过载的增加，我们不可能通过观看海量的内容来获取我们想要的项目。推荐系统可以来拯救我们。推荐系统是一种模型，通过向用户展示他们可能感兴趣的内容，帮助他们探索音乐和新闻等新内容。在Snipfeed，我们每天处理成千

17

09月

人工智能

机器学习模型的度量选择二

作者|Alvira Swalin 编译|VK 来源|Medium 本系列的第二部分主要讨论分类度量在第一篇中，我们讨论了回归中使用的一些重要指标、它们的优缺点以及用例。这一部分将集中讨论分类中常用的度量，以及在具体的背景中应该选择哪种。定义在讨论每种方法的优缺点之前，我们先了解一

17

09月

人工智能

预测酒店预订需求

作者|Dimas Adnan 编译|VK 来源|Towards Data Science 在本文中，我想写一篇关于如何使用Python和Jupyter Notebook构建预测模型的文章。我在这个实验中使用的数据是来自Kaggle的酒店预订需求数据集：https://www.kaggle

17

09月

人工智能

使用Python预测缺失值

作者|Sadrach Pierre, Ph.D. 编译|VK 来源|Towards Data Science 对于数据科学家来说，处理丢失的数据是数据清理和模型开发过程中的一个重要部分。通常情况下，真实数据包含多个稀疏字段或包含错误值的字段。在这篇文章中，我们将讨论如何建立可以用来填补数据

18

09月

人工智能

词袋模型和TF-IDF

作者|PURVA HUILGOL 编译|VK 来源|Analytics Vidhya 机器理解文本的挑战 “语言是一种极好的交流媒介” 你和我很快就会明白那句话。但机器根本无法处理原始形式的文本数据。他们需要我们将文本分解成一种易于机器阅读的数字格式（自然语言处理背后的理念！）。这就引