作者|Soner Yıldırım
编译|VK
来源|Towards Data Science
探索性数据分析(EDA)是数据科学或机器学习管道的重要组成部分。为了使用数据创建一个健壮且有价值的产品,你需要研究数据,理解变量之间的关系,以及数据的底层结构。数据可视化是EDA中最有效的工具
PS:这是GPU版本,CPU版会用笔记本环境另写一篇博客。
前置准备
查看GPU型号
电脑桌面->右键我的电脑->选择管理->点击设备管理器 如下图:
如果不是英伟达显卡,那么不用往下看了,GAMEOVER!
查看CUDA算力
gpu版本要求电脑的GP
作者|Andre Ye
编译|VK
来源|Towards Data Science
回调函数是神经网络训练的重要组成部分
回调操作可以在训练的各个阶段执行,可能是在epoch之间,在处理一个batch之后,甚至在满足某个条件的情况下。回调可以利用许多创造性的方法来改进训练和性能,节省计
【任务一】视频学习
生成式对抗网络基础学习视频 ,下载地址:https://www.jianguoyun.com/p/DdKFrbUQrKKIBhiavrkD
【任务二】代码练习
在谷歌 Colab 上完成代码练习,关键步骤截图,并附一些自己的想法和解读。
生成式对抗网络,阅读代码:ht
pytorch常用函数总结
torch.max(input,dim)
求取指定维度上的最大值,,返回输入张量给定维度上每行的最大值,并同时返回每个最大值的位置索引。比如:
demo.shape
Out[7]: torch.Size([10, 3, 10, 10])
torch.max(d
numpy函数笔记
np.isin用法
np.isin(a,b) 用于判定a中的元素在b中是否出现过,如果出现过返回True,否则返回False,最终结果为一个形状和a一模一样的数组。(注意:这里的a和b是像数组类型就行,比如列表的话,传入进去之后,numpy会自动将其转化为numpy数组
一. 算法的理解
宽度优先搜索
深度优先搜索
具体见文件,内置画图文档https://files.cnblogs.com/files/Zhengfb/bfs_dfs.rar
作者|Masatoshi Nishimura
编译|VK
来源|Towards Data Science
如果你想知道2020年文档相似性任务的最佳算法,你来对了地方。
在33914篇《纽约时报》文章中,我测试了5种常见的文档相似性算法。从传统的统计方法到现代的深度学习方法。
每个实现少
作者|Victor Sim
编译|VK
来源|Towards Data Science
现在假新闻太多了,很难找到准确无误的消息来源。本文旨在利用朴素贝叶斯分类器对真假新闻进行分类。
什么是NaiveBayes分类器
朴素贝叶斯分类器是一种利用贝叶斯定理对数据进行分类的确定性算法。让我们
这个算法中文名为k均值聚类算法,首先我们在二维的特殊条件下讨论其实现的过程,方便大家理解。
第一步.随机生成质心
由于这是一个无监督学习的算法,因此我们首先在一个二维的坐标轴下随机给定一堆点,并随即给定两个质心,我们这个算法的目的就是将这一堆点根据它们自身的坐标特征分为两类,因此选取了两个
作者|Emmanuella Anggi
编译|VK
来源|Towards Data Science
在这篇文章中,我将详细介绍如何使用fastText和GloVe作单词嵌入到LSTM模型上进行文本分类。
我在写关于自然语言生成的论文时对词嵌入产生了兴趣。词嵌入提高了模型的性能。在本文中,
作者|Nouman
编译|VK
来源|Towards Data Science
在这篇文章中,我将教你建立你自己的网页应用程序,它将接受你的狗的图片,并输出其品种。准确率超过80%!
我们将使用深度学习来训练一个模型的数据集的狗图像与他们的品种,以学习的特征来区分每一个品种。
数据分析
作者|Yogeeshwari S
编译|VK
来源|Towards Data Science
我很高兴与大家分享我的机器学习和深度学习经验,同时我们将在一个Kaggle竞赛得到解决方案。学习过程的分析也是非常直观,具有娱乐性和挑战性。希望这个博客最终能给读者一些有用的学习帮助。
目录
业
作者|Rashida Nasrin Sucky
编译|VK
来源|Towards Data Science
KNN分类器是一种非常流行的监督机器学习技术。本文将用一个例子来解释KNN分类器
什么是监督学习?
以下是百度百科:
监督学习是指:利用一组已知类别的样本调整分类器的参数,使其达到
作者|ARAVIND PAI
编译|VK
来源|Analytics Vidhya
概述
理解预训练词嵌入的重要性
了解两种流行的预训练词嵌入类型:Word2Vec和GloVe
预训练词嵌入与从头学习嵌入的性能比较
介绍
我们如何让机器理解文本数据?我们知道机器非常擅长处理和处理
作者|Quentin Bacuet
编译|VK
来源|Medium
随着信息过载的增加,我们不可能通过观看海量的内容来获取我们想要的项目。推荐系统可以来拯救我们。推荐系统是一种模型,通过向用户展示他们可能感兴趣的内容,帮助他们探索音乐和新闻等新内容。
在Snipfeed,我们每天处理成千
作者|Alvira Swalin
编译|VK
来源|Medium
本系列的第二部分主要讨论分类度量
在第一篇中,我们讨论了回归中使用的一些重要指标、它们的优缺点以及用例。这一部分将集中讨论分类中常用的度量,以及在具体的背景中应该选择哪种。
定义
在讨论每种方法的优缺点之前,我们先了解一
作者|Dimas Adnan
编译|VK
来源|Towards Data Science
在本文中,我想写一篇关于如何使用Python和Jupyter Notebook构建预测模型的文章。我在这个实验中使用的数据是来自Kaggle的酒店预订需求数据集:https://www.kaggle
作者|Sadrach Pierre, Ph.D.
编译|VK
来源|Towards Data Science
对于数据科学家来说,处理丢失的数据是数据清理和模型开发过程中的一个重要部分。通常情况下,真实数据包含多个稀疏字段或包含错误值的字段。在这篇文章中,我们将讨论如何建立可以用来填补数据
作者|PURVA HUILGOL
编译|VK
来源|Analytics Vidhya
机器理解文本的挑战
“语言是一种极好的交流媒介”
你和我很快就会明白那句话。但机器根本无法处理原始形式的文本数据。他们需要我们将文本分解成一种易于机器阅读的数字格式(自然语言处理背后的理念!)。
这就引