作者|Rashida Nasrin Sucky
编译|VK
来源|Medium
神经网络已经被开发用来模拟人脑。虽然我们还没有做到这一点,但神经网络在机器学习方面是非常有效的。它在上世纪80年代和90年代很流行,最近越来越流行。计算机的速度足以在合理的时间内运行一个大型神经网络。在本文中
作者|Khuyen Tran
编译|VK
来源|Towards Datas Science
动机
应用不同的python代码来处理notebook中的数据是很有趣的,但是为了使代码具有可复制性,你需要将它们放入函数和类中。将代码放入脚本时,代码可能会因某些函数而中断。那么,如何检查你的功
作者|Bex Tuychiev
编译|VK
来源|Towards Datas Science
介绍
本文的目标是让你对使用Seaborn的relplot()函数绘制统计图有一定的了解。
当我开始学习数据可视化时,我第一次被介绍到Matplotlib。它是一个如此巨大的库,你几乎可以看
作者|Renan Ferreira
编译|VK
来源|Towards Datas Science
典型的数据科学工作流由以下步骤组成:
确定业务需求->数据获取->数据准备->数据分析->共享数据见解
每一个步骤都需要一套专业知识,这些专业知识可分为:
数据工
下载 SDK Managerhttps://developer.nvidia.com/nvidia-sdk-manager-archive在虚拟机中安装运行sdkmanager$ sdkmanager磁盘空间要满足要求,安装的时候需要很大的空间,磁盘空间不足会导致安装失败屏幕分辨率要满足要
1. 统计学习
1.1 统计学习的方法
基于数据构建概率统计模型从而对数据进行预测与分析。统计学习由监督学习、无监督学习、强化学习等组成
1.2 实现统计学习的方法的步骤
1)得到一个有限的训练数据集合
2)确定包含所有可能的模型的假设空间,即学习模型的集合
3)确定模型选择的准则,即学习
作者|Dario Radečić
编译|VK
来源|Towards Datas Science
2020年即将结束(终于),数据可视化再重要不过了。呈现一个看起来像5岁小孩的东西已经不再是一个选择,所以数据科学家需要一个有吸引力和简单易用的数据可视化库。
今天我们将比较其中的两个-Matp
作者|Jenny Dcruz
编译|VK
来源|Towards Datas Science
Seaborn是一个功能强大的Python库,用于增强数据可视化。它为Matplotlib提供了大量高级接口。Seaborn可以很好地处理数据帧,而Matplotlib则不行,它可以让你以更简单的
作者|Zolzaya Luvsandorj
编译|VK
来源|Towards Datas Science
掌握sklearn必须知道这三个强大的工具。因此,在建立机器学习模型时,学习如何有效地使用这些方法是至关重要的。
在深入讨论之前,我们先从两个方面着手:
Transformer:Tr
作者|Paul Hiemstra
编译|VK
来源|Towards Datas Science
你也可以在GitHub上阅读这篇文章。这个GitHub存储库包含你自己运行分析所需的一切:https://github.com/PaulHiemstra/lasso_tsfresh_articl
作者|Aniket Maurya
编译|VK
来源|Towards Datas Science
这个博客的源代码可以从https://github.com/aniketmaurya/tensorflow-web-app-starter-pack获得
让我们从一个简单的helloworld示
作者|Cory Maklin
编译|VK
来源|Towards Datas Science
通常情况下,我们不能解析地求解积分,必须借助其他方法,其中就包括蒙特卡罗积分。你可能还记得,函数的积分可以解释为函数曲线下的面积。
蒙特卡罗积分的工作原理是在a和b之间的不同随机点计算一个函数,将矩
了解最新的T恤图案背后的最新研究,该模型欺骗了先进的人体检测系统
作者|Param Raval
编译|Flin
来源|towardsdatascience
一个穿着特定类型的T恤的人如何使人身检测和人类监视系统看不见他?好吧,研究人员已经发现并利用了深度神经网络的致命弱点——一些最好的物
作者|Zijing Zhu
编译|VK
来源|Towards Datas Science
据估计,世界上80%的数据是非结构化的。因此,从非结构化数据中提取信息是数据分析的重要组成部分。
文本挖掘是从非结构化文本数据中获取有价值的信息的过程,情感分析是文本挖掘的应用之一。它使用自然语言处
作者|Rizky Maulana Nurhidayat
编译|VK
来源|Towards Datas Science
数据可视化用于以更直接的表示方式显示数据,并且更易于理解。它可以用柱状图、散点图、折线图、饼图等形式形成。许多人仍然使用Matplotlib作为后端模块来可视化他们的图形。
作者|Audhi Aprilliant
编译|VK
来源|Towards Datas Science
概述
对于这个项目,我们在2019年5月28-29日通过爬虫来使用Twitter的原始数据。此外,数据是CSV格式(逗号分隔),可以在这里下载。
https://github.com/a
作者|Chien Vu
编译|Flin
来源|towardsdatascience
背景与挑战
作者|SHIPRA SAXENA
编译|Flin
来源|analyticsvidhya
总览
了解什么是分类数据编码
了解不同的编码技术以及何时使用它们
介绍
机器学习模型的性能不仅取决于模型和超参数,还取决于我们如何处理并将不同类型的变量输入模型。由于大多数机器学习模型仅接受数值
TextRank算法
TD-IDF是基于词频的算法,而TextRank是基于图 形的算法。
TextRank是受到PageRank算法的启发。
PageRank算法
PageRank主要用于对在线搜索结果中的网页进行排序。
PageRank对于每个网页页面都给出一个正实数,表示网页的重
作者|Muhammad Ardi
编译|Flin
来源|analyticsvidhya
介绍
嘿!几个小时前我刚刚完成一个深度学习项目,现在我想分享一下我所做的事情。这一挑战的目标是确定一个人是否患有肺炎。如果是,则确定是否由细菌或病毒引起。好吧,我觉得这个项目应该叫做分类而不是检测。