标签:人工智能
Flink主要用来处理数据流,所以从抽象上来看就是对数据流的处理,正如前面大数据开发-Flink-体系结构 && 运行架构提到写Flink程序实际上就是在写DataSource、Transformation、Sink. DataSource是程序的数据源输入,可以通过Stream
人工智能成了当下新时代的必修课,每个人都需要一些AI知识来升级自己,才能与时代同行。   对于大多数的新手来说,如何入手人工智能其实都是一头雾水,比如到底需要哪些数学基础、是否要有工程 经验、对于深度学习框架应该关注什么等等。   王天一教授与你分享他对人工智能的理解,用通俗易懂的语言从零开始教你
本文主要介绍总体及样本的主成分的概念,如何可视化,以及一些最基本的性质。 1 总体的主成分 考虑(xsim (mu,Sigma)),其中(Sigma)可分解为(Sigma=GammaLambdaGamma'),(Gamma=(eta_1,ldots,eta_d)),各列为单位特征向量,(Lambd
一、单标签多分类 1、单标签二分类算法原理 单标签二分类这种问题是我们最常见的算法问题,主要是指label 标签的取值只有两种,并且算法中只有一个需要预测的label标签; 直白来讲就是每个实例的可能类别只有两种(A or B);此时的分类 算法其实是在构建一个分类线将数据划分为两个类别。
1 为何需要标准化 有的数据,不同维度的数量级差别较大,导致有的维度会主导整个分析过程。如下图所示: 该图的数据维度(d=30),样本量(n=40),上面的图是对原始数据做PCA后,第一个PC在各个维度上的权重的平行坐标图,下面的图则是对数据做标准化之后的情况。可以发现,在原始数据中,第(4)和
今天的人工智能,犹如一百年前的电,正在给人类带来同样巨大,甚至更加精彩的变化。   这是一个属于人工智能的时代。人工智能正在渗透到各行各业,并且离我们越来越近,新的时代中,我们应 该如何利用好新武器?   为你系统剖析人工智能核心技术,精讲人工智能国际顶级学术会议核心论文,解读技术发展前沿与最新研
Benamou Brenier算法 Brief 是一种连续数值方法,将最优传输问题转化为一个容易处理的(d+1)维凸变分问题。我们将会用Wasserstein测地线的理论描述它(相比于找到映射,这个方法是找到测地曲线(mu_t))。 另外两个经典的连续方法是: Angenent-Hacker-T
写在前面 之前为了应付课程Project对GNN的学习就是半路出家,全靠网上的博客。所以现在对于一些GNN底层最基本的东西还不是很清楚,觉得理应学明白一点。之前就对《深入浅出图神经网络》一书有所耳闻,看了网上的一些评论认为这本书的内容还是偏浅偏简单,我认为权当一个引子作为学习GNN的第一步也没什么
强化学习是智能体与环境的交互,通过交互信息来感知环境,从而调整自己的行为,选择出最好的结果。 【相当于人做了多次的探索,把最后的劳动成果以状态值函数、动作状态对值函数等方式表达出来。对人学习过程的简单模拟】 需要思考的问题: 研究什么问题,与环境中的什么东西相关? 哪些行为可以影响到环境,是不是可
第3章 卷积神经网络 卷积神经网络CNN是目前应用最广泛的模型之一,具有局部连接、权值共享等特点,是一种深层前馈神经网络。 3.1 卷积与池化 卷积与池化是CNN中的两个核心操作。 3.1.1 信号处理中的卷积 题外话:因为这部分的核心知识应该是属于《信号与系统》这门课程的,但...我没学过,所
第2章 神经网络基础 2.1 机器学习基本概念 2.1.1 机器学习的分类 机器学习有以下几种常见的分类方法: 根据训练数据是否有标签可分为: 监督学习:训练数据中每个样本都有标签,通过标签指导模型进行训练 无监督学习:训练数据完全没有标签,算法从数据中发现约束关系,如数据之间的关联等,典型的无监
友盟+近日发布了《小程序用户增长白皮书》,白皮书总结了友盟+在小程序统计分析和精细化运营方面的方法论、解决方案和成功案例,以下为白皮书的部分内容: 移动互联网已经进入存量市场,移动设备数、用户数、用户时长都处于存量市场竞争。2020年新应用上线做到腰部以上活跃度的难度已经非常大,用户整体呈下降态势
本文写作时间:2021 年 5 月 前言: Jupyter Notebook 默认并不支持 Conda,无法访问虚拟环境中的资源,自然也无法切换不同的虚拟环境运行笔记。通过插件 nb_conda 可以添加对 Conda 环境的支持。 官方对于 nb_conda 的描述是:Provides Cond
第4章 表示学习 在第2章的时候提到了机器学习的第一步就是提取特征。而表示学习就是自动地从数据中学习特征,并直接用于后续的任务。 4.1 表示学习 4.1.1 表示学习的意义 表示学习要回答3个问题: 如何判断一个表示比另一个表示更好? 如何挖掘这些表示? 使用什么样的目标去得到一个好的表示? 举
介绍 大概4月,Flink1.13就发布了,参加 了Flink1.13 的Meetup,收获还是挺多,从大的方面讲就是FlingSql的改进和优化,资源调度管理方面的优化,以及流批一体Flink在运行时与DataStream API的优化,另外就是State backend 模块的优化,本篇文章既
前一篇博客利用Pytorch手动实现了LeNet-5,因为在训练的时候,机器上的两张卡只用到了一张,所以就想怎么同时利用起两张显卡来训练我们的网络,当然LeNet这种层数比较低而且用到的数据集比较少的神经网络是没有必要两张卡来训练的,这里只是研究怎么调用两张卡。 现有方法 在网络上查找了多卡训练的
Beam Search 简单介绍一下在文本生成任务中常用的解码策略Beam Search(集束搜索)。 生成式任务相比普通的分类、tagging等NLP任务会复杂不少。在生成的时候,模型的输出是一个时间步一个时间步依次获得的,而且前面时间步的结果还会影响后面时间步的结果。也就是说,每一个时间步,模
引言 其实最近挺纠结的,有一点点焦虑,因为自己一直都期望往自然语言处理的方向发展,梦想成为一名NLP算法工程师,也正是我喜欢的事,而不是为了生存而工作。我觉得这也是我这辈子为数不多的剩下的可以自己去追求自己喜欢的东西的机会了。然而现实很残酷,大部分的公司算法工程师一般都是名牌大学,硕士起招,如同一