标签:AI
项目地址: https://github.com/zhangsheng377/emotion-predict-stock 已完成项 使用爬虫爬取股民对于股票的评论。(目前是爬取雪球网上人们对于小米公司的评论) 对人们的评论做情感分析,得到评论的情感得分。(使用工厂模式获取情感分析模型,目前使
全文目录 原文 用户画像的概念和作用 字面上, 用户画像核心作用是对系统的用户进行多维度的信息刻画; 深层次, 通过对用户多维度的刻画, 将不同的用户映射到产品所提供的不同服务上, 或映射到同一服务的不同具体形态上; 推荐系统的用户画像取上图中可以将用户和系统中物品连接起来的格子; 基于算法二次
笔者在学习了吴恩达,以及斯坦福cs224n后,对于Word2Vec有了一些粗浅的理解,如有不合理之处请大家多多指正。这里就记记笔记啦: 一.词汇表征 在自然语言处理当中,一种是利用one-hot vector(独热编码)进行词汇表征,假设有30000个单词,那么hotel是其中的第7889个单词,
声明, 本文仅作为读书笔记目录整理使用. 原文 目录 [x] 第 1 章 推荐系统的时代背景 2021年3月5日 [x] 第 2 章 推荐系统的核心技术概述 2021年2月20日 [x] 第 3 章 基础推荐算法 2021年2月22日 [x] 第 4 章 算法融合与数据血统 2021年2月23
全文目录原文 推荐系统存在必要性 流量利用 流量的四个特点: 稀缺性, 在流量红利退去之后, 部分市场近似零和游戏, 获取流量成本不断增加; 不确定性, 引入用户后如何判断用户来到该网站的意图, 以便进一步针对性的营销活动, 满足用户需求并提高用户体验; 差异性, 基于用户个性, 所处情境不同;
原文 全文目录 多组件, 多模块, 多数据源构成; 涉及用户, 物品, 行为, 上下文等数据; 计算形式包括大数据平台上的批量计算/挖掘/训练, 流式数据的实时处理, 线上的实时服务; 核心逻辑拆解 核心目的: 为用户找当前场景下最具相关性的物品或物品集合; 以用户兴趣为轴: [P(item|us
原文 全文目录 相关性召回+点击率排序 推荐逻辑流程架构 根本任务: 匹配 匹配过程步骤: 相关性召回, 对用户做360度全方位扫描, 尽量多的描述和覆盖用户可能感兴趣的高质量的物品; 候选集融合, 重点关注多样性和相关性的均衡, 召回算法的优先级等问题; 结果排序, 按照某一确定目标进行排序;
原文 全文目录 关联规则算法, 由于限制较大, 所以相关性较强, 但覆盖率较低; 协同过滤算法, 覆盖率更高, 相关性较差; 以上两者基于行为, 有冷启动问题, 所以需要内容相关性算法来托底; 三种算法的融合得出最终的结果; 数据血统: 对数据的来源进行记录与分析的相关数据和过程; 线性加权融合
原文 全文目录 机器学习技术概述 让计算机在没有被显示编程的情况下具有自主学习的能力; 学习出特征和目标之间具体的相关性; 学习结果的用法: 预测, 推断(inference); 推荐系统中的应用场景 推荐系统的本质是匹配; 推荐结果排序 传统的方式是利用公式来定义排序规则, 机器学习是选择具有
原文 全文目录 机器学习技术的实施方法 特征处理 特征工程的重要性 需要同时掌握理论方法和业务逻辑才能提取有效的特征; 在特征方面拥有最大的自主性和探索性; 指征能力, 该特征的大小变化对最终结果的大小变化会在什么方向起到多大的作用; 用户ID类特征 ID特征, 指为每个用户分配一个唯一ID, 将
原文全文目录 机器学习技术的实施方法 预测阶段效果监控 离线预测+在线预测 监控点击率的稳定性 真实点击率的稳定性 计算相邻两个区间内点击率分布的 PSI(Population Stability Index, 群体稳定性指标), 小于 0.1 可认为数据相对稳定; 预测点击率的稳定性 与
LBPH人脸识别 import cv2 import numpy as np images=[] #刘诗诗 images.append(cv2.imread("./lss/1.png",0)) images.append(cv2.imread("./lss/2.png",0)) images.
n-gram模型是自然语言处理里面的一个传统模型。我们来看看他是怎么实现的吧!要了解n-gram模型,我们先来看看什么是语言模型! 一.语言模型 语言模型的定义是:语言模型是一种用来预测下一个单词什么的任务。比如我们有一句话:      the students opened their  __
结果展示 其中绿线是我绘制的图像划分网格。 这里的loss是我训练的 0.77 ,由于损失函数是我自己写的,所以可能跟大家的不太一样,这个不重要,重要的是学习思路。 重点提示 yolov1是一个目标检测的算法,他是一阶段的检测算法。 一阶段(one-stage):检测物体的同时进行分类。
ResNet可以说是我认真读过的第一篇paper,据师兄说读起来比较简单,没有复杂的数学公式,不过作为经典的网络结构还是有很多细节值得深究的。因为平时不太读英文文献,所以其实读的时候也有很多地方不是很懂,还是搜了很多博客,所以我准备结合paper将读到的内容做一下总结。   一、为什么要引入Res
目录   举例   在Inception module上的应用   参考资料 可以减少计算量,可以增加非线性判别能力 举例 假设有1个高为30、宽为40,深度为200的三维张量与55个高为5、宽为5、深度为200的卷积核same卷积,步长=1,则结果是高为30、宽为40、深度为55的三维张量,
上一篇《小样本OLS回归的框架》讲解了小样本OLS回归的主要框架,本文沿着该框架,对小样本OLS回归做一个全面的梳理。 1 假设 这里先将所有的小样本OLS回归中可能用到的假设放到一起,方便浏览。当然,后面的每一个结论并不是要用到所有的假设,而是只用到某几个假设,这在后面讲每个结论时会具体说明。
  之前写了一篇《LAXCUS集群操作系统是个啥》,放到网上后收到网友私信,要求讲讲DFL3小样本深度学习。老实说,我本人不在AI研发团队,让我来讲DFL3,有点班门弄斧的感觉。但是我们团队和AI团队交流颇多,来往互动非常频繁,他们开发的AI编程接口都是交给我们,一起做LAXCUS集群操作系统的