目录
0. 简介
1. 安装1.1 安装 CUDA 和 cuDNN
2. 数据集2.1 使用 tensorflow_datasets 导入公共数据集
2.2 数据集过大导致内存溢出
自然语言处理又称计算语言学,其目标是让计算机处理或"理解"自然语言,以完成有意义的任务。
自然语言的难度
将自然语言与编程语言对比,直观的的体会自然语言的复杂程度。
自然语言词汇量大
自然语言是非结构化的,编程语言是结构化的
自然语言含有大量歧义
容错性
易变性
简略性-人类经常省略大
深度学习从入门到入土,安装软件及配置环境踩了不少坑,过程中参考了多处博主给的解决方法,遂整合一下自己的采坑记录。
(若遇到不一样的错误,请参考其他博主答案解决)
笔者电脑系统为win10系统,在此环境下安装
Pycharm 5.0.3
Anaconda 3
TensorFlow 2.0 for Linux 使用时报错:(cuDNN 版本低了)
E tensorflow/stream_executor/cuda/cuda_dnn.cc:319] Loaded runtime CuDNN library: 7.4.1 but source was
问题描述
tf.keras 在加载 cifar10 数据时报错,ssl.SSLError: [SSL: DECRYPTION_FAILED_OR_BAD_RECORD_MAC] decryption failed or bad record mac (_ssl.c:1977)
import
论文 Decoupled Weight Decay Regularization 中提到,Adam 在使用时,L2 regularization 与 weight decay 并不等价,并提出了 AdamW,在神经网络需要正则项时,用 AdamW 替换 Adam+L2 会得到更好的性能。
Update:2020/01/11
如果想要在 tf.keras 中使用 AdamW、SGDW 等优化器,请将 TensorFlow 升级到 2.0,之后在 tensorflow_addons 仓库中可以找到该优化器,且可以正常使用,具体参照:【tf.keras】AdamW: Adam w
1008 数组元素循环右移问题 (20分)
题目地址:https://pintia.cn/problem-sets/994805260223102976/problems/994805316250615808
输入格式:
每个输入包含一个测试用例,第1行输入N(1≤N≤100)和M(≥0
批量归一化
论文地址:https://arxiv.org/abs/1502.03167批量归一化基本上是现在模型的标配了.
说实在的,到今天我也没搞明白batch normalize能够使得模型训练更稳定的底层原因,要彻底搞清楚,涉及到很多凸优化的理论,需要非常扎实的数学基础才行.目前为止
1011 A+B 和 C (15分)
题目地址:https://pintia.cn/problem-sets/994805260223102976/problems/994805312417021952
输入格式:
输入第 1 行给出正整数 T (≤10),是测试用例的个数。随后给出 T
本文使用TensorFlow2.0手动搭建简单的全连接网络进行MNIST手写数据集的分类识别,逐步讲述实现过程,穿插TensorFlow2.0语法,文末给出完整的代码。废话少说,开始动手吧!
一、量子波动撸代码
该节先给出各代码片段,第二节将这些片段汇总成程序,这些代码片段故意包含
出门旅行,订酒店是必不可少的一个环节。住得干净、舒心对于每个出门在外的人来说都非常重要。
在线预订酒店让这件事更加方便。当用户在马蜂窝打开一家选中的酒店时,不同供应商提供的预订信息会形成一个聚合列表准确地展示给用户。这样做首先避免同样的信息多次展示给用户影响体验,更重要的是帮助用户进行全网
梯度下降法作为机器学习中较常使用的优化算法,其有着三种不同的形式:批量梯度下降(Batch Gradient Descent)、随机梯度下降(Stochastic Gradient Descent)以及小批量梯度下降(Mini-Batch Gradient Descent)。其中小批量
With语句是什么?
有一些任务,可能事先需要设置,事后做清理工作。对于这种场景,Python的with语句提供了一种非常方便的处理方式。一个很好的例子是文件处理,你需要获取一个文件句柄,从文件中读取数据,然后关闭文件句柄。
如果不用with语句,代码如下:
在应用机器学习算法时,我们通常采用梯度下降法来对采用的算法进行训练。其实,常用的梯度下降法还具体包含有三种不同的形式,它们也各自有着不同的优缺点。
下面我们以线性回归算法来对三种梯度下降法进行比较。
一般线性回归函数的假设函数为:
$h_{thet
1012 数字分类 (20分)
题目地址:https://pintia.cn/problem-sets/994805260223102976/problems/994805311146147840
给定一系列正整数,请按要求对数字进行分类,并输出以下 5 个数字:
(A_1) = 能被 5
Notation:
m=number of training examples
n=number of features
x="input" variables / features
y="output"variable/"target" variable
((x^{(i)},y^{(i)
某部队进行新兵队列训练,将新兵从一开始按顺序依次编号,并排成一行横队,训练的规则如下:从头开始一至二报数,凡报到二的出列,剩下的向小序号方向靠拢,再从头开始进行一至三报数,凡报到三的出列,剩下的向小序号方向靠拢,继续从头开始进行一至二报数。。。,以后从头开始轮流进行一至二报数、一至三报数直
引言
这段时间来,看了西瓜书、蓝皮书,各种机器学习算法都有所了解,但在实践方面却缺乏相应的锻炼。于是我决定通过Kaggle这个平台来提升一下自己的应用能力,培养自己的数据分析能力。
我个人的计划是先从简单的数据集入手如手写数字识别、泰坦尼克号、房价预测,这些目前已经有丰富且成熟的方案可以参
1016 部分A+B (15分)
输入样例1
3862767 6 13530293 3
输出样例1
399
输入样例2
3862767 1 13530293 8
输出样例2
0
我的理解
这个思路也挺直观的,找出字符串中给定重复字符的个数,然后构造数字,相加即可。因为要找