前面我们学习了numpy,现在我们来学习一下pandas。
Python Data Analysis Library 或 pandas 主要用于处理类似excel一样的数据格式,其中有表头、数据序列号以及实际的数据,而numpy就仅仅包含了实际的数据。
安装
直接输入:
pip3 install p
对象的引用
看例子:
a = np.array([0, 1, 2, 3])
b = a
a[0] = 5
print("b=", b)
# 判断a和b是否是同样的地址
print(b is a)
运行结果:
b= [5 1 2 3]
True
上面的例子中,我们改变了a的值,但打印出来b中的值也
有合并,就有分割。
本节主要讲述如何通过numpy对数组进行横向/纵向分割。
横向/纵向分割数组
首先创建一个6行4列的数组,然后我们对此数组按照横向进行切割,分成3块,这样每块应该有2行,见例子:
import numpy as np
a = np.arange(24).reshape(6, 4)
概述
本节主要讲述如何把两个数组按照行或列进行合并。
按行进行上下合并
例如:
import numpy as np
a = np.array([1, 1, 1])
b = np.array([2, 2, 2])
print(np.vstack((a, b)))
合并后输出结果为:
[[1 1 1]
简单的索引值
import numpy as np
a = np.arange(3, 15).reshape(3, 4)
print("a=")
print(a)
print("第2行的数据:", a[2])
print("第2行第3列的数据:", a[2][3])
输出为:
a=
[[ 3
numpy的基础运算中还有很多运算,我们这里再记录一些。
最小/大值索引
前面一篇博文中我们讲述过如何获得数组中的最小值,这里我们获得最小/大值的索引值,也就是这个最小/大值在整个数组中位于第几位。
import numpy as np
a = np.array([[10, 30, 15],
概述
本节主要讲解numpy数组的加减乘除四则运算。
np.array()返回的是numpy的数组,官方称为:ndarray,也就是N维数组对象(矩阵),N-dimensional array object。
这个对象的特性跟矩阵的特性也比较接近,因此我这里有时就将其混称为数组/矩阵了。
数组加法
在上一篇文章中,我们已经看到了如何通过numpy创建numpy中的数组,这里再重复一下:
import numpy as np
# 数组
a = [[1, 2, 3], [4, 5, 6]]
print("a:", a)
# 矩阵
b = np.array(a)
print("b:", b)
执行
目的
本节我们将介绍如何搭建python的开发环境以及numpy的基本属性,这样可以检验我们的numpy是否安装正确了。
python开发环境的搭建
工欲善其事必先利其器,我用得比较顺手的是IntelliJ IDEA的开发环境,这次我也用IDEA的python开发环境来进行开发。
我使用Intell
要玩numpy,就得要安装numpy。
安装python 3.6.3 64位
首先需要安装python,安装python的具体方法这里就不细讲了。
可以到官网上下载相应的python版本就可以了,目前我这里安装的是最新版python 3.6.3,64位的。这里需要注意的是python多少位的,好像后
老鱼为了跟上时代潮流,也开始入门人工智能、机器学习了,瞬时觉得自己有点高大上了:)。
从机器学习的实用系列出发,我们会以numpy => pandas => scikit-learn => tensorflow => keras 的学习系列过程,这也是老鱼设定的学习步骤,有兴
函数move(n,a,b,c)的定义是将n个圆盘从a借助b移动到c。
def move(n,a,b,c):
if n==1:
print a,'-->',c
move (n-1,a,c,b)
一、while循环
1、基本循环
while循环语句基本结构:
[初始化部分一般是用来定义循环变量]
while 循环条件:
循环体语句
[循环变量更改部分]
[els:
机器学习目录
老鱼学Numpy
numpy有什么用numpy安装python开发环境搭建及numpy基本属性numpy创建arraynumpy的基础运算numpy的基础运算2numpy的索引numpy的array合并numpy array分割numpy array的复制
老鱼学Pandas
pand
目录结构:
bin:存放程序入口,程序启动文件。
conf:存放配置文件,配置文件主要是一些全局变量,路径信息等。
core:程序核心文件,不涉及到业务逻辑。
app:存放和系统业务相关的逻辑。
db:存放系统运行所需的数据文件。
lib:
一 创建模型
表和表之间的关系
一对一、多对一、多对多 ,用book表和publish表自己来想想关系,想想里面的操作,加外键约束和不加外键约束的区别,一对一的外键约束是在一对多的约束上加上唯一约束。
实例:我们来假定下面这些概念,字段和关系
准备工作
本机操作系统:CentOS7
python版本:python2.7.5
还需要准备如下信息:
一个云账号、Access Key ID、Access Key Secret、安全组ID、Region ID(如cn-shanghai)
这个。。是我最近想找实习单位。。结果发现boss上很多实习单位名字就叫‘实习生’。。。。。。。太不讲究了 == 难怪一直搜不到。。咳,其实是我自己水平有限,有些简历根本就投不出去 ==
所以就想爬下boss杭州地区有实习生关键词的所有职位,然后在职位详情里面搜索
给定一个只包括 '(',')','{','}','[',']' 的字符串,判断字符串是否有效。
有效字符串需满足:
左括号必须用相同类型的右括号闭合。
左括号必须以正确的顺序闭合。
注意空字符串可被认为是有效字符串。
官方解读:
使用堆栈处
一、日志模块(logging )
日志是一种追踪软件运行时所发生事件的方法
1、简单的日志编写(文件输出)
import logging # 日志模块
# 日志配置,把日志内容存到文件中
logging.basic