模块:pickle
所包含API列表:
pickle.dumps : 把任意对象序列化成一个bytes pickle.dump : 直接把对象序列化后写入一个file-like Object pickle.loads : 将json格式字符串转换为python
模块:json
所包含API列表:
json.dumps : 将python对象转换成json格式 json.loads : 将json格式字符串转换为python对象
————————————————————————
模块: io io.StringIO io.BytesIO
所包含API列表: io.StringIO.write: 写入字符 io.StringIO.getvalue: 获取写入的字符 io.StringIO.readline: 按行读取字符 io.BytesIO
Z: 整数集N: 自然数集Q: 有理数集R: 实数集
$bm{mathring{U}(x_0, delta)}$: $x_0$的$delta$去心邻域
$bm{U(x_0,delta)}$: $x_0$的$delta$邻域
两个整数互质(或互素)是指它们没有大于1的整数公因子
对于分数$frac{p}{q}$,要求分子p与分母q互质是为了避免相等的分数重复出现
例如:3和4是互质的,它们没有大于1的整数公因子
8和6不是互质的,因为它们有大于1的整数公因子2
集合的概念
具有某种特定性质的事物的总体称为集合
组成集合的事物称为元素
不含任何元素的集合称为空集,记作Ø
元素a属于集合M,记作$ a in M $
元素a不属于集合M,记作$ a notin M $
定义
设有集合$A$和$B$,若$x in A$ 必有$x in B$,则称$A$是$B$的子集,或称B包含A,记作$A subset B$
若$A subset B$且$B subset A$,则称$A$与$B$相等,记作$A$ = $B$
如:$N
区间
是指介于某两个实数之间的全体实数,这两个实数叫做区间的端点
若$forall a,b in R,且 a < b $,则
以下称为有限区间
${x | a < x < b}$,称为开区间,记作$(a,b)$
全称量词:
任意:$forall$,For ALL,字母A倒过来就是其符号
存在量词:
存在: $exists$,Exists,字母E倒过来就是其符号
使用数学公式描述以下命题1 对任意实数x,都存在比x更大的实数y: 描述:$f
Group by分组函数的自定义,与group by配合使用可更加灵活的对结果集进行分组,Grouping sets会对各个层级进行汇总,然后将各个层级的汇总值union all在一起,但却比单纯的group by + union all 效率要高
1 创建数据
&
类型:View
Owner:SYS
内容:记录了数据库中所有的对象
字段:
OWNER:对象的Owner
OBJECT_NAME:对象名称
SUBOBJECT_NAME:对象的子对象名字,例如分区
以下是Oracle常用概念
驱动表和被驱动表
PGA
同义词
------------------------------------
概述 DB Link是一个定义了本地数据库到远程数据库路径的对象,是schema object,它是单向连接 通过DB Link可查询remote数据库的对象及运行其程序 在分布式环境里,DB Link是很有必要的
DB Link所需必备条件: 1) 从本地数据库到远程数据库的
1 下载安装文件并点击安装
安装过程无其他特殊配置,仅需一直下一步即可
注: 1) 但由于安装文件很大,因此需本地预留足够的空间
2) 安装包括powercenter和developer两部分,若只想安装powercenter,则在安装过程中将dev
Bulk加载模式是Informatica提供的一种高性能数据加载模式,它利用数据库底层机制,依靠调用数据库本身提供的Utility来进行数据的加载 该方式将绕过数据库的log记录,以此提高数据库加载性能,因此Bulk模式不能进行数据的Rollback操作,也不可能使用数据库做Recover操
关于性能瓶颈
性能调优的首要步骤是发现性能上的瓶颈 性能瓶颈可能会发生在Source,Target,Mapping,Session及System 性能调优的方法即按照顺序依次判断各部分的性能并解决,直至性能达到要求
请按照下列顺序依次排查性能瓶颈 1 Tar
最常见的性能问题都发生在向目标数据库写数据的时候
常见的与目标数据库性能有关的问题有: 1) 数据库的checkpoint间隔太小 2) 数据库网络包太小 3) 在进行大批量数据加载时的问题
如何判断目标的性能瓶颈 1) 将session复制一
数据源的瓶颈通常发生从数据库读取数据的时候,原因通常如下: 1) 脚本的查询效率低下 2) 数据库网络包太小如何判定源瓶颈 通过在session log中读取thread statistics判定源的瓶颈 如果read thread花费的时间大大多于write
如果Source和Target都不存在性能上的瓶颈,则问题可能会出在Mapping如何判定Mapping存在性能瓶颈 1) 在session log中读取thread statistics和work time statistics信息 如果transforma
如果Source,Target和Mapping都不存在性能上的瓶颈,则问题可能会出在Session以下问题可导致Session有性能上的瓶颈 1) 缓存小 2) 缓冲内存小 3) commit提交间隔小如何判定Session存在性能瓶颈 分析performance detai