技术文章 - IT学院

24

05月

pickle模块及其API

模块：pickle 所包含API列表：　　　pickle.dumps ：把任意对象序列化成一个bytes 　　　pickle.dump ：直接把对象序列化后写入一个file-like Object　　　pickle.loads ：将json格式字符串转换为python

24

05月

Python

json模块及其API

模块：json 所包含API列表：　　　json.dumps ：将python对象转换成json格式　　　json.loads ：将json格式字符串转换为python对象 ————————————————————————

24

05月

Python

io模块及其API

模块: 　　io 　　io.StringIO 　　io.BytesIO 所包含API列表:　　io.StringIO.write: 写入字符　　io.StringIO.getvalue: 获取写入的字符　　io.StringIO.readline: 按行读取字符　　io.BytesIO

24

05月

Python

常见字母含义

Z: 整数集N: 自然数集Q: 有理数集R: 实数集 $bm{mathring{U}(x_0, delta)}$: $x_0$的$delta$去心邻域 $bm{U(x_0,delta)}$: $x_0$的$delta$邻域

24

05月

Python

互质

两个整数互质(或互素)是指它们没有大于1的整数公因子对于分数$frac{p}{q}$，要求分子p与分母q互质是为了避免相等的分数重复出现例如：3和4是互质的，它们没有大于1的整数公因子　　　8和6不是互质的，因为它们有大于1的整数公因子2

24

05月

Python

集合

集合的概念　　具有某种特定性质的事物的总体称为集合　　组成集合的事物称为元素　　不含任何元素的集合称为空集，记作Ø 　　元素a属于集合M，记作$ a in M $ 　　元素a不属于集合M，记作$ a notin M $

24

05月

Python

集合之间的关系及运算

定义　　设有集合$A$和$B$,若$x in A$ 必有$x in B$,则称$A$是$B$的子集，或称B包含A，记作$A subset B$ 　　若$A subset B$且$B subset A$，则称$A$与$B$相等，记作$A$ = $B$ 　　如：$N

24

05月

Python

区间与邻域

区间　　是指介于某两个实数之间的全体实数，这两个实数叫做区间的端点　　若$forall a，b in R，且 a < b $，则　　　　以下称为有限区间　　　　　　${x | a < x < b}$，称为开区间，记作$(a,b)$&#

24

05月

Python

逻辑量词

全称量词：　　任意：$forall$，For ALL，字母A倒过来就是其符号存在量词：　　　存在: $exists$，Exists，字母E倒过来就是其符号使用数学公式描述以下命题1 对任意实数x，都存在比x更大的实数y：描述：$f

24

05月

Python

Group By Grouping Sets

Group by分组函数的自定义，与group by配合使用可更加灵活的对结果集进行分组，Grouping sets会对各个层级进行汇总，然后将各个层级的汇总值union all在一起，但却比单纯的group by + union all 效率要高 1 创建数据 &

24

05月

Python

DBA_OBJECTS

类型：View Owner：SYS 内容：记录了数据库中所有的对象字段：　　OWNER：对象的Owner 　　OBJECT_NAME：对象名称　　SUBOBJECT_NAME：对象的子对象名字，例如分区　　

24

05月

Python

常用概念

以下是Oracle常用概念驱动表和被驱动表 PGA 同义词 ------------------------------------

24

05月

Python

关于DB Link

概述　　DB Link是一个定义了本地数据库到远程数据库路径的对象，是schema object，它是单向连接　　通过DB Link可查询remote数据库的对象及运行其程序　　在分布式环境里，DB Link是很有必要的 DB Link所需必备条件：　　1) 从本地数据库到远程数据库的

24

05月

Python

安装

1 下载安装文件并点击安装　　安装过程无其他特殊配置，仅需一直下一步即可　　注: 1) 但由于安装文件很大，因此需本地预留足够的空间　　　 2) 安装包括powercenter和developer两部分，若只想安装powercenter，则在安装过程中将dev

24

05月

Python

关于Bulk加载模式

　　Bulk加载模式是Informatica提供的一种高性能数据加载模式，它利用数据库底层机制，依靠调用数据库本身提供的Utility来进行数据的加载　　该方式将绕过数据库的log记录，以此提高数据库加载性能，因此Bulk模式不能进行数据的Rollback操作，也不可能使用数据库做Recover操

24

05月

Python

性能瓶颈概览

关于性能瓶颈　　性能调优的首要步骤是发现性能上的瓶颈　　性能瓶颈可能会发生在Source，Target，Mapping，Session及System 　　性能调优的方法即按照顺序依次判断各部分的性能并解决，直至性能达到要求请按照下列顺序依次排查性能瓶颈　　1 Tar

24

05月

Python

性能瓶颈之Target

最常见的性能问题都发生在向目标数据库写数据的时候常见的与目标数据库性能有关的问题有：　　1) 数据库的checkpoint间隔太小　　2) 数据库网络包太小　　3) 在进行大批量数据加载时的问题如何判断目标的性能瓶颈　　1) 将session复制一

24

05月

Python

性能瓶颈之Source

数据源的瓶颈通常发生从数据库读取数据的时候，原因通常如下：　　1) 脚本的查询效率低下　　2) 数据库网络包太小如何判定源瓶颈　　通过在session log中读取thread statistics判定源的瓶颈　　如果read thread花费的时间大大多于write

24

05月

Python

性能瓶颈之Mapping

如果Source和Target都不存在性能上的瓶颈，则问题可能会出在Mapping如何判定Mapping存在性能瓶颈　　1) 在session log中读取thread statistics和work time statistics信息　　　如果transforma

24

05月

Python

性能瓶颈之Session

如果Source，Target和Mapping都不存在性能上的瓶颈，则问题可能会出在Session以下问题可导致Session有性能上的瓶颈　　1) 缓存小　　2) 缓冲内存小　　3) commit提交间隔小如何判定Session存在性能瓶颈　　分析performance detai