问题描述
- 开发同事在在14点左右发现任务表
task_info
数据不正确,3个小时之前的数据消失了,数据截至时间11:38:27
问题分析
-
查询过dba_source,只找到一个删除该表的存储过程,而且也不会造成这种情况;
-
根据现象,怀疑有人在11:38左右做了delete操作且没有写where条件,把整表数据全部删除;
-
关联查询dba_hist_active_sess_history,gv$sql未发现相关语句
-
关联查询gv$active_session_history,gv$sql也未发现相关语句
-
可能时间太久,sql已经不在缓存中 ,根据推测时间精确查找gv$active_session_history,发现有delete操作,且通过等待事件参数和object_id都确定为这个表,但是sql缺失,不能确定是否是该条记录,且通过machine等信息看,还是一个iis站点程序,一般情况程序不会犯这等错误
select t.* from v$active_session_history t where t.sample_time between to_date('2020-11-26 11:36:00','yyyy-mm-dd hh24:mi:ss') and to_date('2020-11-26 11:40:00','yyyy-mm-dd hh24:mi:ss') and t.SQL_OPNAME not in ('SELECT','INSERT','UPDATE')
-
通过logminer解析日志查看相关信息
-
恢复相关时刻的日志
select t.FIRST_TIME, t.NAME, t.BLOCKS * t.BLOCK_SIZE / 1024 / 1024 size_mb, t.NEXT_TIME, t.COMPLETION_TIME from v$archived_log t order by first_time desc;
-
通过rman恢复相关归档日志
run{ ALLOCATE CHANNEL CH1 DEVICE TYPE DISK; ALLOCATE CHANNEL CH2 DEVICE TYPE DISK; ALLOCATE CHANNEL CH3 DEVICE TYPE DISK; ALLOCATE CHANNEL CH4 DEVICE TYPE DISK; set archivelog destination to '+DG_FLASH_ARCH'; restore archivelog from time 'sysdate-5/24'; }
-
执行logminer
begin dbms_logmnr.add_logfile('+dg_flash_arch/rac/ARCHIVELOG/2020_11_26/thread_2_seq_119065.391.1057504707',dbms_logmnr.new); --dbms_logmnr.add_logfile('+DG_FLASH_ARCH/rac/archivelog/2020_11_26/thread_2_seq_119065.391.1057504707',dbms_logmnr.ADDFILE); end; begin dbms_logmnr.start_logmnr(options=>dbms_logmnr.dict_from_online_catalog+dbms_logmnr.committed_data_only); end; create table t1 tablespace USERS as select * from v$logmnr_contents where table_name='TASK_INFO' and OPERATION='DELETE'; select t1.machine_name,t1.client_id,t1.* from t1 order by t1.client_id desc; begin DBMS_LOGMNR.END_LOGMNR();end;
-
-
查询machine_name,client_id,session#编号信息都是没有有效信息
-
最后发现有解析redo结果中有事务id,对比v$active_session_history中之前找到的那条记录,发现解析出来的事务号跟其一致,这下就证实了是程序删除的
-
问题回转给开发查找代码,最终找到相应代码,并整改。
总结
查找过程中,线索屡次中断,还好没放弃,最后意外通过事务号一锤定音。
文章来源: 博客园
- 还没有人评论,欢迎说说您的想法!