问题描述

  1. 开发同事在在14点左右发现任务表task_info数据不正确,3个小时之前的数据消失了,数据截至时间11:38:27

问题分析

  1. 查询过dba_source,只找到一个删除该表的存储过程,而且也不会造成这种情况;

  2. 根据现象,怀疑有人在11:38左右做了delete操作且没有写where条件,把整表数据全部删除;

  3. 关联查询dba_hist_active_sess_history,gv$sql未发现相关语句

  4. 关联查询gv$active_session_history,gv$sql也未发现相关语句

  5. 可能时间太久,sql已经不在缓存中 ,根据推测时间精确查找gv$active_session_history,发现有delete操作,且通过等待事件参数和object_id都确定为这个表,但是sql缺失,不能确定是否是该条记录,且通过machine等信息看,还是一个iis站点程序,一般情况程序不会犯这等错误

    select t.* from v$active_session_history t where t.sample_time
     between to_date('2020-11-26 11:36:00','yyyy-mm-dd hh24:mi:ss')
     and  to_date('2020-11-26 11:40:00','yyyy-mm-dd hh24:mi:ss')
     and t.SQL_OPNAME not in ('SELECT','INSERT','UPDATE')
    
  6. 通过logminer解析日志查看相关信息

    • 恢复相关时刻的日志

      select t.FIRST_TIME,
             t.NAME,
             t.BLOCKS * t.BLOCK_SIZE / 1024 / 1024 size_mb,
             t.NEXT_TIME,
             t.COMPLETION_TIME
        from v$archived_log t
       order by first_time desc;
      
    • 通过rman恢复相关归档日志

      run{
      ALLOCATE CHANNEL CH1 DEVICE TYPE DISK;
      ALLOCATE CHANNEL CH2 DEVICE TYPE DISK;
      ALLOCATE CHANNEL CH3 DEVICE TYPE DISK;
      ALLOCATE CHANNEL CH4 DEVICE TYPE DISK;
      set archivelog destination to '+DG_FLASH_ARCH';
      restore archivelog from time 'sysdate-5/24';
      }
      
    • 执行logminer

      begin 
        dbms_logmnr.add_logfile('+dg_flash_arch/rac/ARCHIVELOG/2020_11_26/thread_2_seq_119065.391.1057504707',dbms_logmnr.new);
        --dbms_logmnr.add_logfile('+DG_FLASH_ARCH/rac/archivelog/2020_11_26/thread_2_seq_119065.391.1057504707',dbms_logmnr.ADDFILE);
      end;
      
      begin 
        dbms_logmnr.start_logmnr(options=>dbms_logmnr.dict_from_online_catalog+dbms_logmnr.committed_data_only);
      end;
      
      create table t1 tablespace USERS as 
      select * from v$logmnr_contents where table_name='TASK_INFO' and OPERATION='DELETE';
      select t1.machine_name,t1.client_id,t1.* from t1 order by t1.client_id  desc;
      
      begin DBMS_LOGMNR.END_LOGMNR();end;
      
  7. 查询machine_name,client_id,session#编号信息都是没有有效信息

  8. 最后发现有解析redo结果中有事务id,对比v$active_session_history中之前找到的那条记录,发现解析出来的事务号跟其一致,这下就证实了是程序删除的

  9. 问题回转给开发查找代码,最终找到相应代码,并整改。

总结

查找过程中,线索屡次中断,还好没放弃,最后意外通过事务号一锤定音。

内容来源于网络如有侵权请私信删除

文章来源: 博客园

原文链接: https://www.cnblogs.com/startupforce/p/14043330.html

你还没有登录,请先登录注册
  • 还没有人评论,欢迎说说您的想法!