解决Oracle数据库出现问题时的脚本有哪些

57次阅读
没有评论

共计 5138 个字符,预计需要花费 13 分钟才能阅读完成。

本篇内容主要讲解“解决 Oracle 数据库出现问题时的脚本有哪些”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让丸趣 TV 小编来带大家学习“解决 Oracle 数据库出现问题时的脚本有哪些”吧!

查看操作系统负载

登上数据库服务器后,第一个就是通过系统命令确认下 CPU、内存、I/ O 是否异常,每个系统的命令不一样,常见的有 top、topas、vmstat、iostat。

查看等待事件

第二步就是连到数据库查看活动的等待事件,这是监控、巡检、诊断数据库最基本的手段,通常 81% 的问题都可以通过等待事件初步定为原因,它是数据库运行情况最直接的体现,如下脚本是查看每个等待事件的个数、等待时长,并排除了一些常见的 IDLE 等待事件。

-- 墨天轮  wait_event 
col event for a45 
SELECT inst_id,EVENT, SUM(DECODE(WAIT_TIME, 0, 0, 1))  Prev , SUM(DECODE(WAIT_TIME, 0, 1, 0))  Curr , COUNT(*)  Tot  , sum(SECONDS_IN_WAIT) SECONDS_IN_WAIT 
FROM GV$SESSION_WAIT
WHERE event NOT 
IN (smon timer , pmon timer , rdbms ipc message , SQL*Net message from client , gcs remote message) 
 AND event NOT LIKE  %idle%  
 AND event NOT LIKE  %Idle%  
 AND event NOT LIKE  %Streams AQ%  
GROUP BY inst_id,EVENT 
ORDER BY 1,5 desc;

这里就需要掌握一些常见异常等待事件的原因,并形成条件反射,比如 library cache lock、read by other session、row cache lock、buffer busy waits、latch:shared pool、gc buffer busy、cursor: pin S on X、direct path read、log file sync、enq: TX – index contention、PX Deq Credit: send blkd、latch free、enq: TX – row lock contention 等等,如果异常等待事件的个数和等待时间很长,那么排查原因的入口就在这里。

根据等待事件查会话

得到异常等待事件之后,我们就根据等待事件去查会话详情,也就是查看哪些会话执行哪些 SQL 在等待,另外还查出来用户名和机器名称,以及是否被阻塞。另外如下脚本可改写成根据用户查会话、根据 SQL_ID 查会话等等。

-- 墨天轮  session_by_event 
SELECT /*+rule */ sid, s.serial#, spid, event, sql_id, seconds_in_wait ws, row_wait_obj# obj, s.username, s.machine, 
BLOCKING_INSTANCE|| . ||blocking_session b_sess FROM v$session s, 
v$process p WHERE event= event_name  AND s.paddr = p.addr order by 6;

查询某个会话详情

得到会话列表之后,可以根据如下 SQL 查询某个会话的详细信息,如上次个执行的 SQL_ID,登录时间等,该 SQL 也可改写成多个。

-- 墨天轮  session_by_sid 
SELECT s.sid, s.serial#, spid, event, sql_id, PREV_SQL_ID, 
seconds_in_wait ws, row_wait_obj# obj, s.username, s.machine, 
module,blocking_session b_sess,logon_time FROM v$session s, v$process p WHERE sid =  sid  AND s.paddr = p.addr;

查询对象信息

从前面两个 SQL 都可以看到会话等待的对象 ID,可以通过如下 SQL 查询对象的详细信息。

-- 墨天轮  obj_info 
col OBJECT_NAME for a30 
select owner,object_name,subobject_name,object_type from dba_objects where 
object_id= oid;

查询 SQL 语句

根据 SQL_ID、HASH_VALUE 查询 SQL 语句。如果 v$sqlarea 中查不到,可以尝试 DBA_HIST_SQLTEXT 视图中查询。

-- 墨天轮  sql_text 
select sql_id,SQL_fullTEXT from v$sqlarea where (sql_id= sqlid  or 
hash_value=to_number(hashvale) ) and rownum

关于 SQL 语句的执行计划、对象的统计信息、性能诊断、跟踪 SQL 等这里就不展开,后面计划出一个类似的系列,敬请关注。

查询会话阻塞情况

通过如下 SQL 查询某个会话阻塞了多少个会话。

-- 墨天轮  blocking_sess 
select count(*),blocking_session from v$session where blocking_session 
is not null group by blocking_session;

查询数据库的锁

通过如下 SQL 查询某个会话的锁,有哪些 TM、TX 锁,以及会话和锁关联查询的 SQL,注意这里指定了 ctime 大于 100 秒,30% 的情况是人为误操作锁表,导致应用 SQL 被阻塞,无法运行。

-- 墨天轮  lock 
set linesize 180 
col username for a15 
col owner for a15 
col OBJECT_NAME for a30 
col SPID for a10 
-- 查询某个会话的锁  
select /*+rule*/SESSION_ID,OBJECT_ID,ORACLE_USERNAME,OS_USER_NAME,PROCESS,
 LOCKED_MODE from gv$locked_object where session_id= sid; 
 
-- 查询 TM、TX 锁  
select /*+rule*/* from v$lock where ctime  100 and type in (TX , TM) order by 3,9; 
 
-- 查询数据库中的锁  
select /*+rule*/s.sid,p.spid,l.type,round(max(l.ctime)/60,0) 
lock_min,s.sql_id,s.USERNAME,b.owner,b.object_type,b.object_name from 
v$session s, v$process p,v$lock l,v$locked_object o,dba_objects b 
where o.SESSION_ID=s.sid and s.sid=l.sid and o.OBJECT_ID=b.OBJECT_ID 
and s.paddr = p.addr and l.ctime  100 and l.type in (TX , TM , FB) 
group by 
s.sid,p.spid,l.type,s.sql_id,s.USERNAME,b.owner,b.object_type,b.object_name 
order by 9,1,3

保留现场证据

有的问题可能需要分析很长时间,或者是需要外部人员协助分析,那么保留现场证据就非常重要了,下面脚本是 systemstate dump 和 hanganalyze 步骤,如果有 sqlplus 无法登陆的情况,可以加 -prelim 参数。

--systemstate dump 
sqlplus -prelim / as sysdba 
oradebug setmypid 
oradebug unlimit; 
oradebug dump systemstate 266; 
--wait for 1 min 
oradebug dump systemstate 266; 
--wait for 1 min 
oradebug dump systemstate 266; 
oradebug tracefile_name; 
 --hanganalyze 
oradebug setmypid 
oradebug unlimit; 
oradebug dump hanganalyze 3
 --wait for 1 min 
oradebug dump hanganalyze 3 
--wait for 1 min 
oradebug dump hanganalyze 3 
oradebug tracefile_name

杀会话

通常情况下,初步定为问题后为了快速恢复业务,需要去杀掉某些会话,特别是批量杀会话,有时还会直接 kill 所有 LOCAL=NO 的进程,再杀会话时一定要检查确认,更不能在别的节点或者别的服务器上执行。

- 墨天轮  kill_sess 
set line 199 
col event format a35 
-- 杀某个 SID 会话  
SELECT /*+ rule */ sid, s.serial#,  kill -9  ||spid, event, 
blocking_session b_sess FROM v$session s, v$process p WHERE sid= sid  AND s.paddr = p.addr order by 1; 
-- 根据 SQL_ID 杀会话  
SELECT /*+ rule */ sid, s.serial#,  kill -9  ||spid, event, 
blocking_session b_sess FROM v$session s, v$process p WHERE sql_id= sql_id  AND s.paddr = p.addr order by 1; 
-- 根据等待事件杀会话  
SELECT /*+ rule */ sid, s.serial#,  kill -9  ||spid, event, 
blocking_session b_sess FROM v$session s, v$process p WHERE event= event  AND s.paddr = p.addr order by 1; 
-- 根据用户杀会话  
SELECT /*+ rule */ sid, s.serial#,  kill -9  ||spid, event, 
blocking_session b_sess FROM v$session s, v$process p WHERE username= username  AND s.paddr = p.addr order by 1; 
--kill 所有 LOCAL=NO 进程  
ps -ef|grep LOCAL=NO|grep $ORACLE_SID|grep -v grep|awk  {print $2}  |xargs ki

重启方法

tail -f alert_.log
alter system checkpoint;
alter system switch logfile;
shutdown immediate;
startu

如需要修改静态参数、内存等问题,需要重启数据库,(不要觉得重启很 LOW,在很多情况下为了快速恢复业务经常使用这个从网吧里传出来的绝招),记住千万不要在这个时候死磕问题原因、当作课题研究,我们的首要任务是恢复业务。

CRT 按钮小技巧

另外介绍一个小技巧,就是把常用的脚本整理到 SecureCRT 的 Button Bar 中,只需要点一下设置好的 button,就相当于直接执行相应的 SQL 语句,这样就不用每次粘贴复制执行,或者是把脚本上传到每个服务器上。不过不要设置 DDL 等操作性的 button,以免误点。

到此,相信大家对“解决 Oracle 数据库出现问题时的脚本有哪些”有了更深的了解,不妨来实际操作一番吧!这里是丸趣 TV 网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!

正文完
 
丸趣
版权声明:本站原创文章,由 丸趣 2023-07-24发表,共计5138字。
转载说明:除特殊说明外本站除技术相关以外文章皆由网络搜集发布,转载请注明出处。
评论(没有评论)