监控Oracle数据库的常用shell脚本怎么写

68次阅读
没有评论

共计 10132 个字符,预计需要花费 26 分钟才能阅读完成。

本篇文章给大家分享的是有关监控 Oracle 数据库的常用 shell 脚本怎么写,丸趣 TV 小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着丸趣 TV 小编一起来看看吧。

丸趣 TV 小编下面介绍了 DBA 每天在监控 Oracle 数据库方面的职责,讲述了如何通过 shell 脚本来完成这些重复的监控工作。首先回顾了一些 DBA 常用的 Unix 命令,以及解释了如何通过 Unix Cron 来定时执行 DBA 脚本。同时还介绍了 8 个重要的脚本来监控 Oracle 数据库:
检查实例的可用性
检查监听器的可用性
检查 alert 日志文件中的错误信息
在存放 log 文件的地方满以前清空旧的 log 文件
分析 table 和 index 以获得更好的性能
检查表空间的使用情况
找出无效的对象
监控用户和事务
DBA 需要的 Unix 基本知识
基本的 UNIX 命令
以下是一些常用的 Unix 命令:
ps– 显示进程
grep– 搜索文件中的某种文本模式
mailx– 读取或者发送 mail
cat– 连接文件或者显示它们
cut– 选择显示的列
awk– 模式匹配语言
df– 显示剩余的磁盘空间
以下是 DBA 如何使用这些命令的一些例子:
显示服务器上的可用实例:
$ ps -ef | grep smon
oracle 21832 1 0 Feb 24 ? 19:05 ora_smon_oradb1
oracle 898 1 0 Feb 15 ? 0:00 ora_smon_oradb2
dliu 25199 19038 0 10:48:57 pts/6 0:00 grep smon
oracle 27798 1 0 05:43:54 ? 0:00 ora_smon_oradb3
oracle 28781 1 0 Mar 03 ? 0:01 ora_smon_oradb4、
显示服务器上的可用监听器:
$ ps -ef | grep listener | grep -v grep
(译者注:grep 命令应该加上 - i 参数,即 grep -i listener,该参数的作用是忽略大小写,因为有些时候 listener 是大写的,这时就会看不到结果)
oracle 23879 1 0 Feb 24 ? 33:36 /8.1.7/bin/tnslsnr listener_db1 -inherit
oracle 27939 1 0 05:44:02 ? 0:00 /8.1.7/bin/tnslsnr listener_db2 -inherit
oracle 23536 1 0 Feb 12 ? 4:19 /8.1.7/bin/tnslsnr listener_db3 -inherit
oracle 28891 1 0 Mar 03 ? 0:01 /8.1.7/bin/tnslsnr listener_db4 -inherit
查看 Oracle 存档目录的文件系统使用情况
$ df -k | grep oraarch
/dev/vx/dsk/proddg/oraarch 71123968 4754872 65850768 7% /u09/oraarch
统计 alter.log 文件中的行数:
$ cat alert.log | wc -l
2984
列出 alert.log 文件中的全部 Oracle 错误信息:
$ grep ORA- alert.log
ORA-00600: internal error code, arguments: [kcrrrfswda.1], [], [], [], [], []
ORA-00600: internal error code, arguments: [1881], [25860496], [25857716], []
CRONTAB 基本
一个 crontab 文件中包含有六个字段:
分钟 0-59
小时 0-23
月中的第几天 1-31
月份 1 – 12
星期几 0 – 6, with 0 = Sunday
Unix 命令或者 Shell 脚本
要编辑一个 crontab 文件,输入:
Crontab -e
要查看一个 crontab 文件,输入:
Crontab -l
0 4 * * 5 /dba/admin/analyze_table.ksh
30 3 * * 3,6 /dba/admin/hotbackup.ksh /dev/null 2 1
在上面的例子中,第一行显示了一个分析表的脚本在每个星期 5 的 4:00am 运行。第二行显示了一个执行热备份的脚本在每个周三和周六的 3:00a.m. 运行。
监控数据库的常用 Shell 脚本
  以下提供的 8 个 shell 脚本覆盖了 DBA 每日监控工作的 90%,你可能还需要修改 UNIX 的环境变量。
检查 Oracle 实例的可用性
oratab 文件中列出了服务器上的所有数据库
$ cat /var/opt/oracle/oratab
####################################
## /var/opt/oracle/oratab ##
####################################
oradb1:/u01/app/oracle/product/8.1.7:Y
oradb2:/u01/app/oracle/product/8.1.7:Y
oradb3:/u01/app/oracle/product/8.1.7:N
oradb4:/u01/app/oracle/product/8.1.7:Y
以下的脚本检查 oratab 文件中列出的所有数据库,并且找出该数据库的状态(启动还是关闭)
###########################################
## ckinstance.ksh ## ##########################################
ORATAB=/var/opt/oracle/oratab
echo `date`
echo Oracle Database(s) Status `hostname` :/n

db=`egrep -i :Y|:N $ORATAB | cut -d : -f1 | grep -v /# | grep -v /* `
pslist= `ps -ef | grep pmon`
for i in $db ; do
echo $pslist | grep ora_pmon_$i /dev/null 2 $1
if (($?)); then
echo Oracle Instance – $i: Down
else
echo Oracle Instance – $i: Up
fi
done
使用以下的命令来确认该脚本是可以执行的:
$ chmod 744 ckinstance.ksh
$ ls -l ckinstance.ksh
-rwxr–r– 1 oracle dba 657 Mar 5 22:59 ckinstance.ksh*
以下是实例可用性的报表:
$ ckinstance.ksh
Mon Mar 4 10:44:12 PST 2002
Oracle Database(s) Status for DBHOST server:
Oracle Instance – oradb1: Up
Oracle Instance – oradb2: Up
Oracle Instance – oradb3: Down
Oracle Instance – oradb4: Up
检查 Oracle 监听器的可用性
以下有一个类似的脚本检查 Oracle 监听器。如果监听器停了,该脚本将会重新启动监听器:

#########################################
## cklsnr.sh ##
#########################################
#!/bin/ksh
DBALIST= primary.dba@company.com,another.dba@company.com export DBALIST
cd /var/opt/oracle
rm -f lsnr.exist
ps -ef | grep mylsnr | grep -v grep lsnr.exist
if [-s lsnr.exist]
then
echo
else
echo Alert | mailx -s Listener mylsnr on `hostname` is down $DBALIST
TNS_ADMIN=/var/opt/oracle; export TNS_ADMIN
ORACLE_SID=db1; export ORACLE_SID
ORAENV_ASK=NO; export ORAENV_ASK
PATH=$PATH:/bin:/usr/local/bin; export PATH
. oraenv
LD_LIBRARY_PATH=${ORACLE_HOME}/lib;export LD_LIBRARY_PATH
lsnrctl start mylsnr
fi
检查 Alert 日志(ORA-XXXXX)
每个脚本所使用的一些环境变量可以放到一个 profile 中:

############################################
## oracle.profile ##
##########################################
EDITOR=vi;export EDITOR ORACLE_BASE=/u01/app/oracle; export
ORACLE_BASE ORACLE_HOME=$ORACLE_BASE/product/8.1.7; export
ORACLE_HOME LD_LIBRARY_PATH=$ORACLE_HOME/lib; export
LD_LIBRARY_PATH TNS_ADMIN=/var/opt/oracle;export
TNS_ADMIN NLS_LANG=american; export
NLS_LANG NLS_DATE_FORMAT= Mon DD YYYY HH24:MI:SS export
NLS_DATE_FORMAT ORATAB=/var/opt/oracle/oratab;export
ORATAB PATH=$PATH:$ORACLE_HOME:$ORACLE_HOME/bin:/usr/ccs/bin:/bin:/usr

/bin:/usr/sbin:/
sbin:/usr/openwin/bin:/opt/bin:.; export
PATH DBALIST= primary.dba@company.com,another.dba@company.com export
DBALIST

以下的脚本首先调用 oracle.profile 来设置全部的环境变量。如果发现任何的 Oracle 错误,该脚本还会给 DBA 发送一个警告的 email。

########################################
## ckalertlog.sh ##
########################################
#!/bin/ksh
.. /etc/oracle.profile
for SID in `cat $ORACLE_HOME/sidlist`
do
cd $ORACLE_BASE/admin/$SID/bdump
if [-f alert_${SID}.log ]
then
mv alert_${SID}.log alert_work.log
touch alert_${SID}.log
cat alert_work.log alert_${SID}.hist
grep ORA- alert_work.log alert.err
fi
if [`cat alert.err|wc -l` -gt 0]
then
mailx -s ${SID} ORACLE ALERT ERRORS $DBALIST alert.err
fi
rm -f alert.err
rm -f alert_work.log
done

清除旧的归档文件
以下的脚本将会在 log 文件达到 90% 容量的时候清空旧的归档文件:

$ df -k | grep arch
Filesystem kbytes used avail capacity Mounted on
/dev/vx/dsk/proddg/archive 71123968 30210248 40594232 43% /u08/archive

#############################################
## clean_arch.ksh ##
#################################################
#!/bin/ksh
df -k | grep arch dfk.result
archive_filesystem=`awk -F {print $6} dfk.result`
archive_capacity=`awk -F {print $5} dfk.result`

if [[$archive_capacity 90%]]
then
echo Filesystem ${archive_filesystem} is ${archive_capacity} filled
# try one of the following option depend on your need
find $archive_filesystem -type f -mtime +2 -exec rm -r {} /;
tar
rman
fi

分析表和索引(以得到更好的性能)
以下我将展示如果传送参数到一个脚本中:

##############################################
## analyze_table.sh ##
###############################################
#!/bin/ksh
# input parameter: 1: password # 2: SID
if (($# 1)) then echo Please enter oracle user password as the first parameter ! exit 0
fi
if (($# 2)) then echo Please enter instance name as the second parameter! exit 0
fi

要传入参数以执行该脚本,输入:
$ analyze_table.sh manager oradb1
脚本的第一部分产生了一个 analyze.sql 文件,里面包含了分析表用的语句。脚本的第二部分分析全部的表:

################################################
## analyze_table.sh ##
###############################################
sqlplus -s oracle/$1@$2
set heading off
set feed off
set pagesize 200
set linesize 100
spool analyze_table.sql
select ANALYZE TABLE || owner || . || segment_name ||
ESTIMATE STATISTICS SAMPLE 10 PERCENT;
from dba_segments
where segment_type = TABLE
and owner not in (SYS , SYSTEM
spool off
exit
!
sqlplus -s oracle/$1@$2
@./analyze_table.sql
exit
!
以下是 analyze.sql 的一个例子:

$ cat analyze.sql
ANALYZE TABLE HIRWIN.JANUSAGE_SUMMARY ESTIMATE STATISTICS SAMPLE 10 PERCENT;
ANALYZE TABLE HIRWIN.JANUSER_PROFILE ESTIMATE STATISTICS SAMPLE 10 PERCENT;
ANALYZE TABLE APPSSYS.HIST_SYSTEM_ACTIVITY ESTIMATE STATISTICS SAMPLE 10 PERCENT;
ANALYZE TABLE HTOMEH.QUEST_IM_VERSION ESTIMATE STATISTICS SAMPLE 10 PERCENT;
ANALYZE TABLE JSTENZEL.HIST_SYS_ACT_0615 ESTIMATE STATISTICS SAMPLE 10 PERCENT;
ANALYZE TABLE JSTENZEL.HISTORY_SYSTEM_0614 ESTIMATE STATISTICS SAMPLE 10 PERCENT;
ANALYZE TABLE JSTENZEL.CALC_SUMMARY3 ESTIMATE STATISTICS SAMPLE 10 PERCENT;
ANALYZE TABLE IMON.QUEST_IM_LOCK_TREE ESTIMATE STATISTICS SAMPLE 10 PERCENT;
ANALYZE TABLE APPSSYS.HIST_USAGE_SUMMARY ESTIMATE STATISTICS SAMPLE 10 PERCENT;
ANALYZE TABLE PATROL.P$LOCKCONFLICTTX ESTIMATE STATISTICS SAMPLE 10 PERCENT;

检查表空间的使用
以下的脚本检测表空间的使用。如果表空间只剩下 10%,它将会发送一个警告 email。

####################################################
## ck_tbsp.sh ##
####################################################
#!/bin/ksh
sqlplus -s oracle/$1@$2
set feed off
set linesize 100
set pagesize 200
spool tablespace.alert
SELECT F.TABLESPACE_NAME,
TO_CHAR ((T.TOTAL_SPACE – F.FREE_SPACE), 999,999 ) USED (MB) ,
TO_CHAR (F.FREE_SPACE, 999,999) FREE (MB) ,
TO_CHAR (T.TOTAL_SPACE, 999,999) TOTAL (MB) ,
TO_CHAR ((ROUND ((F.FREE_SPACE/T.TOTAL_SPACE)*100)), 999 )|| % PER_FREE
FROM (
SELECT TABLESPACE_NAME,
ROUND (SUM (BLOCKS*(SELECT VALUE/1024
FROM V/$PARAMETER
WHERE NAME = db_block_size )/1024)
) FREE_SPACE
FROM DBA_FREE_SPACE
GROUP BY TABLESPACE_NAME
) F,
(
SELECT TABLESPACE_NAME,
ROUND (SUM (BYTES/1048576)) TOTAL_SPACE
FROM DBA_DATA_FILES
GROUP BY TABLESPACE_NAME
) T
WHERE F.TABLESPACE_NAME = T.TABLESPACE_NAME
AND (ROUND ((F.FREE_SPACE/T.TOTAL_SPACE)*100))
spool off
exit
!
if [`cat tablespace.alert|wc -l` -gt 0]
then
cat tablespace.alert -l tablespace.alert tablespace.tmp
mailx -s TABLESPACE ALERT for ${2} $DBALIST tablespace.tmp
fi

警告 email 输出的例子如下:

TABLESPACE_NAME USED (MB) FREE (MB) TOTAL (MB) PER_FREE
——————- ——— ———– ——————- ——————
SYSTEM 2,047 203 2,250 9 %
STBS01 302 25 327 8 %
STBS02 241 11 252 4 %
STBS03 233 19 252 8 %

查找出无效的数据库对象
以下查找出无效的数据库对象:

###################################### ## invalid_object_alert.sh ## ###################################### #!/bin/ksh . /etc/oracle.profile
sqlplus -s oracle/$1@$2
set feed off
set heading off column object_name format a30
spool invalid_object.alert
SELECT OWNER, OBJECT_NAME, OBJECT_TYPE, STATUS FROM DBA_OBJECTS WHERE STATUS = INVALID ORDER BY OWNER, OBJECT_TYPE, OBJECT_NAME;
spool off
exit ! if [`cat invalid_object.alert|wc -l` -gt 0] then
mailx -s INVALID OBJECTS for ${2} $DBALIST invalid_object.alert
fi$ cat invalid_object.alert
OWNER OBJECT_NAME OBJECT_TYPE STATUS
———————————————————————-
HTOMEH DBMS_SHARED_POOL PACKAGE BODY INVALID
HTOMEH X_$KCBFWAIT VIEW INVALID
IMON IW_MON PACKAGE INVALID
IMON IW_MON PACKAGE BODY INVALID
IMON IW_ARCHIVED_LOG VIEW INVALID
IMON IW_FILESTAT VIEW INVALID
IMON IW_SQL_FULL_TEXT VIEW INVALID
IMON IW_SYSTEM_EVENT1 VIEW INVALID
IMON IW_SYSTEM_EVENT_CAT VIEW INVALIDLBAILEY CHECK_TABLESPACE_USAGE PROCEDURE INVALID
PATROL P$AUTO_EXTEND_TBSP VIEW INVALID
SYS DBMS_CRYPTO_TOOLKIT PACKAGE INVALID
SYS DBMS_CRYPTO_TOOLKIT PACKAGE BODY INVALID
SYS UPGRADE_SYSTEM_TYPES_TO_816 PROCEDURE INVALID
SYS AQ$_DEQUEUE_HISTORY_T TYPE INVALID
SYS HS_CLASS_CAPS VIEW INVALID SYS HS_CLASS_DD VIEW INVALID

监视用户和事务(死锁等)
以下的脚本在死锁发生的时候发送一个警告 e -mail:

#######################################
## deadlock_alert.sh ##
##########################################
#!/bin/ksh
.. /etc/oracle.profile
sqlplus -s oracle/$1@$2
set feed off
set heading off
spool deadlock.alert
SELECT SID, DECODE(BLOCK, 0, NO , YES) BLOCKER,
DECODE(REQUEST, 0, NO , YES) WAITER
FROM V$LOCK
WHERE REQUEST 0 OR BLOCK 0
ORDER BY block DESC;
spool off
exit
!
if [`cat deadlock.alert|wc -l` -gt 0]
then
mailx -s DEADLOCK ALERT for ${2} $DBALIST deadlock.alert
fi
结论

0,20,40 7-17 * * 1-5 /dba/scripts/ckinstance.sh /dev/null 2 1
0,20,40 7-17 * * 1-5 /dba/scripts/cklsnr.sh /dev/null 2 1
0,20,40 7-17 * * 1-5 /dba/scripts/ckalertlog.sh /dev/null 2 1
30 * * * 0-6 /dba/scripts/clean_arch.sh /dev/null 2 1
* 5 * * 1,3 /dba/scripts/analyze_table.sh /dev/null 2 1
* 5 * * 0-6 /dba/scripts/ck_tbsp.sh /dev/null 2 1
* 5 * * 0-6 /dba/scripts/invalid_object_alert.sh /dev/null 2 1
0,20,40 7-17 * * 1-5 /dba/scripts/deadlock_alert.sh /dev/null 2 1
通过以上的脚本,可大大减轻你的工作。你可以使用这些是来做更重要的工作,例如性能调整。

以上就是监控 Oracle 数据库的常用 shell 脚本怎么写,丸趣 TV 小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注丸趣 TV 行业资讯频道。

正文完
 
丸趣
版权声明:本站原创文章,由 丸趣 2023-07-18发表,共计10132字。
转载说明:除特殊说明外本站除技术相关以外文章皆由网络搜集发布,转载请注明出处。
评论(没有评论)