DBAmon 监视ORACLE内容
发布时间:2023-02-18 09:16:04 所属栏目:Oracle 来源:互联网
导读:类别 事件 DBAmon 监视 什么 行动 采取 可用性 1. Oracle实例运行 (自动修复) 数据库打开 背景过程:运行pmon,smon,lgwr,dbw * 能够通过svrmgrl / sqlplus运行sql (自动修复:Oracle Crash) 如果满足以下所有条件,则DBAmon发现pmon任务已死时,它将
类别 事件 DBAmon 监视 什么 行动 采取 可用性 1. Oracle实例运行 (自动修复) 数据库打开 背景过程:运行pmon,smon,lgwr,dbw * 能够通过svrmgrl / sqlplus运行sql (自动修复:Oracle Crash) 如果满足以下所有条件,则DBAmon发现pmon任务已死时,它将尝试启动Oracle: DBC Must_Be_Up:参数未设置为N Oracle Alert Log的最后两行是以下格式: PMON:由于错误474而终止实例 实例被PMON终止,pid = 7485 上述错误的oerr输出(在这种情况下为474)包含字符串 Warm start instance。 00474,00000,“ SMON进程因错误终止” // *原因:系统清理过程终止 // *动作:热启动实例 如果所有这些条件都成立,则DBAmon将尝试使用svrmgrl / sqlplus启动实例。请注意,即使DBAmon成功重启了Oracle,也会发生严重事件。其背后的原因是,即使您不必自己重新启动Oracle,您也总是想知道您是否正在发生Oracle崩溃。然后,您将知道要诊断问题以防止再次发生。 可用性 2.侦听器正在运行 (自动修复) 侦听器正在运行吗 成功的“状态”命令 ( 自动修复:侦听器关闭)侦听器自动启动(lsnrctl启动)。 可用性 3.表空间已满 (自动修复) 根据DBC指定的T_TS *阈值监视表空间 使用v $ sort_usage监视TEMP(临时文件)表空间 (自动修复:表空间已满或几乎已满) 表空间达到警告严重性阈值时,将调用DBC T_TS_Command:命令。这将导致将空间添加到该表空间。 可用性 4.对象范围 (自动修复) 根据DBC指定的T_Extents:阈值,监视对象(表和索引)范围计数与MAXEXTENTS的关系 (自动修复:对象在最大范围内或附近) 受影响的对象已更改: ALTER {OBJECT}存储(maxextents不限); 可用性 5. Archivelog文件系统已满 (自动修复) 检查每个存档日志目标的UX文件系统。如果发现至少有 DBC指定的T_Arclog: 已满百分比,则会发生事件。 自上次成功执行存档日志备份以来的小时数(可选)。如果 超过了 DBC指定的Backup_Age:小时数,则会发生“备份期限事件”。 记录每个备份(ARC,ARCFSCHECK,ARCKEEPn,ARCEMERGENCY)的时间戳的逻辑已合并到备份工具中。 (自动修复:存档日志文件系统已满,或自上次成功存档日志备份以来已耗费太多时间) 如果指定,则 (在后台)调用DBC指定的Backup_Command:来运行正确类型的备份。 可用性 6.侦听器日志 (自动修复) 在$ ORACLE_HOME /网络/日志/ LISTENER.LOG会变得非常大,甚至造成$ ORACLE_HOME文件系统来填充。如果大小超过50M,则会发生事件。 (自动修复:数据库侦听器日志> 50M) 在$ ORACLE_HOME /网络/日志/ LISTENER.LOG自动gzip压缩。 后备 7.数据库备份 期限(自动修复) 测量自上次成功备份以来的小时数。如果 超过了 DBC指定的Backup_Age:小时数,则会发生“备份期限事件”。 记录每个备份(RMAN,完整,导出,TBS,BCV)时间戳的逻辑已集成到我们的每个备份工具中。 (自动修复:自从上一次成功的数据库备份以来已耗费太多时间) 如果指定,则 (在后台)调用DBC指定的Backup_Command:来运行正确类型的备份。 后备 8.挂起RMAN OS处理消耗cpu (AutoFix) 如果有任何rman OS进程: 父PID为1 消耗> 1个cpu的75% 已经运行了至少5分钟 是孤立的过程。具有这些属性的RMAN进程始终是孤立的进程,它们永远不会独立死亡。 (自动修复:挂起的孤立的RMAN进程) 这些进程将自动终止。 安全 9.具有明显密码的数据库“系统”用户 (自动修复) 如果找到具有默认密码的“系统”用户(SYS,SYstem,OUTLN等),则会发生事件。 (自动修复:发现数据库系统用户使用不安全的密码) (仅适用于HP-UX)此用户的密码已更改为您选择的密码之一。 安全 10.听众密码 (自动修复) 需要为侦听器(/etc/listener.ora)设置密码。 (自动修复:未设置侦听器密码) (仅HP-UX)自动设置侦听器文件中的密码。 可用性 11.警报日志 检查警报日志中是否存在某些字符串(可由用户配置)。如果找到这些字符串中的任何一个(排除字符串未排除),则将发生严重事件。实例特定的EXCLUDE字符串可以在文件/home/oracle/.dbamon_ORACLESID_alert_exclude.txt中指定 。 可用性 12.对象下一个范围大小 如果对象的下一个范围不适合其表空间,则会发生事件。(如果为实例启用了“范围检查”,则此功能可用)。 可用性 13. SGA已满 如果SGA已满100%,则将发生严重事件。 如果SGA已满== 99%,将发生警告事件。 可用性 14. ORACLE_HOME文件系统已满 如果发生这种情况,Oracle可能会挂起。如果该文件系统> = 99%已满,将发生一个事件。 可用性 15.已启用受限会话 如果Oracle在RESTRICTED SESSION中,则将发生一个事件。 可用性 16.脱机数据文件 如果任何数据文件都不在线(来自v $ datafile),则会发生事件。 可用性 17.存档目标状态 如果任何存档日志目标(v $ archive_dest)处于错误状态,则将发生事件。 可用性 18.重做日志成员状态 如果任何重做日志成员具有非空(v $ logfile)状态,则将发生事件。 可用性 19.工艺表 如果当前的数据库进程数接近INIT.ORA 进程参数值,则将发生事件。 可用性 20. I / O从站计数 I / O从站(dbwr或磁带)的最大数量为40。如果接近这个数目,则会发生事件。 可用性 21. UX文件描述符 如果当前UX文件描述符的数量接近内核配置的值,则将发生此事件。 可用性 22.孤儿数据文件 如果在应放置数据库数据文件的位置中找到任何未使用的数据文件(不在v $ datafile中),并且这些文件与活动数据文件的命名约定相同,则将发生此事件。如果删除了表空间并且未手动删除数据文件(9i之前的版本),则可能会发生这种情况。 可用性 23.非双工控制文件 如果只有一个控制文件,则将发生一个事件。这很危险。 可用性 24.没有数据文件的表空间 如果找到没有数据文件的表空间,则会发生事件。即使在使用TEMP表空间作为备用数据库的情况下,也要创建至少1个tempfile是一个好习惯。 可用性 25. UX“ maxuprc”进程限制 如果运行数据库的UX用户ID的当前OS进程计数接近maxuprc HP-UX内核值,则将发生事件。 后备 26.挂起RMAN OS进程 如果有任何rman OS进程已运行至少24小时,则将发生一个事件。 后备 27.备份-不可恢复的更改 如果自从最近的RMAN LVL0备份以来没有任何不可恢复的更改,则将发生一个事件。 DRP 28.备用数据库-主增量 测量此备用数据库与其主数据库之间的更新增量(以分钟为单位)。在 DBC指定INSYNC *参数 指定的阈值。 DRP 29.备用数据库-NOLOGGING对象 如果主数据库上有任何NOLOGGING对象,则将发生一个事件。可以使用DBC指定的InSync *参数来指定这些事件的严重性 。 DRP 30.配置保存 要在服务器崩溃(或???)后重建实例,拥有INIT.ORA,数据文件映射和表空间映射的副本将很有用。 对于每个实例,此信息的副本将自动保存在 / opt / dbamon / dat / config_save /中。 DRP 31.备用数据库-不可恢复的更改 如果自从主数据库以来发生了任何不可恢复的更改,那么将发生最后一个备用数据库重建事件。可以使用DBC指定的InSync *参数来指定这些事件的严重性 。将在DBAMON.STANDBY_REBUILD表和最近不可恢复的更改的日期之间进行比较。成功重建备用数据库后,备用数据库重建工具会自动在DBAMON.STANDBY_REBUILD中插入一行。 DRP 32.强制记录 在9i +中,可以在数据库级别设置“强制日志记录”。这消除了备用和备份不可恢复更改的问题。如果强制日志记录为OFF,则将发生此事件。 性能 33. OTRACE是否打开? Oracle OTRACE可能会导致性能问题。如果存在 $ ORACLE_HOME / otrace / admin * .dat 文件,则甚至会发生这种情况。 性能 34. sql_TRACE是否打开? 实例范围的Oracle sql_TRACE可能会导致性能问题。如果sql_TRACE init.ora参数打开,则将发生此事件。 性能 35.回滚段获取:等待比率 如果回滚段等待的比率> 1%,则可能需要更多的回滚段。请注意,在9i + SMU中,这是自动管理的,因此可能不会发生此事件。 性能 36.具有默认表空间SYstem的用户 将非SYstem对象存储在SYstem表空间中可能导致性能问题。如果找到具有默认表空间SYstem的任何用户,则会发生事件。 性能 37.具有SYstem临时表空间的用户 将非SYstem对象存储在SYstem表空间中可能导致性能问题。如果找到任何具有SYstem临时表空间的用户,则将发生事件。 (编辑:甘南站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |