ORACLE数据库一次意外宕机的分析处理实记(ora-1578)
一个安静的下午,测试环境中一台装有ORACLE数据库的AIX小机因意外断电而导致其上的oracle数据库宕机了。由于是测试环境,安排了一个工程师过去解决了,具体是这
一个安静的下午,测试环境中一台装有ORACLE数据库的AIX小机因意外断电而导致其上的oracle数据库宕机了。由于是测试环境,安排了一个工程师过去解决了,具体是这样解决的:首先重启了小机服务器,启动完后,发现oracle所在的/app目录没有mount上。然后通过smitty fs修复了一下,mount上了app,再接着启动oracle就起来了。
事后搜集了system.txt 系统日志(通过errpt -a获得)和alert_soa.log以及oracle的跟踪日志trc,分析trc日志看到如下:
/app/oracle/product/10.2.0/admin/soa/bdump/soa_mmon_307366.trc
Oracle Database 10g Enterprise Edition Release 10.2.0.4.0 - 64bit Production
With the Partitioning, OLAP, Data Mining and Real Application Testing options
ORACLE_HOME = /app/oracle/product/10.2.0
System name:AIX
Node name:data2
Release:3
Version:5
Machine:00CE993C4C00
Instance name: soa
Redo thread mounted by this instance: 1
Oracle process number: 11
Unix process pid: 307366, image: oracle@data2 (MMON)
*** 2013-03-01 14:06:10.308
*** SERVICE NAME:(SYS$BACKGROUND) 2013-03-01 14:06:10.212
*** SESSION ID:(161.1) 2013-03-01 14:06:10.212
Hex dump of (file 3, block 49259)
Dump of memory from 0x07000000C5934000 to 0x07000000C5936000
7000000C5934000 06A20000 00C0C06B 0178F614 00000104 [.......k.x......]
7000000C5934010 45A30000 010A0025 0000224D 0178F614 [E......%.."M.x..]
7000000C5934020 00000000 1F023200 00C0C069 00010003 [......2....i....]
又观察另两个文件,发现有较多ORA-1578报错和DISK OPERATION ERROR。
分析:一般在进行CLUSTER双机切换、意外断电或其它情况下,有时会发生某个共享盘MOUNT不上的情况,需要使用FSCK对共享盘进行修复,然后再MOUNT.当修复完成后,顺利的话数据库可以直接起来,否则在数据库启动过程中就会报出"数据块损坏,无法启动数据库"的现象。此时,我们可以根据不同的数据块损坏类型,检测并修复错误并确定解决问题的方案。
一、数据块损坏产生原因:
1. 硬件问题(磁盘控制器问题或磁盘本身故障问题)
2. 物理级的数据块损坏(通常由前一原因造成)
3、逻辑的数据块损坏
二、坏块的原理分析:
Oracle的数据块有固定的格式和结构,分三层: Cache layer、Transaction layer和Data layer.
对数据块进行读写操作时,做一致性检查:
–Block type
–DBA
–Scn
–Header and tail
发现不一致,标记为坏块。坏块有两种: 物理坏块和逻辑坏块。坏块产生的影响:数据字典表、回滚段表、临时段和用户数据表和索引。
三、确定故障原因与对应的解决办法:
1、查看alert.log文件中,还有无其它ORA-的错误,美国空间,如果报错指向不同磁盘的文件,则是磁盘控制器的问题,查看V$DATAFILE,看有哪些文件位于该控制器下,需要查找磁盘控制器(一般控制器有两个A控和B控)是否正常。
2、 如果报错指向相同磁盘的不同文件,则是磁盘的问题,需要查看磁盘有无报警,LVM有无报错等。
3、 如果指向相同磁盘的同一个文件,则可以执行以下语句查找文件名:
SELECT SEGMENT_NAME,SEGMENT_TYPE FROM DBA_EXTENTS WHERE FILE_ID= AND BETWEEN BLOCK_ID AND BLOCK_ID+BLOCKS-1;
其中,文件号与块号在报错日志中可以查到,如果该查询持续指向某表或索引,则重建它们即可。
4、如果文件是SYSTEM表空间,或处于NOARCHIVELOG模式,在数据库还在运行状态时,EXP导出全部数据,重建库,再IMP灌入新库即可。
5、如果数据库处于ARCHIVELOG模式,可以使用DBV校验坏块,然后通过RMAN来修复坏块,成功后启动数据库。
或者另一种方案
关闭数据库,如果不能关闭数据库,则将相应的数据文件脱机:
ALTER DATABASE DATAFILE '文件名' OFFLINE;
试着将数据文件拷贝到别的磁盘。如果拷贝失败,香港服务器租用,则文件将丢失。
然后STARTUP MOUNT;
将数据文件重命名为成功拷贝到别的磁盘的文件名
ALTER DATABASE RENAME FILE '老路径文件名' TO '新路径文件名';
ALTER DATABASE OPEN;
RECOVER DATAFILE 文件名;
ALTER DATABASE DATAFILE '文件名' ONLINE;
四、本例的解决办法
由于本案例中,数据库有备份和归档且备份可用,所以使用rman命令修复坏块
先DBV校验坏块
$show parameter db_block_size
$select BYTES/2048 from v$datafile where FILE#=3;
$dbv file=/app/oracle/product/10.2.0/oradata/soa/user01.dbf blocksize=8192
$rman target /
恢复管理器: Release 10.2.0.1.0 - Production on 星期五 3月 1 15:07:14 2013
Copyright (c) 1982, 2005, Oracle. All rights reserved.
连接到目标数据库: soa (DBID=1281151392)
RMAN> blockrecover datafile 3 block 49259;
启动 blockrecover
使用目标数据库控制文件替代恢复目录
分配的通道: ORA_DISK_1
通道 ORA_DISK_1: sid=187 devtype=DISK
通道 ORA_DISK_1: 正在恢复块
通道 ORA_DISK_1: 正在指定要从备份集恢复的块
正在恢复数据文件 049259 的块
通道 ORA_DISK_1: 正在读取备份段ORACLE\FLASH_RECOVERY_AREA\DB01\BACKUPSET
\2013_02_28\O1_MF_NNNDF_TAG201302287_3\YCS579G_.BKP
通道 ORA_DISK_1: 已从备份段 1 恢复块
通道 ORA_DISK_1: 块恢复完成, 用时: 00:00:02
正在开始介质的恢复
介质恢复完成, 用时: 00:00:05
完成 blockrecover 于 1-3-13
RMAN> exit
恢复管理器完成。
SQL> select count(*) from buffer.t;
COUNT(*)
----------
3298
坏块修复后,并不会更新v$database_block_corruption,需要下次备份的时候更新
SQL> select * from v$database_block_corruption;
FILE# BLOCK# BLOCKS CORRUPTION_CHANGE# CORRUPTIO
---------- ---------- ---------- ------------------ ---------
3 49259 1 0 CHECKSUM
$rman target /
恢复管理器: Release 10.2.0.1.0 - Production on 星期日 3月 1 16:09:43 2013
Copyright (c) 1982, 2005, Oracle. All rights reserved.
连接到目标数据库: soa (DBID=1281151392)
RMAN> backup validate datafile 3;
启动 backup
使用目标数据库控制文件替代恢复目录
分配的通道: ORA_DISK_1
通道 ORA_DISK_1: sid=132 devtype=DISK
通道 ORA_DISK_1: 启动全部数据文件备份集
通道 ORA_DISK_1: 正在指定备份集中的数据文件
通道 ORA_DISK_1: 备份集已完成, 经过时间:00:00:03
完成 backup 于 1-3-13
RMAN> exit
恢复管理器完成。
SQL> select * from v$database_block_corruption;
未选定行
注:如果数据库没有备份的话,可以考虑使用dbms_repair包来补救,但是会丢数据库。
至此数据库恢复完成,再次重启已正常。
本文出自 “滴水穿石” 博客,谢绝转载!
,香港虚拟主机
热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

全表扫描在MySQL中可能比使用索引更快,具体情况包括:1)数据量较小时;2)查询返回大量数据时;3)索引列不具备高选择性时;4)复杂查询时。通过分析查询计划、优化索引、避免过度索引和定期维护表,可以在实际应用中做出最优选择。

是的,可以在 Windows 7 上安装 MySQL,虽然微软已停止支持 Windows 7,但 MySQL 仍兼容它。不过,安装过程中需要注意以下几点:下载适用于 Windows 的 MySQL 安装程序。选择合适的 MySQL 版本(社区版或企业版)。安装过程中选择适当的安装目录和字符集。设置 root 用户密码,并妥善保管。连接数据库进行测试。注意 Windows 7 上的兼容性问题和安全性问题,建议升级到受支持的操作系统。

MySQL是一个开源的关系型数据库管理系统。1)创建数据库和表:使用CREATEDATABASE和CREATETABLE命令。2)基本操作:INSERT、UPDATE、DELETE和SELECT。3)高级操作:JOIN、子查询和事务处理。4)调试技巧:检查语法、数据类型和权限。5)优化建议:使用索引、避免SELECT*和使用事务。

MySQL 和 MariaDB 可以共存,但需要谨慎配置。关键在于为每个数据库分配不同的端口号和数据目录,并调整内存分配和缓存大小等参数。连接池、应用程序配置和版本差异也需要考虑,需要仔细测试和规划以避免陷阱。在资源有限的情况下,同时运行两个数据库可能会导致性能问题。

LaravelEloquent模型检索:轻松获取数据库数据EloquentORM提供了简洁易懂的方式来操作数据库。本文将详细介绍各种Eloquent模型检索技巧,助您高效地从数据库中获取数据。1.获取所有记录使用all()方法可以获取数据库表中的所有记录:useApp\Models\Post;$posts=Post::all();这将返回一个集合(Collection)。您可以使用foreach循环或其他集合方法访问数据:foreach($postsas$post){echo$post->

数据集成简化:AmazonRDSMySQL与Redshift的零ETL集成高效的数据集成是数据驱动型组织的核心。传统的ETL(提取、转换、加载)流程复杂且耗时,尤其是在将数据库(例如AmazonRDSMySQL)与数据仓库(例如Redshift)集成时。然而,AWS提供的零ETL集成方案彻底改变了这一现状,为从RDSMySQL到Redshift的数据迁移提供了简化、近乎实时的解决方案。本文将深入探讨RDSMySQL零ETL与Redshift集成,阐述其工作原理以及为数据工程师和开发者带来的优势。

MySQL 数据库中,用户和数据库的关系通过权限和表定义。用户拥有用户名和密码,用于访问数据库。权限通过 GRANT 命令授予,而表由 CREATE TABLE 命令创建。要建立用户和数据库之间的关系,需创建数据库、创建用户,然后授予权限。

MySQL适合初学者使用,因为它安装简单、功能强大且易于管理数据。1.安装和配置简单,适用于多种操作系统。2.支持基本操作如创建数据库和表、插入、查询、更新和删除数据。3.提供高级功能如JOIN操作和子查询。4.可以通过索引、查询优化和分表分区来提升性能。5.支持备份、恢复和安全措施,确保数据的安全和一致性。
