作者 | JiekeXu
来源 | JiekeXu之路(ID: JiekeXu_IT)
转载请联系授权 | (微信ID:xxq1426321293)
大家好,我是 JiekeXu,很高兴又和大家见面了,今天分享上个月处理的案例:11g RAC 在线存储迁移实现 OCR 磁盘组完美替换。本文首发于微信公众号【JiekeXu之路】,欢迎点击上方蓝字关注我吧!
说明:需要将 Oracle 数据库 OCR DATA ARCH 等所有老存储磁盘替换为新存储磁盘,
华为存储 替换为 SVC 存储 进行存储迁移。数据库新磁盘如下:
rhdisk100-——rhdisk123 共 24 块盘,
rhdisk100、rhdisk101、rhdisk102 这三块准备为 1g OCR 盘,
rhdisk103 是 100g 的 ARCH 归档盘 rhdisk104-106 是 500G 的 ARCH 归档盘;
rhdisk106-——rhdisk123 是 500G 的数据盘 DATA。
操作系统 64 bit AIX 6.1,11204 RAC 环境,存储已划分好新盘,操作系统也已经完成扫盘,
剩下的步骤就是将磁盘添加进数据库然后通过 ASM 的 REBALANCE 功能将其旧盘踢出数据库,进一步踢出操作系统回收存储,即可实现迁移。
一、磁盘检查
--查看磁盘大小(单位M)
--检查磁盘属性
--- 检查权限,660 属组 grid:asmadmin
--- 检查PVID
--- 检查保留策略
--- 查看磁盘是否为共享磁盘
--- 查看磁盘是否可用
二、数据库检查
---查看 ASM 磁盘使用情况
三、正式添加磁盘
这里有两点要说明的,首先添加的磁盘总量需要比原来的大一些或者一样大,不能偏小,不然在操作时会报错 ORA-15032、ORA-15250,还有每个磁盘可以比原来的大,即实现小盘换大盘;其次,删除磁盘时使用的是 ARCH_0000 等这样的磁盘名,并不是磁盘路径;最后,在添加磁盘的同时进行删除操作,平衡时间会缩短很多,当遇到数据量几十 T 时均衡时间大概要好几天的时间,很是痛苦。
四、生产环境操作示例
白天早上查看后台日志中有从磁盘组 DATA 中删除的记录,上面夜间日志中有添加成功的记录,验证了前面说的同事添加删除的命令并不是同时完成的结果。
五、操作系统踢盘问题
当 AIX 岗系统管理人员踢盘时发现有如下两块盘占用,无法删除,报错0514-062 divice is busy.
查看发现 rhdisk2 和 rhdisk2 对应 DATA_0011 和 DATA_0017,对应的连接进程为数据库本地连接 LOCAL=YES 进程,此进程非数据库核心进程可通过操作系统命令 kill -9 杀掉,然后即可踢出磁盘,实现存储迁移,即 RAC ASM 磁盘组在线迁移。
该问题处理完后,即实现了 ASM 存储在线迁移,不需要单独进行 OCR 磁盘的替换,只需操作系统能够扫到盘,能够正常添加到 ASM 即可,和平时添加 ASM 磁盘组几乎没有任何区别。加油,让我们一起努力做更好的自己,今天就到这里了,祝小伙伴们新的一天愉快,愿天下所有教师节日快乐,身体健康,工作顺利!
Oracle 11.2.0.4 RAC 最新补丁下载(11.2.0.4.200714)