oracleasm 遇险记-凯发app官方网站

凯发app官方网站-凯发k8官网下载客户端中心 | | 凯发app官方网站-凯发k8官网下载客户端中心
  • 博客访问: 3502863
  • 博文数量: 718
  • 博客积分: 1860
  • 博客等级: 上尉
  • 技术积分: 7790
  • 用 户 组: 普通用户
  • 注册时间: 2008-04-07 08:51
个人简介

偶尔有空上来看看

文章分类

全部博文(718)

文章存档

2024年(4)

2023年(74)

2022年(134)

2021年(238)

2020年(115)

2019年(11)

2018年(9)

2017年(9)

2016年(17)

2015年(7)

2014年(4)

2013年(1)

2012年(11)

2011年(27)

2010年(35)

2009年(11)

2008年(11)

最近访客
相关博文
  • ·
  • ·
  • ·
  • ·
  • ·
  • ·
  • ·
  • ·
  • ·
  • ·

分类: oracle

2022-03-10 23:42:14

管理不到位,坑会有很多

归档空间满了,哦?这我熟
看看是否有dg
sho parameter log
没有的话就清理
delete noprompt archivelog until time 'sysdate-3';

但是客户要求不能清理(难道有ogg?)

当然先确认一下
查告警日志的确有归档失败异常

那就看一下归档设置
archive log list;
一看是 data ,就知道管理不到位了,通常应该是 archdg

清理
不让清理就拷贝后删除
将部分归档日志先拷贝出来,释放一部分空间,解决燃眉之急(后面还有好几个燃眉的地方)
用grid执行asmcmd
asmcmd里的 cp 命令可以直接将磁盘组上的归档文件复制到磁盘上
复制了十几个比较早的,但是这些归档文件大小较小,基本都是30多m

不对劲
检查归档历史

  1. set pages 100
  2. break on report
  3. compute sum label 'total' avg label 'avg' max label 'max' min label 'min' of g on report
  4. select * from (select to_char(completion_time,'yyyy-mm-dd ') dt,round(sum(blocks *block_size)/1024/1024/1024) g,count(0) cnt from
  5. v$archived_log where dest_id=1 group by to_char(completion_time,'yyyy-mm-dd ')) order by 1;
比较规律,不是常见的突增大量归档

再检查asm磁盘组使用率

  1. col name for a15
  2. select name,trunc((total_mb-free_mb)/1024) used_g,trunc(total_mb/1024) total_g, trunc(free_mb/1024) free_g,round(1-free_mb/total_mb,2) used_percent from v$asm_diskgroup order by used_percent desc ;
发现 data磁盘组剩余182g,怎么会不够?


再看每个磁盘free_mb ,有几个128g的,然后有个500g的组成了 data

  1. set lin 200
  2. col path for a30
  3. col name for a20
  4. select group_number,disk_number, mode_status,header_status, mode_status,state,total_mb,free_mb,name,path from v$asm_disk;
data_0002 剩余空间为0了,应该是冗余度保护策略导致不允许插入新数据。

改造
存储划分一个新的500g磁盘,添加到 data,然后将4个128g的创建为 arch

  1. 确认采用oracleasm管理的磁盘
  2. oracleasm status

  3. cd /dev/oracleasm/disks/
  4. ls -l

  5. col name for a15
  6. col library for a30
  7. col path for a34
  8. set lin 120 pages 100
  9. select name, library, path from v$asm_disk;
  10. --library 应该是 asm library generic linux

  11. /etc/init.d/oracleasm listdisks
  12. /etc/init.d/oracleasm scandisks

  13. /etc/init.d/oracleasm querydisk /dev/sdg1
  14. /etc/init.d/oracleasm querydisk vol1

  15. /etc/init.d/oracleasm createdisk vol2 /dev/sdb2
  16. /etc/init.d/oracleasm deletedisk vol1

  17. fdisk /dev/sddlmaf
    lsblk
    oracleasm createdisk asm_data6 /dev/sddlmaf1


添加删除磁盘,炫技一下

  1. --添加同时删除
  2. alter diskgroup data add disk '/dev/oracleasm/disks/asm_data6' drop disk 'data_0000','data_0001','data_0002','data_0003' rebalance power 11;
等了40分钟,有3个128g的始终无法删除 v$asm_operation也空了,为啥?

排查
asm的告警日志有些古怪
ocrcheck
crsctl query css votedisk
这些文件居然放到了 data里!
所以不让删除

由于data_0000、data_0001、data_0002一直处于dropping状态,先撤回删除操作
alter diskgroup data undrop disks ;
等了20分钟

考虑到风险较大,全备数据库
又等了20分钟

搬家
将ocr vote文件,从 data移动到 ocr_vote里

  1. 手工备份ocr
  2. ocrconfig -manualbackup

  3. 先添加一个新磁盘组(本来该在的地方)
  4. ocrconfig -add ocr_vote

  5. 确认无误
  6. ocrcheck

  7. 再删除旧的(从data里删掉)
  8. ocrconfig -delete data

  9. 移动vote
  10. crsctl query css votedisk

  11. 确认vote在哪个磁盘上
  12. select disk_number,redundancy,name,failgroup,voting_file from v$asm_disk;

  13. crsctl replace votedisk ocr_vote

  14. 移动asm的spfile (实际为执行,应该是停掉asm实例再执行,考虑到影响不大,就未调整)
  15. create pfile='/tmp/asmpfile.ora' from spfile;
  16. create spfile=' ocr_vote' from pfile='/tmp/asmpfile.ora';

  17. asmcmd spget
  18. asmcmd spmove ' data/tzdb-cluster/asmparameterfile/registry.253.976405429' ' ocr_vote/tzdb-cluster/spfileasm.ora'
再执行删除
alter diskgroup data  drop disk 'data_0000','data_0001','data_0002'  rebalance power 11;
又等了20分钟

创建arch磁盘组
create diskgroup arch external redundancy disk '/dev/oracleasm/disks/asm_data1','/dev/oracleasm/disks/asm_data2','/dev/oracleasm/disks/asm_data3','/dev/oracleasm/disks/asm_data4';

在节点2 mount 磁盘组arch
alter diskgroup arch mount;

修改归档位置
create pfile='/tmp/a.ora' from spfile;
sho parameter reco
alter system set log_archive_dest_1='location= arch' sid='*';

滚动重启crs,正常!



一个归档满,牵扯出这么多问题:
归档文件不应该与数据存放在一个磁盘组
磁盘组内的磁盘大小应该一致
ocr、vote应该存放在专用的磁盘组中

自己的收获:
oracleasm绑定磁盘有些生疏
删除磁盘之前最好看看内容、状态
熟悉了移动ocr vote步骤
undrop disks回滚时间不短呀

提醒注意:
创建新asm磁盘组,其他节点需要mount一下
删除归档后顺手 crosscheck
后期清理这些临时备份、移出来的归档、 data里的旧归档



参考:

  1. select group_number,disk_number, mode_status,header_status, 
  2.  mode_status,state,total_mb,free_mb,name,path from v$asm_disk;

  3.  select name,compatibility,database_compatibility,state,type from v$asm_diskgroup;
  4.  --alter diskgroup ocr_vote set attribute 'compatible.asm'='11.2';
  5.  

    select disk_number,redundancy,name,failgroup,voting_file from v$asm_disk;

  6. https://blog.csdn.net/u010692693/article/details/49617153
  7. https://www.cnblogs.com/wenxiao1-2-3-4/p/15732052.html
  8. ora-15250 : asm disk in dropping state with same command doing add and drop (doc id 1918438.1)

阅读(465) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~
")); function link(t){ var href= $(t).attr('href'); href ="?url=" encodeuricomponent(location.href); $(t).attr('href',href); //setcookie("returnouturl", location.href, 60, "/"); }
网站地图