Lustre文件系统ost损坏,恢复操作

  1. oss1节点为例,一个oss节点挂载了两个OST

    Lustre文件系统ost损坏,恢复操作

         2 .假如ost11 损坏,已无法备份OST上的数据。

  

             Lustre文件系统ost损坏,恢复操作

1)尝试在管理节点或登录节点挂载文件系统

  Lustre文件系统ost损坏,恢复操作

2)执行lfs df -h查看下。

   Lustre文件系统ost损坏,恢复操作

此时OST0001 状态为 inactive device OST0001即为损坏的ost11ID,记录这个ID号后在管理节点上卸载文件系统,umount -l /lustrefs

 

3) mds节点上执行lctl dl查看元数据信息。

  Lustre文件系统ost损坏,恢复操作

 

  标红部分为损坏的OST

 

4)查看下OST0001的配置信息

  lctl get_param osc.testfs-OST0001-osc-MDT0000.max_create_count

   Lustre文件系统ost损坏,恢复操作

 Lustre文件系统ost损坏,恢复操作

5)把active max_create_count的值都设置为0

     Lustre文件系统ost损坏,恢复操作

    Lustre文件系统ost损坏,恢复操作

 

  此时OST0001状态由UP变为IN

  备注:active 设置为0还可以使用lctl conf_param testfs-OST0001-osc-MDT0000.active=0

  echo 0 >/proc/fs/lustre/osc/testfs-OST0001-osc-MDT0000/active

 

 

6)将ost11对应的/dev/sdc盘格式化,如果是现场环境一定要和用户确认。

   使用fdisk parted对磁盘进行格式化,fdisk 最多可分配2T的空间。

  

7) 再将磁盘格式化为lustre格式

    

 Lustre文件系统ost损坏,恢复操作

备注: --writeconf 必要参数,如果lustre版本是最新版的可以将--writeconf 替换为--replace

--index OSTID号。

 

8) 再次挂载ost

   Lustre文件系统ost损坏,恢复操作

 3. mds节点上将activemax_create_count 恢复到原来的值

  Lustre文件系统ost损坏,恢复操作

  

4. 在管理节点或登录节点上重新挂载文件系统即可。

 Lustre文件系统ost损坏,恢复操作

相关文章:

  • 2021-10-24
  • 2022-12-23
  • 2022-12-23
  • 2021-07-27
  • 2022-12-23
  • 2022-12-23
  • 2021-09-26
  • 2022-12-23
猜你喜欢
  • 2022-01-01
  • 2022-12-23
  • 2022-01-31
  • 2021-09-21
  • 2021-10-10
  • 2021-10-01
  • 2021-05-13
相关资源
相似解决方案