Questão Montando um array mdadm com discos “possivelmente desatualizados”


Eu recentemente mudei de casa e tive alguns problemas de energia depois de ligar o meu servidor de arquivos que está usando um RAID5 mdadm configurado. O sistema de arquivos que estou usando é o ext4.

Parece que em algum momento dois (de cinco) discos caíram fora da matriz quase simultaneamente após um rápido olhar com --examine. Imaginei que provavelmente não haveria gravações em nenhum dos discos para descartá-los, pois ele não é usado como ponto de montagem para os diretórios raiz ou inicial e não estava sendo usado no momento (embora possa ter sido usado montado).

Então eu percebi que era um bom momento para parar a matriz e tentar

mdadm --assemble --scan --force -v

Ele aceitará o segundo disco a ser expulso como parte da matriz, mas não aceitará o primeiro. Não parece haver nada terrivelmente errado, a não ser que a última data de sincronização está "longe demais". Para piorar, mesmo que possa iniciar o array com 4 de 5 discos, o array não parece montar corretamente.

Outra coisa que pode ser digna de nota é que os discos da matriz parecem ter mudado as letras das unidades depois que eu as inicializei novamente. Possivelmente algo está errado com o controlador SATA?

Vou colocar uma ordem para alguns discos de substituição para o conteúdo atual em todo o caso de qualquer outra coisa que eu tente arruinar as coisas ainda mais.

Felizmente eu tenho backups para a maioria dos conteúdos, mas eles são um pouco antigos e eu gostaria de evitar o uso deles, se possível.

Se não há nenhuma maneira de contornar isso, alguém tem uma sugestão para uma ferramenta de recuperação de arquivos que lidaria com esse tipo de cenário? Eu sei como isso deve ser impossível, mas não faz mal perguntar direito?


1


origem




Respostas:


(Isso provavelmente é tarde demais, mas no caso de alguém mais se deparar com isso ...)

Algo semelhante aconteceu comigo recentemente em um array RAID10. Uma unidade foi acidentalmente removida por algumas semanas (não pergunte ...). Quando eu reinseri-lo, mdadm --add e mdadm --re-add ambos falharam. eu tive que fazer mdadm --zero-superblock na unidade, então mdadm --add funcionou bem.

Se você tiver 4 de 5 discos de trabalho e estiver usando superblocos persistentes, a matriz deverá começar no modo degradado; Eu não tenho certeza exatamente o que você entende por "não parece montar corretamente". Se o desligamento foi impuro, então --force provavelmente seria necessário, o que você já está usando.

Há também um monte de informações sobre a recuperação de RAID em https://raid.wiki.kernel.org/index.php/RAID_Recovery.


3