Diseño y Desarrollo Web

Hosting web
Marketing Digital
Reparación de PC
Contacto

Servidor Proxmox no arranca tras el apagón en Porto do Son: recuperación completa sin perder una sola VM

Servidores caídos

Servidor Proxmox no arranca tras el apagón en Porto do Son: recuperación completa sin perder una sola VM

Apagón total en Porto do Son. Servidor Proxmox apagado a lo bruto. Cuando vuelve la luz… ¡sorpresa! El nodo no arranca, el GRUB se queda colgado, y las máquinas virtuales que daban vida a tu negocio están atrapadas en un limbo digital. ¿Te suena? Pues tranquilo, porque esto lo hemos solucionado decenas de veces. Y siempre, siempre lo levantamos. Aquí te explicamos cómo lo hacemos.

¿Qué suele fallar tras un corte de corriente?

  • Corrupt GRUB: el gestor de arranque se ha corrompido y ni siquiera llegas al sistema operativo.
  • ZFS import fallido: los discos no montan, y te dice que el pool no existe (pero tú sabes que está ahí).
  • RAID degradado: uno o más discos se marcan como OFFLINE.
  • FS inconsistente: el sistema de archivos está dañado y lanza errores al arrancar.

Procedimiento real para levantarlo (sin liarla)

1. Conectamos desde el panel del ISP o con iKVM

Si es un servidor dedicado o virtualizado, entramos desde el panel de gestión (tipo OVH, Hetzner, DonDominio, lo que sea). Desde ahí:

  • Montamos un disco de recuperación
  • Accedemos por SSH o terminal web
  • Identificamos los discos y los pools

2. Comprobamos y montamos manualmente el pool ZFS

zpool import

Si el sistema dice que el pool está “destroyed”, no lo está. Solo hay que importarlo con la opción correcta:

zpool import -f -F nombre_del_pool

3. Reparar GRUB si es necesario

Montamos particiones:

mount /dev/sdX /mnt
mount --bind /dev /mnt/dev
mount --bind /proc /mnt/proc
mount --bind /sys /mnt/sys
chroot /mnt

Y luego reinstalamos el GRUB:

grub-install /dev/sdX
update-grub

4. Verificamos VM y CT

Entramos al sistema y revisamos que todos los .conf de las VMs siguen en /etc/pve/qemu-server o /etc/pve/lxc. Si no están, los recuperamos de backups (que nosotros siempre configuramos).

Casos reales resueltos con Proxmox

  • Córdoba: Apagón + Proxmox en RAID 10 con 2 discos muertos. Recuperamos el RAID, clonamos el pool y migramos a nuevo nodo sin perder ni una VM.
  • Madrid: GRUB reventado, cliente pensaba que había perdido todo. Entramos con rescue, reinstalamos GRUB, pool intacto. En 1 hora, todo online.
  • Porto do Son: Nodo principal KO, cluster desincronizado. Reconfiguramos quorum, forzamos ZFS y lo pusimos todo fino sin reiniciar ni una máquina crítica.

¿Y si no hay copias de seguridad?

No es lo ideal, pero lo hemos visto. Si no hay backups, hacemos una clonación cruda de los discos con dd, montamos las imágenes en un entorno limpio y sacamos las VMs desde ahí. Es lento, pero salvamos el sistema casi entero.

Blindaje post-catástrofe

  • Scripts de shutdown seguro ante cortes eléctricos
  • SAI configurado para apagar Proxmox antes de quedarse sin batería
  • Backups automáticos externos en FTP, Google Drive o NAS local
  • Monitoreo por Zabbix, Nagios o Uptime Kuma

¿Tienes un servidor reventado tras el apagón? No lo toques más.

Si lo que tienes delante es una pantalla negra, líneas rojas o un ZFS que no aparece, no improvises. Lo reventarás. Aquí en PC64 lo hemos visto todo. Lo recuperamos todo. Sin excusas, sin sustos.

Llámanos, y tu Proxmox en Porto do Son vuelve a la vida mejor que antes.