docs(rack): plan completo de reacomodo rack 42U con equipo nuevo datacenter

- Nuevo archivo: planificacion/rack-42u-redesign.md
- Layout detallado por U para rack 42U
- Roles asignados a 5 servidores rack + Dell T430 spare + Ryzen AI
- Migracion de VMs: Dell T430 #1 -> UCS #2, Dell T430 #2 -> UCS #1
- Diseno de VLANs (1, 20, 30, 40, 50)
- Cableado patch panel -> switch
- Diagrama de red objetivo
- PDU, UPS, alimentacion
- Roadmap Q2 2026 actualizado con tareas de rack
- 25U libres para expansion futura
This commit is contained in:
Orquestrador CAS
2026-06-10 00:44:09 +00:00
parent 61748dde41
commit 4e477db228
2 changed files with 365 additions and 4 deletions

View File

@@ -0,0 +1,354 @@
# Plan de Rack 42U — Rediseño Infraestructura CAS
> **Fecha**: Junio 2026
> **Objetivo**: Reacomodar rack con nuevo equipo de datacenter, optimizar roles, red y almacenamiento
---
## 📦 Inventario de Hardware
### Equipo Actual
| # | Equipo | Tipo | U | Estado | CPU | RAM | Storage |
|---|---|---|---|---|---|---|---|
| 1 | TYAN #1 | Rack 1U | 1U | ✅ Activo | Xeon Gold 5120 (28c) | 755 GB | ZFS Multimedia + local-lvm |
| 2 | Dell T430 #1 "Cisco1" | Torre | ~4U en bandeja | ✅ Activo | Xeon E5-2609 v4 (16c) | 755 GB | local-lvm |
| 3 | Dell T430 #2 "DellT430-2" | Torre | ~4U en bandeja | ✅ Activo | Xeon E5-2620 v4 (16c) | 126 GB | local-lvm |
| 4 | Ryzen AI | Rackmount 4U | 4U | ✅ Activo | Ryzen 7 7700X | 32 GB | 500 GB SSD |
| 5 | Switch Cisco | Rack 1U | 1U | ✅ Activo | — | — | — |
| 6 | Mini PC OPNsense | Shelf 1U | 1U | ⚠️ Degradado | — | — | — |
### Equipo Nuevo (Adquirido Datacenter)
| # | Equipo | Tipo | U | CPU (est.) | RAM (est.) | NIC |
|---|---|---|---|---|---|---|
| 7 | TYAN #2 | Rack 1U | 1U | Xeon (est.) | 64-128 GB (est.) | 1GbE |
| 8 | Cisco UCS C220 #1 | Rack 1U | 1U | Xeon E5 v3/v4 | 64-128 GB (est.) | 1GbE |
| 9 | Cisco UCS C220 #2 | Rack 1U | 1U | Xeon E5 v3/v4 | 64-128 GB (est.) | 1GbE |
| 10 | Cisco UCS C220 #3 | Rack 1U | 1U | Xeon E5 v3/v4 | 64-128 GB (est.) | 1GbE |
---
## 🏗️ Layout de Rack 42U (Diseño Propuesto)
### Principios de Diseño
1. **Pesado abajo**: UPS, torres, gabinetes pesados en la base
2. **Flujo de calor**: Servidores de carga media en medio, ventilación arriba
3. **Accesibilidad**: Switch y firewall a altura de trabajo
4. **Expansión**: Dejar espacio libre para crecimiento
### Distribución por U
```
U42 [Blank Panel / Ventilación superior]
U41 [Patch Panel RJ45 + gestión cables]
U40 [Cable Management 1U]
U39 [Switch Cisco 48p 1GbE]
U38 [Mini PC OPNsense (shelf 1U)]
U37 [Blank Panel]
U36 [PDU A (trasera izquierda)]
U35 [PDU B (trasera derecha)]
U34 [TYAN #1 - Nodo Principal]
U33 [TYAN #2 - Nodo Secundario]
U32 [Cisco UCS #1 - Producción]
U31 [Cisco UCS #2 - Desarrollo]
U30 [Cisco UCS #3 - Storage/Backup]
U29 [Blank Panel]
U28 [Cable Management 1U]
U27 [Blank Panel]
U26 [Blank Panel]
U25 [Blank Panel]
U24 [Blank Panel]
U23 [Blank Panel]
U22 [Blank Panel]
U21 [Blank Panel]
U20 [Blank Panel]
U19 [Blank Panel]
U18 [Blank Panel]
U17 [Blank Panel]
U16 [Blank Panel]
U15 [Blank Panel]
U14 [Blank Panel]
U13 [Blank Panel]
U12 [Blank Panel]
U11 [Blank Panel]
U10 [Blank Panel]
U09 [Blank Panel]
U08 [Blank Panel]
U07 [Blank Panel]
U06 [Ryzen AI - Gabinete 4U]
U05 [Ryzen AI - Continuación]
U04 [Ryzen AI - Continuación]
U03 [Ryzen AI - Continuación]
U02 [Bandeja Dell T430 #1]
U01 [Bandeja Dell T430 #2]
```
### Vista Frontal Rack
```
+----------------------------------------+
| U42 Ventilación |
| U41 Patch Panel |
| U40 Cable Mgmt |
| U39 [Switch Cisco 48p] |
| U38 [OPNsense Mini PC] |
| U37 Blank |
+----------------------------------------+
| U36-U35 PDU Traseras |
+----------------------------------------+
| U34 [TYAN #1] ====== Nodo Principal |
| U33 [TYAN #2] ====== Nodo Secundario |
| U32 [UCS #1] ====== Producción |
| U31 [UCS #2] ====== Desarrollo |
| U30 [UCS #3] ====== Storage/Backup |
+----------------------------------------+
| U29-U07 Espacio libre (~22U) |
| Futura expansión: |
| - UPS de rack |
| - Servidores adicionales |
| - NAS/SAN dedicado |
+----------------------------------------+
| U06-U03 [Ryzen AI 4U] ==== IA Bare |
| U02-U01 [Dell T430 x2] ==== Torre Shelf |
+----------------------------------------+
```
### Totales
| Componente | U Usados | U Libres |
|---|---|---|
| Servidores Rack (5x 1U) | 5U | — |
| Ryzen AI (4U) | 4U | — |
| Dell T430 (2x bandeja) | 2U | — |
| Switch + OPNsense | 2U | — |
| Patch Panel + Cable Mgmt | 2U | — |
| Ventilación + Blank | 2U | — |
| **Total Usado** | **~17U** | **~25U libres** |
---
## 🎯 Roles por Servidor (Reestructuración)
### Fase 1: Asignación de Roles
| Servidor | Rol | VMs/Servicios | Storage | Prioridad |
|---|---|---|---|---|
| **TYAN #1** (existente) | **Nodo Principal PVE + NAS** | OMV, Caddy, Gitea, n8n, Jellyfin, Hotel Hacienda, Immich, Navidrome | ZFS Multimedia + local-lvm | Crítico |
| **TYAN #2** (nuevo) | **Nodo Secundario PVE + Replica** | Backups, replicas ZFS, servicios failover, Orchestrator | local-lvm | Alto |
| **UCS #1** | **Nodo Producción PVE** | Odoo, Horux, Nexus Autopartes, NodeBB, MSP, 3D, CrawlAI | local-lvm + NFS de TYAN1 | Crítico |
| **UCS #2** | **Nodo Desarrollo PVE** | Afterlife, OpenWebUI, ClaudeVM, CarlosVM, VMs dev/test | local-lvm | Media |
| **UCS #3** | **Nodo Storage/Backup PVE** | TrueNAS/OMV secundario, backup target, sync | local-lvm (alta capacidad) | Media |
| **Dell T430 #1** | **Retirar de PVE → Compute spare** | Migrar VMs a UCS, dejar como nodo standby | local-lvm | Baja |
| **Dell T430 #2** | **Retirar de PVE → Compute spare** | Migrar VMs a UCS, dejar como nodo standby | local-lvm | Baja |
| **Ryzen AI** | **Bare metal IA dedicado** | Ollama, Hermes, Kokoro TTS (mantener fuera de cluster) | Local SSD | Media |
| **Mini PC OPNsense** | **Firewall perimetral** | Mantener hasta migrar a VM HA en futuro | USB/SSD | Crítico |
### Fase 2: Migración de VMs
**De Dell T430 #1 (Cisco1) → UCS #2 (Desarrollo):**
| VM | Destino | Notas |
|---|---|---|
| AfterlifeProject (106) | UCS #2 | Producción web |
| OpenWebUI (101) | UCS #2 | Interfaz AI |
| HermesJesus (104) | UCS #2 | Agente Hermes |
| Nexterm (107) | UCS #2 | Terminal |
| OnboardingNexusDB (108) | UCS #2 | DB Nexus |
| ClaudeVM (109) | UCS #2 | Ya está aquí |
| CarlosVM (110) | UCS #2 | Ya está aquí |
**De Dell T430 #2 → UCS #1 (Producción):**
| VM | Destino | Notas |
|---|---|---|
| CocinaConAlma (101) | UCS #1 | Tandoor |
| Odoo (102) | UCS #1 | ERP |
| NodeBB (103) | UCS #1 | Foro (corregir VLAN) |
| Autopartes (104) | UCS #1 | Nexus e-commerce |
| 3D (105) | UCS #1 | STL Manager |
| CAS-PaginasWeb (106) | UCS #1 | Web CAS |
| CrawlAI (107) | UCS #1 | Crawler |
| Horux (108) | UCS #1 | Finanzas |
| MSP (113) | UCS #1 | MeshCentral |
**De TYAN #1 → TYAN #2 (Replicas/Backups):**
| VM | Destino | Notas |
|---|---|---|
| Orchestrator (1000) | TYAN #2 | Orquestador |
| NexusManager (200) | TYAN #2 | VM general |
| UptimeKuma (110) | TYAN #2 | Monitoreo |
| Dashy (102) | TYAN #2 | Dashboard |
**Mantener en TYAN #1:**
| VM | Notas |
|---|---|
| OMV (100) | NAS físico |
| Dockge (106) | Caddy + Docker stack |
| Immich (104) | Fotos (mucha I/O en ZFS) |
| Hotel Hacienda (105) | Servicio crítico |
| n8n (108) | Automatización |
| Navidrome (109) | Música |
| Metabase (111) | Analytics |
| Gitea (112) | Git |
---
## 🔌 Red y Cableado
### VLANs Propuestas (Implementar en Switch Cisco)
| VLAN | Rango | Uso | Puertos Switch |
|---|---|---|---|
| VLAN 1 (Native) | 192.168.10.0/24 | Infraestructura principal, Proxmox, servicios | 1-24 |
| VLAN 20 | 192.168.20.0/24 | Usuarios/Oficina | 25-36 |
| VLAN 30 | 192.168.30.0/24 | Foros/BBDD/NodeBB | 37-40 |
| VLAN 40 | 192.168.40.0/24 | IoT/Invitados/Impresoras | 41-44 |
| VLAN 50 | 192.168.50.0/24 | Management (IPMI, iDRAC, switch admin) | 45-48 |
| VLAN 99 | — | Trunk/Inter-switch | 49-50 (SFP si aplica) |
### Cableado (Patch Panel → Switch)
| Puerto Switch | Destino | VLAN | Tipo |
|---|---|---|---|
| 1-2 | TYAN #1 (eno1, eno2) | Trunk (1,20,30,40,50) | Cat6 |
| 3-4 | TYAN #2 (eno1, eno2) | Trunk | Cat6 |
| 5-6 | UCS #1 (LOM1, LOM2) | Trunk | Cat6 |
| 7-8 | UCS #2 (LOM1, LOM2) | Trunk | Cat6 |
| 9-10 | UCS #3 (LOM1, LOM2) | Trunk | Cat6 |
| 11-12 | Dell T430 #1 (vmbr0) | Trunk | Cat6 |
| 13-14 | Dell T430 #2 (vmbr0) | Trunk | Cat6 |
| 15-16 | Ryzen AI (eth0) | VLAN 1 | Cat6 |
| 17 | OPNsense (LAN) | Trunk | Cat6 |
| 18 | OPNsense (WAN) | VLAN 1 (passthrough modem) | Cat6 |
| 19-24 | Reserva servidores | — | Cat6 |
| 25-36 | Usuarios oficina | VLAN 20 | Cat6 |
| 37-40 | NodeBB, DBs | VLAN 30 | Cat6 |
| 41-44 | IoT, impresoras | VLAN 40 | Cat6 |
| 45-48 | IPMI/iDRAC switches | VLAN 50 | Cat6 |
### Diagrama de Red Objetivo
```
INTERNET
|
+-------+-------+
| Modem ISP |
| 192.168.10.254|
+-------+-------+
|
+-------+-------+
| OPNsense |
| Mini PC |
| (Firewall) |
+-------+-------+
|
+-------+-------+
| Switch Cisco |
| 48p (VLANs) |
+-------+-------+
|
+--------+-----------+-----------+--------+--------+
| | | | | |
+---v---+ +--v---+ +---v---+ +--v---+ +--v---+ +--v---+
| TYAN1 | |TYAN2| | UCS#1 | |UCS#2 | |UCS#3 | | Ryzen|
| PVE | | PVE | | PVE | | PVE | | PVE | | AI |
| NAS | |Repl | | Prod | | Dev | | Stor | | Bare |
+-------+ +-----+ +-------+ +------+ +------+ +------+
| | | | | |
+--------+-----------+-----------+--------+--------+
|
+--------+--------+
| Dell T430 x2 |
| (Standby/Spare) |
+-----------------+
```
---
## ⚡ Alimentación
### PDU Recomendadas
| PDU | Ubicación | Conexión |
|---|---|---|
| PDU A (izquierda trasera) | U36 | Circuito A (20A) |
| PDU B (derecha trasera) | U35 | Circuito B (20A) |
### Balanceo de Carga
| PDU A | PDU B |
|---|---|
| TYAN #1 | TYAN #2 |
| UCS #1 | UCS #2 |
| Dell T430 #1 | Dell T430 #2 |
| Ryzen AI | UCS #3 |
| Switch Cisco | OPNsense |
### UPS (Recomendado Futuro)
| Modelo Sugerido | Capacidad | Carga Estimada |
|---|---|---|
| APC Smart-UPS SRT 3000VA | 2700W | ~1500W rack completo |
| CyberPower PR3000LCDRTXL2U | 3000VA | Rack 2U |
---
## 🚀 Roadmap de Implementación
### Fase 1: Preparación (Semana 1)
- [ ] Auditar specs exactas de Cisco UCS C220 (CPU, RAM, discos, NICs)
- [ ] Instalar riels en rack
- [ ] Instalar PDUs y cableado de alimentación
- [ ] Instalar patch panel y cableado estructurado
- [ ] Etiquetar todos los cables
- [ ] Instalar TYAN #2 y UCS #1/#2/#3 en rack
### Fase 2: Configuración Base (Semana 2)
- [ ] Instalar Proxmox 8.x en TYAN #2 y los 3 UCS
- [ ] Configurar VLANs en switch Cisco
- [ ] Configurar trunk en vmbr0 de todos los nodos
- [ ] Crear cluster Proxmox (5 nodos rack)
- [ ] Configurar Ceph o ZFS compartido (evaluar)
### Fase 3: Migración VMs (Semana 3)
- [ ] Migrar VMs de Dell T430 #1 → UCS #2
- [ ] Migrar VMs de Dell T430 #2 → UCS #1
- [ ] Mover replicas/secundarios a TYAN #2
- [ ] Validar servicios post-migración
### Fase 4: Optimización (Semana 4)
- [ ] Retirar Dell T430 del cluster Proxmox
- [ ] Configurar backups automatizados a UCS #3
- [ ] Implementar monitoreo de rack (temperatura, PDU)
- [ ] Documentar rack físico con fotos y diagramas
---
## 📝 Notas Importantes
### Sobre los Dell T430
- Son servidores torre de ~17" de alto
- En bandeja de rack ocupan ~2U cada uno pero la profundidad puede ser un problema
- Considerar quedarse solo con los 5 servidores rack y vender/mover los Dell
- O usar los Dell como "cold spare" (apagados, listos para emergencia)
### Sobre la Red
- Switch Cisco 48p es 1GbE — suficiente para carga actual
- Los Cisco UCS C220 pueden tener 10GbE SFP+ en LOM
- Si se habilita 10GbE, considerar un switch de core SFP+ en el futuro
- Por ahora, todo a 1GbE con VLANs es suficiente
### Sobre Almacenamiento
- TYAN #1 tiene ZFS Multimedia (excelente)
- UCS #3 puede montar TrueNAS/OMV como storage secundario
- Ceph requiere al menos 3 nodos con storage dedicado
- Alternativa: NFS/iSCSI desde TYAN #1 a los UCS
---
*Plan de rack - Consultoria-AS*
*Junio 2026*

View File

@@ -3,17 +3,24 @@
## Q2 2026 (Abril - Junio)
### Infraestructura
- [x] Adquirir equipo de datacenter (3x Cisco UCS C220 + 1x TYAN 1U)
- [ ] Reacomodar rack 42U con nuevo equipo
- [ ] Instalar riels, PDUs, patch panel y cableado estructurado
- [ ] Configurar VLANs en switch Cisco (VLAN 1, 20, 30, 40, 50)
- [ ] Instalar Proxmox en TYAN #2 y 3x Cisco UCS
- [ ] Crear cluster Proxmox de 5 nodos rack
- [ ] Migrar VMs de Dell T430 #1 → UCS #2 (Desarrollo)
- [ ] Migrar VMs de Dell T430 #2 → UCS #1 (Producción)
- [ ] Retirar Dell T430 del cluster → cold spare / standby
- [ ] Reparar NIC re1 de OPNsense
- [ ] Configurar IP estática en todas las VMs
- [ ] Resolver conflicto IP VT210/CraneGOO
- [ ] Configurar VLANs en switch Cisco
- [ ] Configurar IP estática en VMs nuevas
- [ ] Implementar WireGuard VPN
### Seguridad
- [ ] SSH por clave en todas las VMs
- [ ] fail2ban en servidores
- [ ] 2FA en Gitea y Proxmox
- [ ] Backups automatizados
- [ ] Backups automatizados a UCS #3 (Storage)
### Proyectos
- [ ] Lanzar Nexus Autoparts al mercado