diff --git a/planificacion/rack-42u-redesign.md b/planificacion/rack-42u-redesign.md new file mode 100644 index 0000000..3be3507 --- /dev/null +++ b/planificacion/rack-42u-redesign.md @@ -0,0 +1,354 @@ +# Plan de Rack 42U — Rediseño Infraestructura CAS + +> **Fecha**: Junio 2026 +> **Objetivo**: Reacomodar rack con nuevo equipo de datacenter, optimizar roles, red y almacenamiento + +--- + +## 📦 Inventario de Hardware + +### Equipo Actual + +| # | Equipo | Tipo | U | Estado | CPU | RAM | Storage | +|---|---|---|---|---|---|---|---| +| 1 | TYAN #1 | Rack 1U | 1U | ✅ Activo | Xeon Gold 5120 (28c) | 755 GB | ZFS Multimedia + local-lvm | +| 2 | Dell T430 #1 "Cisco1" | Torre | ~4U en bandeja | ✅ Activo | Xeon E5-2609 v4 (16c) | 755 GB | local-lvm | +| 3 | Dell T430 #2 "DellT430-2" | Torre | ~4U en bandeja | ✅ Activo | Xeon E5-2620 v4 (16c) | 126 GB | local-lvm | +| 4 | Ryzen AI | Rackmount 4U | 4U | ✅ Activo | Ryzen 7 7700X | 32 GB | 500 GB SSD | +| 5 | Switch Cisco | Rack 1U | 1U | ✅ Activo | — | — | — | +| 6 | Mini PC OPNsense | Shelf 1U | 1U | ⚠️ Degradado | — | — | — | + +### Equipo Nuevo (Adquirido Datacenter) + +| # | Equipo | Tipo | U | CPU (est.) | RAM (est.) | NIC | +|---|---|---|---|---|---|---| +| 7 | TYAN #2 | Rack 1U | 1U | Xeon (est.) | 64-128 GB (est.) | 1GbE | +| 8 | Cisco UCS C220 #1 | Rack 1U | 1U | Xeon E5 v3/v4 | 64-128 GB (est.) | 1GbE | +| 9 | Cisco UCS C220 #2 | Rack 1U | 1U | Xeon E5 v3/v4 | 64-128 GB (est.) | 1GbE | +| 10 | Cisco UCS C220 #3 | Rack 1U | 1U | Xeon E5 v3/v4 | 64-128 GB (est.) | 1GbE | + +--- + +## 🏗️ Layout de Rack 42U (Diseño Propuesto) + +### Principios de Diseño + +1. **Pesado abajo**: UPS, torres, gabinetes pesados en la base +2. **Flujo de calor**: Servidores de carga media en medio, ventilación arriba +3. **Accesibilidad**: Switch y firewall a altura de trabajo +4. **Expansión**: Dejar espacio libre para crecimiento + +### Distribución por U + +``` +U42 [Blank Panel / Ventilación superior] +U41 [Patch Panel RJ45 + gestión cables] +U40 [Cable Management 1U] +U39 [Switch Cisco 48p 1GbE] +U38 [Mini PC OPNsense (shelf 1U)] +U37 [Blank Panel] +U36 [PDU A (trasera izquierda)] +U35 [PDU B (trasera derecha)] +U34 [TYAN #1 - Nodo Principal] +U33 [TYAN #2 - Nodo Secundario] +U32 [Cisco UCS #1 - Producción] +U31 [Cisco UCS #2 - Desarrollo] +U30 [Cisco UCS #3 - Storage/Backup] +U29 [Blank Panel] +U28 [Cable Management 1U] +U27 [Blank Panel] +U26 [Blank Panel] +U25 [Blank Panel] +U24 [Blank Panel] +U23 [Blank Panel] +U22 [Blank Panel] +U21 [Blank Panel] +U20 [Blank Panel] +U19 [Blank Panel] +U18 [Blank Panel] +U17 [Blank Panel] +U16 [Blank Panel] +U15 [Blank Panel] +U14 [Blank Panel] +U13 [Blank Panel] +U12 [Blank Panel] +U11 [Blank Panel] +U10 [Blank Panel] +U09 [Blank Panel] +U08 [Blank Panel] +U07 [Blank Panel] +U06 [Ryzen AI - Gabinete 4U] +U05 [Ryzen AI - Continuación] +U04 [Ryzen AI - Continuación] +U03 [Ryzen AI - Continuación] +U02 [Bandeja Dell T430 #1] +U01 [Bandeja Dell T430 #2] +``` + +### Vista Frontal Rack + +``` ++----------------------------------------+ +| U42 Ventilación | +| U41 Patch Panel | +| U40 Cable Mgmt | +| U39 [Switch Cisco 48p] | +| U38 [OPNsense Mini PC] | +| U37 Blank | ++----------------------------------------+ +| U36-U35 PDU Traseras | ++----------------------------------------+ +| U34 [TYAN #1] ====== Nodo Principal | +| U33 [TYAN #2] ====== Nodo Secundario | +| U32 [UCS #1] ====== Producción | +| U31 [UCS #2] ====== Desarrollo | +| U30 [UCS #3] ====== Storage/Backup | ++----------------------------------------+ +| U29-U07 Espacio libre (~22U) | +| Futura expansión: | +| - UPS de rack | +| - Servidores adicionales | +| - NAS/SAN dedicado | ++----------------------------------------+ +| U06-U03 [Ryzen AI 4U] ==== IA Bare | +| U02-U01 [Dell T430 x2] ==== Torre Shelf | ++----------------------------------------+ +``` + +### Totales + +| Componente | U Usados | U Libres | +|---|---|---| +| Servidores Rack (5x 1U) | 5U | — | +| Ryzen AI (4U) | 4U | — | +| Dell T430 (2x bandeja) | 2U | — | +| Switch + OPNsense | 2U | — | +| Patch Panel + Cable Mgmt | 2U | — | +| Ventilación + Blank | 2U | — | +| **Total Usado** | **~17U** | **~25U libres** | + +--- + +## 🎯 Roles por Servidor (Reestructuración) + +### Fase 1: Asignación de Roles + +| Servidor | Rol | VMs/Servicios | Storage | Prioridad | +|---|---|---|---|---| +| **TYAN #1** (existente) | **Nodo Principal PVE + NAS** | OMV, Caddy, Gitea, n8n, Jellyfin, Hotel Hacienda, Immich, Navidrome | ZFS Multimedia + local-lvm | Crítico | +| **TYAN #2** (nuevo) | **Nodo Secundario PVE + Replica** | Backups, replicas ZFS, servicios failover, Orchestrator | local-lvm | Alto | +| **UCS #1** | **Nodo Producción PVE** | Odoo, Horux, Nexus Autopartes, NodeBB, MSP, 3D, CrawlAI | local-lvm + NFS de TYAN1 | Crítico | +| **UCS #2** | **Nodo Desarrollo PVE** | Afterlife, OpenWebUI, ClaudeVM, CarlosVM, VMs dev/test | local-lvm | Media | +| **UCS #3** | **Nodo Storage/Backup PVE** | TrueNAS/OMV secundario, backup target, sync | local-lvm (alta capacidad) | Media | +| **Dell T430 #1** | **Retirar de PVE → Compute spare** | Migrar VMs a UCS, dejar como nodo standby | local-lvm | Baja | +| **Dell T430 #2** | **Retirar de PVE → Compute spare** | Migrar VMs a UCS, dejar como nodo standby | local-lvm | Baja | +| **Ryzen AI** | **Bare metal IA dedicado** | Ollama, Hermes, Kokoro TTS (mantener fuera de cluster) | Local SSD | Media | +| **Mini PC OPNsense** | **Firewall perimetral** | Mantener hasta migrar a VM HA en futuro | USB/SSD | Crítico | + +### Fase 2: Migración de VMs + +**De Dell T430 #1 (Cisco1) → UCS #2 (Desarrollo):** +| VM | Destino | Notas | +|---|---|---| +| AfterlifeProject (106) | UCS #2 | Producción web | +| OpenWebUI (101) | UCS #2 | Interfaz AI | +| HermesJesus (104) | UCS #2 | Agente Hermes | +| Nexterm (107) | UCS #2 | Terminal | +| OnboardingNexusDB (108) | UCS #2 | DB Nexus | +| ClaudeVM (109) | UCS #2 | Ya está aquí | +| CarlosVM (110) | UCS #2 | Ya está aquí | + +**De Dell T430 #2 → UCS #1 (Producción):** +| VM | Destino | Notas | +|---|---|---| +| CocinaConAlma (101) | UCS #1 | Tandoor | +| Odoo (102) | UCS #1 | ERP | +| NodeBB (103) | UCS #1 | Foro (corregir VLAN) | +| Autopartes (104) | UCS #1 | Nexus e-commerce | +| 3D (105) | UCS #1 | STL Manager | +| CAS-PaginasWeb (106) | UCS #1 | Web CAS | +| CrawlAI (107) | UCS #1 | Crawler | +| Horux (108) | UCS #1 | Finanzas | +| MSP (113) | UCS #1 | MeshCentral | + +**De TYAN #1 → TYAN #2 (Replicas/Backups):** +| VM | Destino | Notas | +|---|---|---| +| Orchestrator (1000) | TYAN #2 | Orquestador | +| NexusManager (200) | TYAN #2 | VM general | +| UptimeKuma (110) | TYAN #2 | Monitoreo | +| Dashy (102) | TYAN #2 | Dashboard | + +**Mantener en TYAN #1:** +| VM | Notas | +|---|---| +| OMV (100) | NAS físico | +| Dockge (106) | Caddy + Docker stack | +| Immich (104) | Fotos (mucha I/O en ZFS) | +| Hotel Hacienda (105) | Servicio crítico | +| n8n (108) | Automatización | +| Navidrome (109) | Música | +| Metabase (111) | Analytics | +| Gitea (112) | Git | + +--- + +## 🔌 Red y Cableado + +### VLANs Propuestas (Implementar en Switch Cisco) + +| VLAN | Rango | Uso | Puertos Switch | +|---|---|---|---| +| VLAN 1 (Native) | 192.168.10.0/24 | Infraestructura principal, Proxmox, servicios | 1-24 | +| VLAN 20 | 192.168.20.0/24 | Usuarios/Oficina | 25-36 | +| VLAN 30 | 192.168.30.0/24 | Foros/BBDD/NodeBB | 37-40 | +| VLAN 40 | 192.168.40.0/24 | IoT/Invitados/Impresoras | 41-44 | +| VLAN 50 | 192.168.50.0/24 | Management (IPMI, iDRAC, switch admin) | 45-48 | +| VLAN 99 | — | Trunk/Inter-switch | 49-50 (SFP si aplica) | + +### Cableado (Patch Panel → Switch) + +| Puerto Switch | Destino | VLAN | Tipo | +|---|---|---|---| +| 1-2 | TYAN #1 (eno1, eno2) | Trunk (1,20,30,40,50) | Cat6 | +| 3-4 | TYAN #2 (eno1, eno2) | Trunk | Cat6 | +| 5-6 | UCS #1 (LOM1, LOM2) | Trunk | Cat6 | +| 7-8 | UCS #2 (LOM1, LOM2) | Trunk | Cat6 | +| 9-10 | UCS #3 (LOM1, LOM2) | Trunk | Cat6 | +| 11-12 | Dell T430 #1 (vmbr0) | Trunk | Cat6 | +| 13-14 | Dell T430 #2 (vmbr0) | Trunk | Cat6 | +| 15-16 | Ryzen AI (eth0) | VLAN 1 | Cat6 | +| 17 | OPNsense (LAN) | Trunk | Cat6 | +| 18 | OPNsense (WAN) | VLAN 1 (passthrough modem) | Cat6 | +| 19-24 | Reserva servidores | — | Cat6 | +| 25-36 | Usuarios oficina | VLAN 20 | Cat6 | +| 37-40 | NodeBB, DBs | VLAN 30 | Cat6 | +| 41-44 | IoT, impresoras | VLAN 40 | Cat6 | +| 45-48 | IPMI/iDRAC switches | VLAN 50 | Cat6 | + +### Diagrama de Red Objetivo + +``` + INTERNET + | + +-------+-------+ + | Modem ISP | + | 192.168.10.254| + +-------+-------+ + | + +-------+-------+ + | OPNsense | + | Mini PC | + | (Firewall) | + +-------+-------+ + | + +-------+-------+ + | Switch Cisco | + | 48p (VLANs) | + +-------+-------+ + | + +--------+-----------+-----------+--------+--------+ + | | | | | | + +---v---+ +--v---+ +---v---+ +--v---+ +--v---+ +--v---+ + | TYAN1 | |TYAN2| | UCS#1 | |UCS#2 | |UCS#3 | | Ryzen| + | PVE | | PVE | | PVE | | PVE | | PVE | | AI | + | NAS | |Repl | | Prod | | Dev | | Stor | | Bare | + +-------+ +-----+ +-------+ +------+ +------+ +------+ + | | | | | | + +--------+-----------+-----------+--------+--------+ + | + +--------+--------+ + | Dell T430 x2 | + | (Standby/Spare) | + +-----------------+ +``` + +--- + +## ⚡ Alimentación + +### PDU Recomendadas + +| PDU | Ubicación | Conexión | +|---|---|---| +| PDU A (izquierda trasera) | U36 | Circuito A (20A) | +| PDU B (derecha trasera) | U35 | Circuito B (20A) | + +### Balanceo de Carga + +| PDU A | PDU B | +|---|---| +| TYAN #1 | TYAN #2 | +| UCS #1 | UCS #2 | +| Dell T430 #1 | Dell T430 #2 | +| Ryzen AI | UCS #3 | +| Switch Cisco | OPNsense | + +### UPS (Recomendado Futuro) + +| Modelo Sugerido | Capacidad | Carga Estimada | +|---|---|---| +| APC Smart-UPS SRT 3000VA | 2700W | ~1500W rack completo | +| CyberPower PR3000LCDRTXL2U | 3000VA | Rack 2U | + +--- + +## 🚀 Roadmap de Implementación + +### Fase 1: Preparación (Semana 1) + +- [ ] Auditar specs exactas de Cisco UCS C220 (CPU, RAM, discos, NICs) +- [ ] Instalar riels en rack +- [ ] Instalar PDUs y cableado de alimentación +- [ ] Instalar patch panel y cableado estructurado +- [ ] Etiquetar todos los cables +- [ ] Instalar TYAN #2 y UCS #1/#2/#3 en rack + +### Fase 2: Configuración Base (Semana 2) + +- [ ] Instalar Proxmox 8.x en TYAN #2 y los 3 UCS +- [ ] Configurar VLANs en switch Cisco +- [ ] Configurar trunk en vmbr0 de todos los nodos +- [ ] Crear cluster Proxmox (5 nodos rack) +- [ ] Configurar Ceph o ZFS compartido (evaluar) + +### Fase 3: Migración VMs (Semana 3) + +- [ ] Migrar VMs de Dell T430 #1 → UCS #2 +- [ ] Migrar VMs de Dell T430 #2 → UCS #1 +- [ ] Mover replicas/secundarios a TYAN #2 +- [ ] Validar servicios post-migración + +### Fase 4: Optimización (Semana 4) + +- [ ] Retirar Dell T430 del cluster Proxmox +- [ ] Configurar backups automatizados a UCS #3 +- [ ] Implementar monitoreo de rack (temperatura, PDU) +- [ ] Documentar rack físico con fotos y diagramas + +--- + +## 📝 Notas Importantes + +### Sobre los Dell T430 +- Son servidores torre de ~17" de alto +- En bandeja de rack ocupan ~2U cada uno pero la profundidad puede ser un problema +- Considerar quedarse solo con los 5 servidores rack y vender/mover los Dell +- O usar los Dell como "cold spare" (apagados, listos para emergencia) + +### Sobre la Red +- Switch Cisco 48p es 1GbE — suficiente para carga actual +- Los Cisco UCS C220 pueden tener 10GbE SFP+ en LOM +- Si se habilita 10GbE, considerar un switch de core SFP+ en el futuro +- Por ahora, todo a 1GbE con VLANs es suficiente + +### Sobre Almacenamiento +- TYAN #1 tiene ZFS Multimedia (excelente) +- UCS #3 puede montar TrueNAS/OMV como storage secundario +- Ceph requiere al menos 3 nodos con storage dedicado +- Alternativa: NFS/iSCSI desde TYAN #1 a los UCS + +--- + +*Plan de rack - Consultoria-AS* +*Junio 2026* diff --git a/planificacion/roadmap-2026.md b/planificacion/roadmap-2026.md index 9c2e9ab..969f4e5 100644 --- a/planificacion/roadmap-2026.md +++ b/planificacion/roadmap-2026.md @@ -3,17 +3,24 @@ ## Q2 2026 (Abril - Junio) ### Infraestructura +- [x] Adquirir equipo de datacenter (3x Cisco UCS C220 + 1x TYAN 1U) +- [ ] Reacomodar rack 42U con nuevo equipo +- [ ] Instalar riels, PDUs, patch panel y cableado estructurado +- [ ] Configurar VLANs en switch Cisco (VLAN 1, 20, 30, 40, 50) +- [ ] Instalar Proxmox en TYAN #2 y 3x Cisco UCS +- [ ] Crear cluster Proxmox de 5 nodos rack +- [ ] Migrar VMs de Dell T430 #1 → UCS #2 (Desarrollo) +- [ ] Migrar VMs de Dell T430 #2 → UCS #1 (Producción) +- [ ] Retirar Dell T430 del cluster → cold spare / standby - [ ] Reparar NIC re1 de OPNsense -- [ ] Configurar IP estática en todas las VMs -- [ ] Resolver conflicto IP VT210/CraneGOO -- [ ] Configurar VLANs en switch Cisco +- [ ] Configurar IP estática en VMs nuevas - [ ] Implementar WireGuard VPN ### Seguridad - [ ] SSH por clave en todas las VMs - [ ] fail2ban en servidores - [ ] 2FA en Gitea y Proxmox -- [ ] Backups automatizados +- [ ] Backups automatizados a UCS #3 (Storage) ### Proyectos - [ ] Lanzar Nexus Autoparts al mercado