docs: documentacion extensiva de infraestructura CAS - Junio 2026
- README principal actualizado con indice completo - Documentacion detallada de 4 servidores fisicos - Topologia de red completa con diagramas ASCII - Asignacion de IPs y conflictos identificados - Documentacion DNS para 3 dominios - Servicios: Caddy, Jellyfin Stack, Multimedia - Proyectos: Afterlife, Nexus, Horux - Seguridad: politica y riesgos identificados - Automatizacion: n8n workflows y scripts - Scripts utilitarios: backup, update-dns, check-ip - Roadmap 2026 Q2-Q4 - Documentacion Hermes AI server (actualizada)
This commit is contained in:
237
servidores/ai-server/README.md
Normal file
237
servidores/ai-server/README.md
Normal file
@@ -0,0 +1,237 @@
|
||||
# Servidor de IA — Ryzen PC (AI Server)
|
||||
|
||||
> **IP**: 192.168.10.144
|
||||
> **Hostname**: ai-server
|
||||
> **OS**: Ubuntu Server 24.04 LTS (bare metal)
|
||||
> **Rol**: Inferencia de IA local, agentes conversacionales, TTS
|
||||
|
||||
---
|
||||
|
||||
## Hardware
|
||||
|
||||
| Componente | Especificación |
|
||||
|---|---|
|
||||
| **CPU** | AMD Ryzen 7 7700X |
|
||||
| **RAM** | 32 GB DDR5 |
|
||||
| **GPU** | NVIDIA RTX 3060 12GB VRAM |
|
||||
| **Disco** | 500 GB NVMe SSD |
|
||||
| **Red** | 1GbE |
|
||||
|
||||
---
|
||||
|
||||
## Servicios Instalados
|
||||
|
||||
| Servicio | Versión | Puerto | Estado | Descripción |
|
||||
|---|---|---|---|---|
|
||||
| Ollama | Latest | 11434 | ✅ | Motor de inferencia LLM |
|
||||
| Hermes Agent | v0.9.0 | — | ✅ | Agente orquestrador multi-canal |
|
||||
| Kokoro TTS | v0.2.2 | 8880 | ✅ Docker | Text-to-Speech GPU |
|
||||
| Hermes Dashboard | — | 9119 | ✅ | Dashboard web |
|
||||
|
||||
---
|
||||
|
||||
## Ollama
|
||||
|
||||
### Configuración
|
||||
|
||||
```ini
|
||||
# /etc/systemd/system/ollama.service
|
||||
[Service]
|
||||
Environment="OLLAMA_HOST=0.0.0.0:11434"
|
||||
Environment="OLLAMA_MODELS=/usr/share/ollama/.ollama/models"
|
||||
```
|
||||
|
||||
### Modelos Instalados
|
||||
|
||||
| Modelo | Tamaño | VRAM | Uso |
|
||||
|---|---|---|---|
|
||||
| qwen3.5:9b | 6.6 GB (Q4_K_M) | ~6.6 GB | Inferencia local / respaldo |
|
||||
|
||||
### Comandos
|
||||
|
||||
```bash
|
||||
# Listar modelos
|
||||
ollama list
|
||||
|
||||
# Ejecutar modelo
|
||||
ollama run qwen3.5:9b
|
||||
|
||||
# Pull nuevo modelo
|
||||
ollama pull <modelo>
|
||||
|
||||
# Ver logs
|
||||
journalctl -u ollama -f
|
||||
```
|
||||
|
||||
---
|
||||
|
||||
## Hermes Agent
|
||||
|
||||
### Perfiles
|
||||
|
||||
| Agente | Perfil | Modelo | Canales | Rol |
|
||||
|---|---|---|---|---|
|
||||
| Lucy | Principal (default) | qwen3.6 (NaN) | Telegram + Discord | Asistente general |
|
||||
| Kratos | `~/.hermes/profiles/kratos/` | qwen3.6 (NaN) | Telegram + Discord | Marketing & SEO |
|
||||
| Juan | `~/.hermes/profiles/nexus/` | qwen3.6 (NaN) | Telegram + Discord | Soporte autopartes |
|
||||
| Horux | `~/.hermes/profiles/horux/` | — | WhatsApp (pendiente) | Asistente financiero |
|
||||
|
||||
### Archivos de Configuración
|
||||
|
||||
| Archivo | Descripción |
|
||||
|---|---|
|
||||
| `~/.hermes/config.yaml` | Configuración principal |
|
||||
| `~/.hermes/SOUL.md` | Personalidad Lucy (General) |
|
||||
| `~/.hermes/.env` | API keys y variables de entorno |
|
||||
| `~/.hermes/skills/` | Skills instalados |
|
||||
| `~/.hermes/profiles/` | Perfiles de agentes |
|
||||
| `~/.hermes/sessions/` | Historial en SQLite |
|
||||
| `~/.hermes/cron/` | Tareas programadas |
|
||||
|
||||
### Variables de Entorno
|
||||
|
||||
```bash
|
||||
# NaN Builders (modelo principal)
|
||||
# base_url: https://api.nan.builders/v1
|
||||
# model: qwen3.6
|
||||
|
||||
# Telegram Gateway
|
||||
TELEGRAM_ALLOWED_USERS=1322020431,[usuario2],[usuario3]
|
||||
|
||||
# Discord Gateway
|
||||
DISCORD_ALLOWED_USERS=[id1],[id2],[id3]
|
||||
|
||||
# Kokoro TTS
|
||||
VOICE_TOOLS_OPENAI_KEY=dummy
|
||||
VOICE_TOOLS_OPENAI_BASE_URL=http://localhost:8880/v1
|
||||
|
||||
# Gitea
|
||||
GITHUB_TOKEN=d513c9be01ccd2044788c1895b74d5a27eec721c
|
||||
GITHUB_API_URL=https://git.consultoria-as.com/api/v1
|
||||
```
|
||||
|
||||
### Servicios Systemd
|
||||
|
||||
```bash
|
||||
# Gateway de mensajería
|
||||
systemctl --user status hermes-gateway
|
||||
|
||||
# Dashboard web
|
||||
systemctl --user status hermes-dashboard
|
||||
|
||||
# Logs
|
||||
journalctl --user -u hermes-gateway -f
|
||||
```
|
||||
|
||||
### Comandos
|
||||
|
||||
```bash
|
||||
# Iniciar chat con agente principal
|
||||
hermes chat
|
||||
|
||||
# Iniciar chat con agente específico
|
||||
kratos chat # Marketing & SEO
|
||||
nexus chat # Autopartes (Juan)
|
||||
|
||||
# Ver skills
|
||||
hermes skills list
|
||||
|
||||
# Backup de configuración
|
||||
hermes backup
|
||||
|
||||
# Actualizar
|
||||
hermes update
|
||||
|
||||
# Cambiar modelo
|
||||
hermes model
|
||||
```
|
||||
|
||||
---
|
||||
|
||||
## Kokoro TTS
|
||||
|
||||
### Instalación
|
||||
|
||||
```bash
|
||||
docker run -d \
|
||||
--name kokoro-tts \
|
||||
--restart unless-stopped \
|
||||
--gpus all \
|
||||
-p 8880:8880 \
|
||||
ghcr.io/remsky/kokoro-fastapi-gpu:v0.2.2
|
||||
```
|
||||
|
||||
### Voces en Español
|
||||
|
||||
| Voz | Género | Calidad |
|
||||
|---|---|---|
|
||||
| ef_dora | Femenina | ⭐⭐⭐⭐ |
|
||||
| em_alex | Masculino | ⭐⭐⭐⭐ |
|
||||
| em_santa | Masculino | ⭐⭐⭐ |
|
||||
|
||||
### Integraciones
|
||||
|
||||
**Open WebUI**:
|
||||
- Engine: OpenAI
|
||||
- URL: `http://192.168.10.144:8880/v1`
|
||||
- API Key: `anything`
|
||||
- Model: `kokoro`
|
||||
|
||||
**Hermes**:
|
||||
```bash
|
||||
VOICE_TOOLS_OPENAI_KEY=dummy
|
||||
VOICE_TOOLS_OPENAI_BASE_URL=http://localhost:8880/v1
|
||||
```
|
||||
|
||||
---
|
||||
|
||||
## Firewall
|
||||
|
||||
```bash
|
||||
# Reglas activas
|
||||
sudo ufw status
|
||||
|
||||
# Permitir Ollama
|
||||
sudo ufw allow 11434/tcp
|
||||
|
||||
# Permitir Kokoro
|
||||
sudo ufw allow 8880/tcp
|
||||
|
||||
# Permitir Hermes Dashboard
|
||||
sudo ufw allow 9119/tcp
|
||||
```
|
||||
|
||||
---
|
||||
|
||||
## Mantenimiento
|
||||
|
||||
```bash
|
||||
# Actualizar sistema
|
||||
sudo apt update && sudo apt upgrade -y
|
||||
|
||||
# Actualizar drivers NVIDIA
|
||||
sudo ubuntu-drivers autoinstall
|
||||
|
||||
# Ver GPU
|
||||
nvidia-smi
|
||||
|
||||
# Temperatura GPU
|
||||
nvidia-smi -q -d TEMPERATURE
|
||||
|
||||
# Logs Docker
|
||||
journalctl -u docker -f
|
||||
```
|
||||
|
||||
---
|
||||
|
||||
## Notas Importantes
|
||||
|
||||
1. **IP dinámica**: 192.168.10.144 es DHCP — pendiente configurar IP estática en Netplan
|
||||
2. **OPNsense desactivado**: Red sin firewall activo — prioridad reparar
|
||||
3. **n8n workflow**: PostgreSQL en 192.168.10.148 con workflow fallando
|
||||
4. **WhatsApp**: Configuración pendiente, se usará número dedicado
|
||||
5. **Agente Horux**: Pendiente tabla maestra clientes y esquema de BD
|
||||
|
||||
---
|
||||
|
||||
*Documentación del servidor AI - Consultoria-AS*
|
||||
Reference in New Issue
Block a user