7.2 KiB
7.2 KiB
Hermes Agent — Documentación de Implementación
Consultoria-AS | Abril 2026
Infraestructura del Servidor LLM
| Componente | Detalle |
|---|---|
| Hostname | ai-server |
| IP | 192.168.10.144 |
| CPU | AMD Ryzen 7700X |
| RAM | 32GB |
| GPU | NVIDIA RTX 3060 12GB VRAM |
| Disco | 500GB |
| OS | Ubuntu Server 24.04 LTS |
Stack Instalado
| Servicio | Versión | Puerto | Estado |
|---|---|---|---|
| Ollama | Latest | 11434 | ✅ Activo |
| Hermes Agent | v0.9.0 | — | ✅ Activo |
| Kokoro TTS | v0.2.2 | 8880 | ✅ Docker |
| Hermes Dashboard | — | 9119 | ✅ Activo |
Modelos Instalados
| Modelo | Uso | VRAM |
|---|---|---|
| qwen3.5:9b | Ollama local / respaldo | ~6.6GB |
| qwen3.6 (NaN Builders) | Hermes principal | Cloud |
Servicios Systemd
# Gateway de mensajería (Telegram + Discord)
systemctl --user status hermes-gateway
# Dashboard web
systemctl --user status hermes-dashboard
# Kokoro TTS
docker ps | grep kokoro
Comandos de gestión
# Reiniciar gateway
systemctl --user restart hermes-gateway
# Ver logs en tiempo real
journalctl --user -u hermes-gateway -f
# Actualizar Hermes
hermes update
# Cambiar modelo
hermes model
Configuración de Red
Ollama expuesto a la red local
Archivo: /etc/systemd/system/ollama.service
[Service]
Environment="OLLAMA_HOST=0.0.0.0:11434"
Firewall
sudo ufw allow 11434/tcp # Ollama API
Archivos de Configuración
| Archivo | Descripción |
|---|---|
~/.hermes/config.yaml |
Configuración principal |
~/.hermes/SOUL.md |
Personalidad agente Lucy (General) |
~/.hermes/.env |
API keys y variables de entorno |
~/.hermes/skills/ |
Skills instalados |
~/.hermes/profiles/ |
Perfiles de agentes |
~/.hermes/sessions/ |
Historial en SQLite |
~/.hermes/cron/ |
Tareas programadas |
Variables de Entorno (.env)
# NaN Builders (modelo principal)
# base_url: https://api.nan.builders/v1
# model: qwen3.6
# Telegram Gateway
TELEGRAM_ALLOWED_USERS=1322020431,[usuario2],[usuario3]
# Discord Gateway
DISCORD_ALLOWED_USERS=[id1],[id2],[id3]
# Kokoro TTS
VOICE_TOOLS_OPENAI_KEY=dummy
VOICE_TOOLS_OPENAI_BASE_URL=http://localhost:8880/v1
# Gitea
GITHUB_TOKEN=d513c9be01ccd2044788c1895b74d5a27eec721c
GITHUB_API_URL=https://git.consultoria-as.com/api/v1
Agentes Configurados
Lucy (Agente General)
- Perfil: Principal (default)
- SOUL:
~/.hermes/SOUL.md - Modelo: qwen3.6 via NaN Builders
- Canales: Telegram + Discord
- Personalidad: Lucy Mayreel de The Extra's Academy Survival Guide, adaptada para uso de oficina
- Rol: Asistente general del equipo de 3 personas
Kratos (Marketing & SEO)
- Perfil:
~/.hermes/profiles/kratos/ - SOUL:
~/.hermes/profiles/kratos/SOUL.md - Modelo: qwen3.6 via NaN Builders
- Personalidad: Kratos de God of War
- Rol: Marketing digital y SEO para Consultoria-AS, Nexus Autoparts y Horux 360
- Empresas: Consultoria-AS, Nexus Autoparts, Horux 360
- Plataformas: LinkedIn, Facebook, Instagram, Google SEO
- Mercados: Tijuana BC y Guadalajara JAL
Juan (Nexus Autoparts)
- Perfil:
~/.hermes/profiles/nexus/ - SOUL:
~/.hermes/profiles/nexus/SOUL.md - Modelo: qwen3.6 via NaN Builders
- Personalidad: Experto en mecánica automotriz, serio y orientado a atención a clientes
- Rol: Soporte especializado para usuarios de Nexus Autoparts
- Capacidades: Consulta de inventario, catálogo TecDoc, CFDI 4.0, VIN decoder
Agente Horux (Pendiente)
- Perfil:
~/.hermes/profiles/horux/ - Estado: En diseño
- Rol: Asistente financiero para clientes de Horux 360
- Canales: WhatsApp + Chat embebido en Horux web
- Arquitectura: Multi-tenant — cada cliente ve solo su propia base de datos PostgreSQL
Gateways de Mensajería
Telegram ✅
- Bot configurado via @BotFather
- Allowed users configurados en
~/.hermes/.env - Home channel: Chat privado del admin
Discord ✅
- Bot configurado en discord.com/developers
- Privileged Gateway Intents activados (Presence, Server Members, Message Content)
- Allowed users configurados en
~/.hermes/.env
WhatsApp ⏳
- Pendiente de configuración
- Se usará número dedicado para bot de Horux
Kokoro TTS
Instalación
docker run -d \
--name kokoro-tts \
--restart unless-stopped \
--gpus all \
-p 8880:8880 \
ghcr.io/remsky/kokoro-fastapi-gpu:v0.2.2
Voces recomendadas en español
| Voz | Género | Calidad |
|---|---|---|
| ef_dora | Femenina | ⭐⭐⭐⭐ |
| em_alex | Masculino | ⭐⭐⭐⭐ |
| em_santa | Masculino | ⭐⭐⭐ |
Integración Open WebUI
- Engine: OpenAI
- URL:
http://192.168.10.144:8880/v1 - API Key:
anything - Model:
kokoro
Integración Hermes TTS
En ~/.hermes/.env:
VOICE_TOOLS_OPENAI_KEY=dummy
VOICE_TOOLS_OPENAI_BASE_URL=http://localhost:8880/v1
Proveedores LLM Configurados
| Proveedor | Modelo | Estado | Notas |
|---|---|---|---|
| NaN Builders | qwen3.6 | ✅ Principal | RTX PRO 6000 96GB VRAM |
| Ollama Local | qwen3.5:9b | ✅ Respaldo | 12GB VRAM local |
| Groq | llama-3.3-70b | ❌ Descartado | Límite TPM muy bajo |
| Z.ai | GLM-4.7-Flash | ❌ Descartado | Rate limit bajo |
NaN Builders
- URL:
https://api.nan.builders/v1 - Modelo:
qwen3.6(35B MoE, 128K contexto) - Hardware: NVIDIA RTX PRO 6000 Blackwell, 96GB VRAM
- Rate limit: 100 RPM, 5 concurrentes
Open WebUI
- Conexión Ollama:
http://192.168.10.144:11434 - TTS: Kokoro en
http://192.168.10.144:8880/v1 - Modelos disponibles: qwen3.5:9b + cualquier modelo en Ollama
Arquitectura Futura (Pendiente)
Agente Horux Multi-tenant
Cliente WhatsApp/Web
↓
Identificación por número de teléfono
↓
Lookup tabla maestra: número → DB del cliente
↓
Conexión a PostgreSQL específico del cliente
↓
Respuesta solo con datos de ese cliente
Dependencias: Tabla maestra clientes → DB, esquema de tablas Horux
Agente Nexus Multi-tenant
- Similar arquitectura a Horux
- Pendiente a lanzamiento de Nexus Autoparts al mercado
Comandos Útiles
# Iniciar chat con agente principal (Lucy)
hermes chat
# Iniciar chat con agente específico
kratos chat # Marketing & SEO
nexus chat # Autopartes (Juan)
# Ver skills disponibles
hermes skills list
# Ver estado de todos los servicios
systemctl --user status hermes-gateway hermes-dashboard
# Ver logs
journalctl --user -u hermes-gateway -n 50
# Backup de configuración
hermes backup
# Dashboard web
# http://192.168.10.144:9119
Notas Importantes
- IP dinámica: La IP 192.168.10.144 es DHCP — pendiente configurar IP estática en Netplan
- OPNsense desactivado: La red está sin firewall activo — prioridad configurarlo
- n8n workflow: PostgreSQL en 192.168.10.148 con workflow fallando
- WhatsApp: Configuración pendiente, se usará número dedicado
- Agente Horux: Pendiente tabla maestra clientes y esquema de BD
Documentación generada: Abril 2026 Servidor: ai-server (192.168.10.144)