Capítulo 8: Optimización de Tokens
El Problema
Claude Code puede ser costoso si no gestionás el consumo de tokens. ECC incluye estrategias para reducir costos significativamente.
Configuración Recomendada
Agregar a ~/.claude/settings.json:
{
"model": "sonnet",
"env": {
"MAX_THINKING_TOKENS": "10000",
"CLAUDE_AUTOCOMPACT_PCT_OVERRIDE": "50",
"CLAUDE_CODE_SUBAGENT_MODEL": "haiku"
}
}
| Setting | Default | Recomendado | Impacto |
|---|---|---|---|
model | opus | sonnet | ~60% reducción de costo |
MAX_THINKING_TOKENS | 31,999 | 10,000 | ~70% reducción en thinking |
AUTOCOMPACT_PCT_OVERRIDE | 95 | 50 | Compacta antes, mejor calidad |
SUBAGENT_MODEL | — | haiku | Subagentes más baratos |
Cuándo Usar Cada Modelo
| Modelo | Cuándo usar | Costo relativo |
|---|---|---|
| Haiku | Subagentes, tareas simples | $ |
| Sonnet | 80% de tareas diarias | $$ |
| Opus | Arquitectura, debugging profundo | $$$$ |
Cambiar modelo en sesión:
/model opus # Para razonamiento profundo
/model sonnet # Volver al default
Strategic Compaction
No esperar al auto-compact al 95%. Compactar en puntos lógicos:
Cuándo compactar:
- Después de investigación, antes de implementar
- Al completar un milestone, antes del siguiente
- Después de debugging, antes de continuar feature
- Después de un approach fallido, antes de probar otro
Cuándo NO compactar:
- A mitad de implementación (perdés nombres de variables, paths, estado parcial)
/compact # En un punto lógico
/clear # Entre tareas no relacionadas (gratis, reset instantáneo)
/cost # Monitorear gasto
Context Window Management
Cada MCP server consume tokens de tu ventana de 200K. Demasiados MCPs pueden reducirla a ~70K.
Reglas:
- Máximo 10 MCPs activos por proyecto
- Máximo 80 herramientas activas
- Deshabilitar MCPs no usados por proyecto:
// .claude/settings.json del proyecto
{
"disabledMcpServers": ["supabase", "railway", "vercel"]
}
Agent Teams: Advertencia de Costo
Agent Teams abre múltiples ventanas de contexto en paralelo. Cada teammate consume tokens independientemente.
Usar Agent Teams solo cuando:
- Trabajo multi-módulo genuinamente paralelo
- Reviews en paralelo de diferentes archivos
Para tareas secuenciales: usar subagentes (un solo contexto a la vez).
Comandos Diarios para Control de Costos
| Comando | Cuándo usar |
|---|---|
/model sonnet | Default para la mayoría |
/model opus | Arquitectura compleja, debugging |
/clear | Entre tareas no relacionadas |
/compact | En breakpoints lógicos |
/cost | Monitorear gasto de la sesión |
Model Routing (v1.8)
ECC v1.8 incluye el comando /model-route que rutea tareas automáticamente:
/model-route "implement auth middleware"
→ Sonnet (tarea de implementación estándar)
/model-route "design distributed caching architecture"
→ Opus (requiere razonamiento profundo)