Capítulo 8: Optimización de Tokens

Por: Artiko
claude-codetokensoptimizacioncostos

El Problema

Claude Code puede ser costoso si no gestionás el consumo de tokens. ECC incluye estrategias para reducir costos significativamente.

Configuración Recomendada

Agregar a ~/.claude/settings.json:

{
  "model": "sonnet",
  "env": {
    "MAX_THINKING_TOKENS": "10000",
    "CLAUDE_AUTOCOMPACT_PCT_OVERRIDE": "50",
    "CLAUDE_CODE_SUBAGENT_MODEL": "haiku"
  }
}
SettingDefaultRecomendadoImpacto
modelopussonnet~60% reducción de costo
MAX_THINKING_TOKENS31,99910,000~70% reducción en thinking
AUTOCOMPACT_PCT_OVERRIDE9550Compacta antes, mejor calidad
SUBAGENT_MODELhaikuSubagentes más baratos

Cuándo Usar Cada Modelo

ModeloCuándo usarCosto relativo
HaikuSubagentes, tareas simples$
Sonnet80% de tareas diarias$$
OpusArquitectura, debugging profundo$$$$

Cambiar modelo en sesión:

/model opus    # Para razonamiento profundo
/model sonnet  # Volver al default

Strategic Compaction

No esperar al auto-compact al 95%. Compactar en puntos lógicos:

Cuándo compactar:

Cuándo NO compactar:

/compact    # En un punto lógico
/clear      # Entre tareas no relacionadas (gratis, reset instantáneo)
/cost       # Monitorear gasto

Context Window Management

Cada MCP server consume tokens de tu ventana de 200K. Demasiados MCPs pueden reducirla a ~70K.

Reglas:

// .claude/settings.json del proyecto
{
  "disabledMcpServers": ["supabase", "railway", "vercel"]
}

Agent Teams: Advertencia de Costo

Agent Teams abre múltiples ventanas de contexto en paralelo. Cada teammate consume tokens independientemente.

Usar Agent Teams solo cuando:

Para tareas secuenciales: usar subagentes (un solo contexto a la vez).

Comandos Diarios para Control de Costos

ComandoCuándo usar
/model sonnetDefault para la mayoría
/model opusArquitectura compleja, debugging
/clearEntre tareas no relacionadas
/compactEn breakpoints lógicos
/costMonitorear gasto de la sesión

Model Routing (v1.8)

ECC v1.8 incluye el comando /model-route que rutea tareas automáticamente:

/model-route "implement auth middleware"
→ Sonnet (tarea de implementación estándar)

/model-route "design distributed caching architecture"
→ Opus (requiere razonamiento profundo)