← Volver al listado de tecnologías ← Índice de Everything Claude Code

Capítulo 8: Optimización de Tokens

17 de diciembre de 2024 Por: Artiko

claude-codetokensoptimizacioncostos

El Problema

Claude Code puede ser costoso si no gestionás el consumo de tokens. ECC incluye estrategias para reducir costos significativamente.

Configuración Recomendada

Agregar a ~/.claude/settings.json:

{
  "model": "sonnet",
  "env": {
    "MAX_THINKING_TOKENS": "10000",
    "CLAUDE_AUTOCOMPACT_PCT_OVERRIDE": "50",
    "CLAUDE_CODE_SUBAGENT_MODEL": "haiku"
  }
}

Setting	Default	Recomendado	Impacto
`model`	opus	sonnet	~60% reducción de costo
`MAX_THINKING_TOKENS`	31,999	10,000	~70% reducción en thinking
`AUTOCOMPACT_PCT_OVERRIDE`	95	50	Compacta antes, mejor calidad
`SUBAGENT_MODEL`	—	haiku	Subagentes más baratos

Cuándo Usar Cada Modelo

Modelo	Cuándo usar	Costo relativo
Haiku	Subagentes, tareas simples	$
Sonnet	80% de tareas diarias	$$
Opus	Arquitectura, debugging profundo	$$$$

Cambiar modelo en sesión:

/model opus    # Para razonamiento profundo
/model sonnet  # Volver al default

Strategic Compaction

No esperar al auto-compact al 95%. Compactar en puntos lógicos:

Cuándo compactar:

Después de investigación, antes de implementar
Al completar un milestone, antes del siguiente
Después de debugging, antes de continuar feature
Después de un approach fallido, antes de probar otro

Cuándo NO compactar:

A mitad de implementación (perdés nombres de variables, paths, estado parcial)

/compact    # En un punto lógico
/clear      # Entre tareas no relacionadas (gratis, reset instantáneo)
/cost       # Monitorear gasto

Context Window Management

Cada MCP server consume tokens de tu ventana de 200K. Demasiados MCPs pueden reducirla a ~70K.

Reglas:

Máximo 10 MCPs activos por proyecto
Máximo 80 herramientas activas
Deshabilitar MCPs no usados por proyecto:

// .claude/settings.json del proyecto
{
  "disabledMcpServers": ["supabase", "railway", "vercel"]
}

Agent Teams: Advertencia de Costo

Agent Teams abre múltiples ventanas de contexto en paralelo. Cada teammate consume tokens independientemente.

Usar Agent Teams solo cuando:

Trabajo multi-módulo genuinamente paralelo
Reviews en paralelo de diferentes archivos

Para tareas secuenciales: usar subagentes (un solo contexto a la vez).

Comandos Diarios para Control de Costos

Comando	Cuándo usar
`/model sonnet`	Default para la mayoría
`/model opus`	Arquitectura compleja, debugging
`/clear`	Entre tareas no relacionadas
`/compact`	En breakpoints lógicos
`/cost`	Monitorear gasto de la sesión

Model Routing (v1.8)

ECC v1.8 incluye el comando /model-route que rutea tareas automáticamente:

/model-route "implement auth middleware"
→ Sonnet (tarea de implementación estándar)

/model-route "design distributed caching architecture"
→ Opus (requiere razonamiento profundo)