Tutorial Jaeger — Índice
Tutorial Jaeger — De cero a hero
Jaeger es una plataforma de distributed tracing open source nacida en Uber y graduada de la CNCF. Permite ver el recorrido de una request a través de tu sistema distribuido, identificar cuellos de botella, debuggear latencia y entender dependencias entre servicios.
Trazas distribuidas en una frase: si una request pasa por 8 servicios y tarda 4 segundos, las trazas te dicen exactamente qué servicio y qué operación se llevó esos 4 segundos.
Este tutorial te lleva desde no saber qué es un span hasta correr Jaeger en producción con sampling adaptativo, storage de Elasticsearch y monitoreo de performance vía Prometheus.
Estructura
flowchart LR
A[Fundamentos\n01-02] --> B[Setup local\n03-04]
B --> C[Arquitectura e\ninstrumentación\n05-07]
C --> D[Operación\n08-10]
D --> E[Producción\n11-14]
| # | Capítulo | Foco |
|---|---|---|
| 1 | Introducción | Qué es, historia, casos de uso |
| 2 | Conceptos fundamentales | Trace, span, context, baggage |
| 3 | Instalación | All-in-one, Docker, Kubernetes |
| 4 | Tu primer trace | Hello world con Node.js + OpenTelemetry |
| 5 | Arquitectura | Collector, query, agent, storage |
| 6 | Instrumentación con OpenTelemetry | Auto y manual, exporters |
| 7 | Context propagation | W3C Trace Context, B3, baggage |
| 8 | Sampling | Probabilistic, rate limiting, adaptive |
| 9 | UI de Jaeger | Search, Timeline, System Architecture, Monitor |
| 10 | Storage backends | Memory, Badger, Cassandra, Elasticsearch |
| 11 | Jaeger v2 | Nueva arquitectura sobre OTel Collector |
| 12 | Deployment en producción | Kubernetes, Operator, Helm, Kafka |
| 13 | SPM con Prometheus | Service Performance Monitoring |
| 14 | Troubleshooting y best practices | Lost spans, cardinality, errores comunes |
¿Para quién es este tutorial?
- Desarrolladores backend que escuchan “tenemos un problema de latencia” y no saben dónde mirar.
- SRE / DevOps que tienen que decidir cómo desplegar Jaeger sin que se les rompa en producción.
- Equipos que ya usan logs y métricas y necesitan la tercera pata de observabilidad: trazas.
No requiere experiencia previa con observabilidad, pero ayuda haber tocado al menos OpenTelemetry o Prometheus.
¿Qué vas a poder hacer al terminar?
- Instrumentar una aplicación con OpenTelemetry y enviarla a Jaeger.
- Leer un timeline complejo y diagnosticar qué span se llevó la latencia.
- Decidir qué estrategia de sampling usar según tu volumen de tráfico.
- Diseñar una arquitectura de Jaeger productiva con buffer Kafka y storage replicado.
- Instalar Jaeger v2 con OpenTelemetry Collector embebido.
- Usar el Monitor (SPM) para ver RED metrics derivadas de las trazas.