Token anxiety: miro la barrita de Claude más que mi cuenta de banco
Hay una ansiedad nueva entre devs con AI coding intensivo: la barrita de tokens de tu suscripción. Te hace racionar como en la guerra (o gastar de más por culpa). Por qué pasa, cómo calibrarte, y tips —medio en serio— para gastar menos.
Es martes, 3 de la tarde. Voy en el 80% de mi cuota semanal de Claude. Y sin darme cuenta empiezo a escribir prompts como si racionara agua en el desierto: lo mínimo indispensable, cortito, no vaya a ser que me quede sin tanque antes del lunes.
Eso es token anxiety. Si adoptaste AI coding en serio probablemente la tienes y no la habías nombrado. Quien nunca abrió la pestaña de uso “nada más para checar” que tire la primera piedra.
Y el racionamiento del martes es solo una de sus dos caras. La otra es todavía más ridícula: el que no quiere desperdiciar. Es viernes, te sobra medio tanque, y aparece la voz contraria: “pagué por esto, tengo que usarlo”. Y te pones a inventar trabajo. Refactorizas algo que funcionaba. Le pides al agente que “explore mejoras”. Optimizas el medidor en vez del producto, como quien va al buffet con hambre fingida para que valga la cuenta.
Racionas cuando se acaba, derrochas cuando sobra. La barra manda, tú obedeces — y es un plan de costo fijo donde el siguiente token cuesta cero. No es queja; es nada más lo que una barrita de progreso le hace al cerebro de un ingeniero.
El reset forzado (gracias, supongo)
Y luego pasa lo inevitable: se acaban los tokens de la sesión. La terminal te corta. No hay negociación, no hay “un promptcito más”, no hay tarjeta de crédito que valga. Vuelve en unas horas.
Y de repente… te tienes que parar.
Resulta que existe un mundo fuera de la terminal. Hay una ventana. Hay luz que no sale de un monitor. Hay —me dicen— otros seres humanos con los que uno puede socializar: una especie de pair programming pero sin IDE, sin merge conflicts y sin Ctrl+C. Te estiras. Tomas agua. Recuerdas que tienes piernas.
El rate limit de Anthropic es, accidentalmente, el mejor wellness coach que he tenido. Pomodoro no me duró ni diez días; “se te acabaron los tokens, vuelve más tarde” me sacó a tomar sol en cinco minutos. Lloras un poco, sí, pero tomas sol.
Cómo escaló esto (un drama en tres actos)
Acto 1. Configuras tu cuenta, ves el dashboard de uso, te parece sano entender cuánto consumes. Lo es.
Acto 2. Dos semanas después abres tu Usage antes de cada sesión grande. Ya no es interés, es horóscopo. Lo primero que consultas en la mañana.
Acto 3. Estás en una cena, alguien menciona “Claude” y por reflejo sacas el teléfono a ver tu porcentaje semanal. Tu pareja te mira. No dices nada.
Por qué pasa aunque sepas que es absurdo
Entiendes la matemática y la ansiedad igual persiste. Tres culpables:
1. El medidor es visible y concreto. 73% esta semana. Es un número, con barra de progreso y todo. Tu productividad real es abstracta y no tiene barrita. El cerebro siempre le cree al que trae gráfica.
2. El contar tokens es algo nuevo. Hace dos años escribir código era gratis. Tu cerebro ancló el precio en cero y ahora cualquier número arriba de cero se siente como atraco. Es el mismo sesgo que te hace sufrir por $60 de estacionamiento pero no por los $1,800 de la cena.
3. Es como un medidor de combustible. El medidor te grita cuánto gastaste. Nadie te muestra cuántas horas te ahorraste, cuántos bugs esquivaste, cuánto entregaste. La cuenta de débitos tiene UI bonita; la de créditos no existe. Tu cerebro solo ve la mitad del balance.
Tips para gastar menos tokens (medio en serio)
El agente no quema la mayoría de tus tokens escribiendo código. Los quema redescubriendo tu proyecto cada vez. Cada sesión que arranca a ciegas se gasta medio tanque leyendo archivos para reconstruir lo que tú ya tenías en la cabeza. El ahorro grande no está en prompts más cortos — está en que tu proyecto esté tan bien documentado que el agente no tenga que adivinar nada.
Documenta dónde vive cada cosa. Un CLAUDE.md / AGENTS.md que
diga qué hace cada carpeta, cómo se buildea, dónde están las piezas
raras — eso es lo primero que lee el agente y le ahorra veinte
exploraciones. Es la diferencia entre un colega nuevo con onboarding y
uno al que aventaste al repo sin mapa y le dijiste “ahí ve”. (De por qué
ese archivo es tu verdadero moat escribí
aquí.)
Mapea el flujo, no dejes que lo reconstruya. Un diagrama de Mermaid
de cómo se relacionan tus componentes vale más —y pesa muchísimos menos
tokens— que el agente armando el grafo a punta de grep. Un mapa se lee
de un jalón; el territorio se recorre archivo por archivo, y tú pagas
cada paso.
Ten una base de conocimiento alineada al código. ADRs (por qué decidiste lo que decidiste), bitácora, versionamiento, roadmap — viviendo en el repo, no en la cabeza de alguien que ya renunció. Cuando todo eso es legible, el agente deja de explorar para adivinar el “por qué”. Es justo la disciplina de process-as-code y de mover tu tracking a markdown: documenta como si tu agente tuviera amnesia, porque la tiene.
No saques un cañón para matar una mosca. Formatear un JSON o renombrar variables no necesita el modelo más caro. Usa el tier ligero para lo ligero y guarda al pesado para cuando de verdad duela.
Y el siguiente nivel —conectar todos esos conceptos en un second brain con Obsidian, para que el contexto de tu proyecto se relacione solo en vez de vivir en archivos sueltos— da para su propio artículo. Pronto.
Una nota a los equipos
Si eres CTO o líder y ves a tu equipo con esta ansiedad:
- Comparte el ROI agregado: “el mes pasado pagamos $X y entregamos Y que antes nos llevaba Z meses”.
- Sube los planes a cuota grande. La ansiedad cuesta más en productividad perdida que los $50-100 extra por cabeza al mes.
Mi propio fix
Lo que finalmente me ayudó medirme por lo que entregaba. La pestaña de uso sigue abierta, pero ya no es ansiedad: es curiosidad ocasional, como ver al medidor de nivel de gasolina antes de meterte a la autopista.
Si te identificaste con esto, probablemente vale la pena hacer la misma transición. Hoy. Antes de que llegue el viernes y te sobren tokens.
Si tu equipo está adoptando AI coding y quieren plantear bien las métricas de uso desde el principio (sin que nadie termine en terapia con la barrita), conversemos — el chat está abierto.