Recorte de licencias de Claude

A mediados de 2026, dos de las empresas tecnológicas más grandes del mundo tomaron decisiones similares con diferente trasfondo: recortaron el uso interno de Claude Code, la herramienta de programación asistida por IA de Anthropic. El motivo, en ambos casos, fue el mismo: los costos superaron ampliamente lo previsto.

A diferencia del software tradicional, que cobra una tarifa fija mensual por usuario, estas herramientas de IA de última generación cobran por uso: cada consulta, cada bloque de código generado y cada revisión procesada suma al total de la factura.

En consecuencia, cuando miles de ingenieros utilizan la herramienta de forma intensiva y continua, los costos no solo crecen: escalan de forma impredecible. Ese es el problema central que enfrentaron Microsoft y Uber en 2026.

Por qué las licencias de IA cuestan más de lo previsto

La mayoría de las herramientas avanzadas de IA, incluido Claude Code, utilizan precios basados en tokens, es decir, en la cantidad de texto que el sistema procesa en cada interacción. A pequeña escala, ese modelo es razonable. Sin embargo, a gran escala, el resultado puede ser devastador para los presupuestos.

Un informe de Mavvrik publicado en 2025 reveló que el 85% de las empresas no cumple sus previsiones de costos de IA por más del 10%. Además, el 84% reportó que el gasto en estas herramientas redujo sus márgenes brutos en más de seis puntos porcentuales. Por otro lado, los precios del software de IA en EE.UU. subieron entre un 20% y un 37% en los últimos meses, según Windows Central.

A esto se suma un fenómeno cultural emergente que los analistas llaman “tokenmaxxing”: la práctica de algunos ingenieros de usar los modelos de IA más allá de lo estrictamente necesario, generando costos de tokens de seis cifras mensuales en casos extremos.

Los dos casos más resonantes: Microsoft y Uber

Microsoft: seis meses de piloto y marcha atrás

Microsoft lanzó Claude Code internamente en diciembre de 2025, desplegándolo en su división Experiences & Devices, responsable de productos como Windows, Microsoft 365, Outlook, Teams y Surface. La adopción fue rápida. Sin embargo, también lo fue el crecimiento de los costos.

Menos de seis meses después, la empresa decidió cancelar la mayoría de sus licencias internas. La fecha límite es el 30 de junio de 2026, coincidiendo con el cierre de su año fiscal. La directiva interna fue clara: los desarrolladores deben migrar a GitHub Copilot CLI, la herramienta propia de Microsoft.

No obstante, esta decisión no implica un alejamiento estratégico de Anthropic. Microsoft sigue ofreciendo acceso a los modelos de Claude a sus clientes externos a través de Azure Foundry y Microsoft 365 Copilot. Asimismo, Anthropic tiene comprometida la compra de USD 30.000 millones en infraestructura de cómputo de Azure. La cancelación afecta a las licencias internas, no a la relación comercial entre ambas compañías.

Uber: el presupuesto anual agotado en cuatro meses

Uber desplegó Claude Code a aproximadamente 5.000 ingenieros a principios de 2026. Para abril, las tasas de uso llegaron a entre el 84% y el 95% del tiempo disponible. Según Forbes, el costo por ingeniero alcanzó entre USD 500 y USD 2.000 mensuales.

El resultado fue contundente: la empresa agotó todo su presupuesto de IA para 2026, estimado en USD 3.400 millones, en apenas cuatro meses. El CTO de Uber, Praveen Neppalli Naga, lo describió con precisión en declaraciones a The Information:

"Estoy de vuelta al punto de partida, porque el presupuesto que creía que necesitaría ya fue superado por completo."

En paralelo, el 70% del código comprometido en los repositorios de Uber ya proviene de herramientas de IA. Por lo tanto, el problema no es la falta de valor de la tecnología, sino la velocidad con la que el consumo superó cualquier previsión razonable.

Un problema que trasciende a Claude: el sector busca respuestas

El problema de los costos de IA no es exclusivo de estas dos empresas. Bryan Catanzaro, vicepresidente de aprendizaje profundo aplicado de Nvidia, declaró a Axios el 26 de abril de 2026 que “para mi equipo, el costo del cómputo supera ampliamente el costo de los empleados.” La afirmación, proveniente de un ejecutivo de la empresa que fabrica los chips que alimentan a la mayoría de los sistemas de IA del mundo, subraya la dimensión estructural del problema.

GitHub, por su parte, migró todos sus planes de Copilot a un modelo de facturación basada en uso a partir del 1 de junio de 2026, lo que refleja la misma tensión: pasar de precios fijos, más fáciles de presupuestar, a precios variables que dependen del consumo real.

"Las empresas están sumando gastos de IA basados en consumo sobre nóminas fijas sin reducir personal, creando una estructura de costos que solo crece."— BigGo Finance, mayo 2026

En consecuencia, el número de equipos FinOps, es decir, grupos dedicados a controlar y optimizar el gasto en tecnología, que gestionan específicamente el gasto en IA se duplicó del 31% al 63% en un solo año. Finalmente, Gartner proyecta que los costos de inferencia para modelos de gran escala podrían caer cerca de un 90% para 2030. Si esa proyección se cumple, el problema actual podría ser transitorio. Por ahora, sin embargo, las empresas están aprendiendo a gobernar el gasto antes de que los modelos bajen de precio.

Scroll al inicio