La era de la IA barata llegó a su fin
Durante años, las empresas de IA prometieron que su producto se democratizaría. Pero el sector pivota hacia los clientes empresariales y los costos financieros y ambientales aumentan
Cuando OpenAI lanzó ChatGPT a fines de 2022, rápidamente batió récords como el producto tecnológico de más rápido crecimiento en la historia. Los proveedores de modelos de IA como OpenAI, Anthropic y Google utilizaron inicialmente precios planos artificialmente bajos para impulsar la adopción y capturar cuota de mercado, confiando en que podrían quemar capital de inversores para fabricar dependencia y luego monetizar una base de usuarios cautiva. Pero en comparación con las otras plataformas orientadas al consumidor que habían ejecutado este manual desde los años 2000, como Facebook, Uber o Instagram, la IA generativa difiere en dos aspectos críticos.
En primer lugar, cada usuario adicional genera un enorme costo variable por consulta a una escala que ninguna red social alcanzó jamás. En concreto, los chatbots consumen una cantidad ingente de potencia computacional, que depende de electricidad, agua para el enfriamiento de servidores, terrenos para centros de datos y miles de millones de dólares en inversión en hardware. En segundo lugar, a medida que los modelos se vuelven más avanzados, también se vuelven más costosos de ejecutar. En ese sentido, se parecen más a tecnologías de computación en la nube como Amazon Web Services.
Para 2023, la firma de investigación SemiAnalysis estimó que ChatGPT ya costaba aproximadamente 700.000 dólares al día en funcionamiento. Los modelos solo se volvieron más complejos e intensivos en recursos desde entonces. A comienzos de 2026, con entre ochocientos y novecientos millones de usuarios activos semanales y solo treinta y cinco millones de suscriptores de pago, el costo de mantener el acceso global a ChatGPT a esta escala es de alrededor de 17.000 millones de dólares al año, o cerca de 47 millones de dólares al día.
En palabras del profesor de negocios de Harvard Andy Wu, la mayoría de las personas no se da cuenta de lo «ridículamente caro» que es la IA. La mayoría conoce los altos costos fijos, pero no los costos variables de inferencia que se generan cada vez que el modelo produce una imagen. OpenAI espera gastar más de 150.000 millones de dólares solo en costos de inferencia hasta 2030. Mientras la gran mayoría de los usuarios sigue accediendo a la plataforma de forma gratuita, la pregunta es cómo se cerrará eventualmente la brecha entre recursos e ingresos, y quién asumirá los costos.
El problema de realización de la IA
De 2022 a 2025, el sector luchó con un problema de realización. Este término marxista se refiere al momento en el circuito del capital (del dinero a la inversión en capacidad productiva y de vuelta al dinero) en que los bienes se convierten en ventas rentables. Un problema de realización surge cuando las empresas pueden producir enormes cantidades de bienes o servicios, pero no encuentran suficientes compradores para recuperar los costos.
En otras palabras, un problema de realización se produce cuando la capacidad productiva se expande más rápido que la demanda. En los primeros años de la IA, las empresas tecnológicas occidentales invirtieron enormes sumas en IA generativa --granjas de servidores, entrenamiento de modelos, mano de obra de ingeniería, etc.--, pero la demanda fue insuficiente. A fines de 2025, Wu señaló que el conjunto de personas dispuestas a pagar 20 dólares al mes por IA generativa es menor que el de quienes están dispuestos a pagar 20 dólares al mes por Netflix. Para generar demanda de un producto con el que sus empleadores tenían vínculos financieros, las empresas tecnológicas empujaron a sus empleados a usar los chatbots independientemente de si esa demanda producía un resultado equivalente.
Por ejemplo, Meta y Shopify crearon clasificaciones internas para rastrear y recompensar el uso de tokens. El director ejecutivo de Nvidia, Jensen Huang, dijo que estaría «profundamente alarmado» si un ingeniero no estuviera usando al menos 250.000 dólares en tokens en un año, y que «esto no es diferente a uno de nuestros diseñadores de chips que dice: "¿Saben qué? Voy a usar papel y lápiz"». Esto es, por supuesto, después de que Nvidia invirtiera 30.000 millones de dólares en OpenAI, financiando la demanda de su propio producto.
En enero, la consultora estadounidense Accenture le comunicó a su personal jerárquico que debe utilizar regularmente herramientas de IA para ser considerado en las promociones. Como le dijo a Jacobin un empleado anónimo de Accenture: «Desearía que hubiera más transparencia sobre las reglas del uso de IA entre el personal jerárquico. La política es vaga. Me preocupa que aliente a las personas a usar IA solo por el hecho de alcanzar algún objetivo».
El problema de realización fue así diferido mediante una combinación de creación ficticia de demanda y precios subsidiados. Se obscureció aún más por la lógica de financiamiento circular del sector, donde un pequeño conjunto de empresas se aisló de la disciplina de mercado al financiarse, abastecerse y venderse mutuamente en un circuito cerrado.
La estratificación de clases en la IA
A fines de 2025, Anthropic lanzó su modelo Claude Opus 4.5, un modelo de IA agéntica orientado a los «trabajadores del conocimiento». Opus 4.5 representa un logro tecnológico genuino según cualquier medida convencional. El modelo también es dramáticamente más costoso de ejecutar y ya dio lugar tanto a un cambio en la estrategia de precios como a una ruptura con la retórica anterior de la IA como utilidad universal.
Los tokens son la unidad básica de datos que procesan los modelos de IA. Chatear con un chatbot utiliza varios cientos de tokens por párrafo. Las tareas de IA agéntica, en las que los modelos navegan de manera autónoma por la web, escriben y ejecutan código, o gestionan flujos de trabajo complejos, pueden consumir rápidamente millones. Según el emprendedor e inversor de Silicon Valley Vasudev Bhandarkar, la razón principal por la que la IA agéntica es exponencialmente más cara se debe a su multiplicidad (la capacidad de manejar muchas llamadas a la vez), la cantidad de contexto que puede retener, su capacidad de verificación, su uso de herramientas externas y el alto costo cuando falla. El paso de la IA conversacional a la agéntica representa un enorme salto en intensidad de recursos.
Desde comienzos de 2026, Anthropic viene introduciendo progresivamente recargos basados en tokens, niveles de inferencia premium, facturación separada para agentes autónomos y medición basada en créditos para el uso de herramientas e integraciones. A comienzos de mayo, la empresa anunció que los suscriptores de Claude enfrentarían un medidor de créditos mensual separado para herramientas de agentes y marcos de terceros (herramientas que encapsulan el modelo Claude) facturados a las tarifas completas de la interfaz de programación de aplicaciones (API) a partir de mediados de junio. Consultado al respecto, un investigador anónimo especializado en modelos de lenguaje de gran escala (LLM) le dijo a Jacobin:
«Desde Claude Opus 4.5, los proveedores de modelos priorizan cada vez más las capacidades agénticas y los acuerdos de empresa a empresa (B2B), al tiempo que dejan en segundo plano a los consumidores finales. Empresas como Google y OpenAI, aunque todavía interesadas en la adopción masiva, están pivotando. Anthropic priorizó el B2B desde el principio».
La dirección es clara: las formas de IA más intensivas en cómputo y más potentes son la prioridad y serán racionadas de manera creciente para trabajadores de cuello blanco en grandes empresas occidentales cuyos empleadores pueden pagar un alto precio por ellas. A comienzos de marzo, Claude superó brevemente a ChatGPT en usuarios activos diarios, registrando un aumento del 1.487 por ciento en el uso. La demanda existe. El modelo de precios para sostenerla a niveles de acceso democráticos y alcanzables, no. En palabras de Bhandarkar: «La pregunta es: ¿se convertirá la IA en algo como la electricidad o en algo como los jets privados?»
La transición por la que nadie votó
Por ahora, la respuesta de la industria a esta contradicción es que la IA se pagará sola mediante ganancias en «productividad». La experiencia reciente de Uber sugiere que esto puede no ser tan sencillo. Después de gastar 3.400 millones de dólares en IA en 2025, Uber ejerció una fuerte presión interna sobre sus cinco mil ingenieros para que adoptaran Claude, con clasificaciones que alentaban el uso máximo. La empresa agotó todo su presupuesto de IA para 2026 en abril. El director de tecnología de Uber admitió que estaba «volviendo a la mesa de dibujo porque el presupuesto que creía necesitar ya estaba agotado».
El valor de uso de la IA y sus costos para el capital son divergentes. Las ganancias de productividad probablemente sean reales, pero insuficientes. Por ejemplo, el consumo por desarrollador en Uber se multiplicó entre cinco y veinte veces, pero ningún indicador público muestra un aumento equivalente en el «valor del resultado». Según el investigador de LLM, «ya seas un proveedor de modelos o una empresa tecnológica en la economía de la IA, la competencia es feroz y se siente la presión de mantener el gasto, incluso si se está invirtiendo más de lo que se debería o de lo que se puede». Por ahora, no hay evidencia de que los números cuadren, y lo que es más importante, tampoco la hay de que sea necesario que cuadren. El mismo financiamiento circular le permite al sector seguir gastando sin reconciliar costo y retorno.
Incluso si la IA eventualmente se paga sola en una empresa como Uber, ¿qué implica eso para la mayoría de los trabajadores que quedan excluidos de esas ganancias? Dicho de otro modo, incluso si la IA es productiva en términos agregados, ¿para quién se realiza ese valor de productividad? Las ganancias de eficiencia son principalmente para el trabajo del conocimiento, pero los costos --precios más altos, acceso racionado, precariedad laboral y, de manera más urgente, devastación ambiental-- se reparten de manera desigual.
Mientras las empresas de IA occidentales que nos impusieron el consumo de IA no tienen un plan claro sobre cómo pagar los costos crecientes, vienen demostrando una capacidad notable para asegurar financiamiento innovador y diferir el momento del ajuste de cuentas a través de los mercados de capitales. La preocupación central no son los balances de la economía de la IA, sino si este es un trato que el resto de nosotros queremos aceptar pasivamente. ¿Es posible renegociar los términos de esta transición?
Jacobinlat







