Profundizando en la sostenibilidad financiera de la IA

En mi columna de abril, hablé de que el costo real de la IA es un defecto potencialmente fatal para la comercialización rentable de la tecnología a largo plazo. Curiosamente, en los dos meses transcurridos desde entonces, hemos visto algunos titulares notables de la industria tecnológica que potencialmente validan mi argumento a escala catastrófica.

Parece que los vientos en la industria de la IA están cambiando de dirección tan rápido que es difícil seguirles la pista. Hace unos meses, las empresas de tecnología e incluso algunas otras empresas estaban haciendo ruido para lograr que el personal usara más la IA, exigiendo que los equipos la integraran en los flujos de trabajo, independientemente de si tenían alguna necesidad clara o un deseo particular del software.

En retrospectiva, 20-20

Como probablemente habría predicho cualquiera que hubiera pensado en ello, cuando se vincula el sustento material de las personas al uso más de una cosa, un gran sector de personas, de hecho, la usará más. Esto llevó a “tokenmaxxing”, tablas de clasificación de uso de tokens dentro de empresas como Amazon y sorprendentes cifras trimestrales de gastos de tokens de IA en toneladas de lugares como Uber (y otras empresas que no han estado dispuestas a dar nombres). Francamente, no me queda claro por qué estas empresas se sorprenden con estos resultados, pero aun así, esto ha llevado a un giro en las instrucciones al personal porque este costo es insostenible por mucho tiempo, pero también porque el uso de la IA no ha producido resultados comerciales suficientemente espectaculares.

Es posible que el liderazgo ejecutivo creyera que se produciría una explosión de productividad semimilagrosa gracias al uso de la IA, pero, de ser así, realmente no habían hecho los deberes. Muchos de nosotros en el campo, así como personas en los medios que cubren la industria, emitimos advertencias sobre cómo la IA es una herramienta que puede usarse de manera efectiva o ineficaz, y esperar milagros siempre será decepcionante.

He usado este tipo de metáfora antes, pero consideremos si estas empresas estuvieran en el sector de la construcción y los taladros eléctricos se hubieran inventado recientemente, lo que haría posibles mejoras excepcionales en la productividad en la construcción. La reacción correcta no sería comprar tantos taladros como sea posible, hasta el punto de hacer que los componentes de los taladros escaseen y aumenten su precio, y ordenar al personal que utilice un taladro en cada tarea, produciendo marcadores que muestren quién utilizó los taladros durante más minutos del día. Tendríamos edificios que tenían patrones de agujeros como queso suizo, habríamos gastado exorbitantes en los taladros y la electricidad para alimentarlos, y tendríamos tanto que mostrar como las empresas de tecnología tienen ahora con la IA.

El dinero no es infinito

En cualquier caso, la realidad ha comenzado a derrumbarse y al menos se trataba de un rápido regreso a la tierra. Algunas empresas siguen comprando perforadoras, pero los grandes actores se han dado cuenta de que la relación coste-beneficio no tiene sentido y se están adaptando. Sin embargo, como expliqué en abril, esto no va a ser tan fácil como creen. Algunas empresas están empezando a decirles a sus equipos que el uso de la IA debe tener fines fructíferos, no solo tokenmaxxing, para tratar de reducir costos y al mismo tiempo cosechar los beneficios de la tecnología donde puede generar valor.

Lo que aún no comprenden es que presupuestar tokens y definir claramente cuándo la IA ayudará con un problema es una tarea mucho más indeterminada que usar otros tipos de tecnología. Volvamos a mi artículo de abril y recordemos la experiencia del uso de la IA para el individuo.

“[Y]Aparentemente, puedes controlar cuántos tokens envías y, por lo tanto, controlar tus costos, pero ese control es limitado. Puede hacer que sus indicaciones sean breves, limitar las instrucciones superfluas y, como resultado, mantener bajos los costos de entrada. Sin embargo, cuando intervienen herramientas de agente y el LLM está creando indicaciones para pasar a otros LLM, usted ya no está a cargo de la duración de las indicaciones. Aún más significativo, usted tiene sólo un control mínimo sobre la cantidad de tokens con los que cualquier modelo responde (por ejemplo, pidiéndole que “sea conciso”). En su mayor parte, la cantidad de tokens de salida es parte de esa incógnita no determinista que describí antes. Y, como observará, un token de salida cuesta 5 veces el precio de un token de entrada”.

Para ampliar esto aún más, cada vez que utiliza la IA, existe la posibilidad de que no responda correctamente a su pregunta. Así que el componente de las máquinas tragamonedas se suma al problema. El trabajador tecnológico no sabe A. cuántos tokens devolverá cada mensaje o B. cuántas veces será necesario introducir un mensaje (potencialmente con ediciones) para obtener una respuesta exitosa a una pregunta. Para calcular el costo, necesitamos sumar todos los recuentos de tokens de solicitud de entrada y todos los recuentos de tokens de solicitud de salida (A, que se desconoce) durante la duración del número de intentos requeridos (B, que también se desconoce). A y B varían indeterminadamente según la arquitectura del modelo, el problema en cuestión, la aleatoriedad del modelo y otros factores de los que probablemente ni siquiera somos conscientes detrás de escena. Luego, multiplicamos por el precio por token para cualquier modelo o modelos que se estén utilizando, que, como expliqué en abril, también varía.

Entonces, si estás en el departamento financiero de una empresa de tecnología y necesitas determinar el presupuesto en dólares para tokens de IA para el próximo año, te deseo la mejor de las suertes. Incluso haciendo una estimación basada en el uso anterior, o con detalles muy finos sobre los objetivos de productividad de la empresa, las posibilidades de presupuestar la cantidad correcta me parecen bastante escasas. Sin embargo, tienes que implementar algún tipo de límite, este no puede ser un escenario de cheque en blanco, por lo que tendrás que aislar a las personas en algún momento.

Implicaciones prácticas

¿Cómo va a funcionar esto realmente? ¿Se trata de “codificación manual” en la segunda mitad del año, después de pasar la primera mitad usando IA de forma intensiva? ¿Todos nuestros correos electrónicos y documentos de marketing están escritos a mano en el tercer y cuarto trimestre? ¿Vamos a cerrar nuestras herramientas de transcripción de IA y el software de voz a texto después de alcanzar un umbral? Esta es una pregunta fascinante para mí, porque he sido testigo personalmente de lo diferente que es la experiencia de escribir código con IA de hacerlo sin ella, y alternar entre los dos procesos sería increíblemente disruptivo.

Esto también plantea la cuestión de cómo la reducción de costos en IA afectará a las empresas que ofrecen soluciones basadas en IA. En octubre pasado, hablé de cómo los hiperescaladores (Anthropic, OpenAI, Google, etc.) están presionando a las nuevas empresas para que implementen funciones basadas en IA en sus productos, como un intento de obtener ganancias para regresar a los inversores que han invertido muchos miles de millones de dólares en esta industria. A medida que aumenta el costo de proporcionar funciones de IA y las empresas adoptan cada vez más un modelo de pago por uso, este volante comenzará a colapsar. Si las empresas comienzan a utilizar menos herramientas basadas en IA porque sus presupuestos no pueden adaptarse a los crecientes costos, el flujo de ingresos que regresa a los hiperescaladores se agotará. Anthropic y OpenAI están planeando OPI este año, ambos con caminos extremadamente inciertos hacia la rentabilidad y cientos de miles de millones de dólares adeudados a los inversores, por lo que una desaceleración en el uso de la IA es lo último que necesitan.

También vale la pena mencionar que Apple anunció la incursión de su producto en la IA la semana pasada en la WWDC, y los críticos están respondiendo de manera bastante positiva hasta ahora. El nuevo Siri que utiliza tecnología de Google Gemini tendrá una protección sustancial de la privacidad (en el dispositivo y en la nube privada y un almacenamiento mínimo de datos) y tampoco costará más a los usuarios. Con esto disponible, y si la calidad está a la altura de las expectativas, el uso habitual de ChatGPT y Claude por parte de los consumidores también puede estar en riesgo.

Conclusión

Mire este espacio, porque si bien las historias de “empresas conmocionadas por los proyectos de ley de IA” y “OpenAI y Anthropic shooting para las OPI más grandes de la historia” a menudo se informan por separado, en realidad son la misma narrativa desde diferentes ángulos. Incluso si las empresas de tecnología sienten que la IA les está brindando beneficios y aumentos de productividad, simplemente no tienen presupuestos ilimitados para aplicarla. Si no tienen presupuestos ilimitados (y los consumidores ciertamente no los tienen, con los precios de los CPG ejerciendo presión sobre los presupuestos y el sentimiento económico más bajo en casi un siglo de seguimiento), tenemos que volver y preguntarnos de dónde vendrán los miles de millones que OpenAI, Anthropic y otros esperan generar en ingresos. Combine esto con el rechazo público contra los centros de datos y el sentimiento negativo sobre la IA en general, y los hiperescaladores tienen un problema real entre manos.

Lea más de mi trabajo en www.stephaniekirmer.com

Lectura adicional

https://medium.com/@s.kirmer/can-we-save-the-ai-economy-b431b1f62f93

https://medium.com/@s.kirmer/the-llm-gamble-cc434c5a9f54

https://www.businessinsider.com/disney-ai-push-increase-velocity-tech-employees-tokenmaxxing-josh-damaro-2026-6

https://www.businessinsider.com/ai-spending-roi-concerns-tokenmaxxing-uber-coo-andrew-macdonald-reaction-2026-5

https://gizmodo.com/big-tech-is-quietly-admitting-that-if-it-wants-to-sell-people-on-ai-it-better-be-cheap-2000768710

https://tech.yahoo.com/ai/articles/amazon-latest-tech-giant-face-212500092.html

https://www.inc.com/georgia-fearn/palantir-ceo-just-accused-ai-labs-of-tokenmaxxing-at-corporate-companies-expense/91359321

https://www.businessinsider.com/meta-google-jpmorgan-make-ai-performance-reviews-goals-raises-promotions-2026-3

https://www.theverge.com/tech/949502/apple-macos-27-golden-gate-siri-ai-apple-intelligence

https://www.theverge.com/tech/947432/siri-ai-apple-intelligence-ios-27-wwdc

https://gizmodo.com/americans-are-starting-to-really-hate-data-centers-and-its-making-the-tech-industry-nervous-2000767088

https://gizmodo.com/companies-are-getting-burned-by-burning-tons-of-tokens-2000765232