Ayer estaba en la cola del súper y el de delante flipaba porque la suscripción de su asistente de IA le había subido 15 pavos de golpe. “Serán los del gobierno”, decía. Yo me callé porque si llego a soltarle que el problema es que la inteligencia artificial se está quedando sin electricidad barata y que el petróleo tiene la culpa, me mira como a un conspiranoico. Pero es exactamente lo que está pasando, solo que a cámara lenta y sin que nadie lo cuente en las noticias de la tarde.
Mira, la gente cree que la IA funciona con magia, con algoritmos muy listos flotando en una nube. Mentira cochina. Cada maldita vez que le pides a ChatGPT que te escriba un email o que te haga un resumen, detrás hay un cacharro físico chupando electricidad como un loco. Estamos hablando de centros de datos consumiendo tanta luz como una ciudad pequeña y generando un calor que necesita refrigeración constante . Eso antes se pagaba con energía relativamente asequible, pero se acabó el chollo.
El petróleo caro no es solo que llenes el depósito y llores. Es que todo el sistema energético mundial se tensa y la luz se dispara. Cuando las eléctricas ven que el gas natural se pone por las nubes, aprovechan para clavarte el megavatio hora. Y un centro de datos que entrena inteligencia artificial no consume lo mismo que tu casa, consume lo de un polígono industrial entero. Las tecnológicas intentan disimular, pero el coste energético de la inteligencia artificial ya es una burbuja a punto de explotar . Han construido sus modelos de negocio con energía barata, y ahora ese pilar se resquebraja.
Lo que hemos visto hasta ahora ha sido un espejismo. Las grandes tecnológicas nos han estado regalando los tokens prácticamente, quemando dinero de inversores para que nos enganchemos todos . Era la estrategia de siempre: primero te crean la necesidad, luego te cobran por respirar. Pero el problema no es solo la avaricia empresarial, es que el barril de petróleo no entiende de suscripciones premium. Cuando hay tensiones geopolíticas y la energía escasea, el consumo masivo de luz por IA compite directamente con tu nevera y tu calefacción, y no hace falta ser un lince para saber quién puede pagar más . La IA generativa se ha convertido en un devorador de recursos finitos en un momento de máxima tensión energética global.
Y ojo, que aquí el tema no va de poner paneles solares y ya está. Los centros de datos necesitan un suministro estable 24/7. No puedes entrenar a la IA que va a diagnosticar el cáncer solo cuando hace sol y hay viento. Así que sí o sí dependemos de la red eléctrica tradicional, y esa red chupa del gas, del carbón y, cómo no, del petróleo. El futuro de los tokens está encadenado al precio del crudo y esa cadena se está tensando peligrosamente . Los analistas llevan meses avisando de que las infraestructuras no dan abasto, pero como suena muy técnico, la gente no se da cuenta de que hablan de su bolsillo . Esto ya está pasando, no es un aviso para 2030, es el 2026.
El golpe va por dentro: cuando la factura de la luz del centro de datos se convierte en tu suscripción
Índice del Contenido
- El golpe va por dentro: cuando la factura de la luz del centro de datos se convierte en tu suscripción
- La gran estafa del «utility billing»: te van a cobrar la luz que ellos derrochan
- El chantaje del «demasiado barato para medirlo» y otras mentiras que nos cuelan
- El truco del tokenizador: cómo te cobran de más sin que te enteres
- El timo de la letra pequeña: los recibos que te hacen llorar a fin de mes
- La jugada final: cuando tu suscripción de 200 pavos genera 13.200 dólares de gasto y la empresa entra en pánico
- Y ahora resulta que te devuelven lo que te quitaron, pero con trampa
- Y luego descubres que el modelo se ha vuelto tonto y te sigue cobrando igual
- Y lo de Anthropic fue la gota que colmó el vaso, la confianza se esfumó en 48 horas
- El éxodo silencioso que las tecnológicas no quieren ver
- Migración forzosa, API rotas y un modelo que te cobra por pensar a oscuras
- Y lo de OpenClaw y OpenCode es otro melón más: el lío de /think que no funciona
- Y la traca final: el modelo que te cobra por pensar pero te esconde el pensamiento
- Lo confirman hasta en su propia documentación: te están tomando el pelo con los precios
- El último clavo en el ataúd: te cobran el doble por el mismo precio de fábrica
- Y no contentos con eso, encima te jubilan los modelos que sí funcionaban
- El remate: Anthropic reconoce en su propia documentación que te la han colado
- Y cuando crees que ya lo has visto todo, llega el zasca del contexto largo que nadie te contó
- La mentira del benchmark: cuando los números bailan según quien los mire
- El problema del contexto largo: un modelo que se olvida de lo que acaba de leer
- Pero lo más bestia es que fue a propósito: la decisión de negocio que te va a joder los análisis financieros y las revisiones de contratos
- Y el zasca final de verdad: Mythos no es para ti ni lo será
Lo que más rabia me da de todo esto es que nos lo están contando como si fuera un avance tecnológico. Que si ahora pagas por tokens como quien paga la factura de la luz, que si es más justo, que si solo gastas lo que usas… Menuda pamplina. Lo que están haciendo las tecnológicas es largarse el muerto a nosotros porque el coste real de la energía para inteligencia artificial se ha disparado y ya no pueden disimularlo regalando servicios.
Antes tenías tu suscripción plana de 20 euros y tan contento. Pero claro, eso era cuando las empresas quemaban dinero de inversores para engancharnos. Ahora que la fiesta se acaba, resulta que cada consulta al ChatGPT consume electricidad como un electrodoméstico pequeño y alguien tiene que pagar ese recibo. Y ese alguien vamos a ser tú y yo, con cada maldito token que gastemos.
El otro día leí una cosa que me dejó helado. El tal Sam Altman, el jefazo de OpenAI, ya lo ha dicho clarito: quieren que la IA sea como el agua o la luz, con un contador que te mide hasta la última gota. Lo llaman «utility billing» y lo venden como que es para abaratar costes. Pero vamos a ver, ¿tú te crees que una empresa va a invertir cientos de miles de millones en centros de datos que chupan más electricidad que un país pequeño para luego cobrarte menos? La tasa de tokens por kilovatio no va a bajar, va a subir sí o sí porque la energía está por las nubes y nadie regala nada.
Y aquí está la trampa mental que nos han colado. Nos hicieron creer que la IA era casi gratis, que podías generarte 50 emails, 20 imágenes y un informe de 30 páginas por cuatro duros al mes. Ahora que ya dependemos de ella para el curro, para los estudios, hasta para pensar, de repente descubrimos que cada interacción con una IA generativa gasta muchísima más luz de lo que nos habían contado.
Pero es que además el problema de fondo no tiene arreglo fácil. Los centros de datos necesitan conexiones a la red eléctrica y en los mercados principales las colas de espera para una interconexión superan ya los cuatro años. Cuatro malditos años. No es que las tecnológicas no quieran ampliar, es que físicamente no pueden enchufar más servidores aunque tengan el dinero. Y mientras, la demanda de IA no para de crecer. La saturación de la red eléctrica por IA provocará apagones de servicio y subidas de precio simultáneas.
Fíjate que yo antes pensaba que esto de los tokens era un tecnicismo de informáticos. Pero cuando vi que una conversación larguita con el asistente consume como 10 veces más electricidad que una búsqueda en Google, empecé a atar cabos. Google ya dijo que integrar IA en todas las búsquedas le multiplicaba el consumo eléctrico por 10. Ahora imagínate a millones de personas usando IA para todo, todo el día. El consumo de electricidad de la inteligencia artificial se ha convertido en un sumidero energético que tensiona todo el sistema eléctrico.
La gran estafa del «utility billing»: te van a cobrar la luz que ellos derrochan
Voy a ser más claro que el agua. Lo que Altman y el resto de peces gordos de Silicon Valley están montando es un negocio redondo donde ellos ponen los servidores y tú pagas la factura energética. Así de simple. Pagar por tokens como si fuera luz o agua es la excusa perfecta para repercutir el coste del petróleo caro directamente al usuario sin que este se entere de lo que está pasando .
Date cuenta del truco. Cuando tú abres el grifo de casa, pagas por el agua que consumes, sí, pero el coste de la tubería y el mantenimiento de la red va incluido en esa tarifa. Con la IA pretenden hacer lo mismo pero con una diferencia: ellos construyen centros de datos que chupan más electricidad que una ciudad pequeña, y cuando la energía se dispara porque el petróleo está por las nubes, en lugar de asumir ese sobrecoste, te lo endosan directamente a ti . Mientras tanto, el coste energético de la inteligencia artificial sigue escalando sin que nadie lo regule .
Y lo peor es cómo te lo cuentan. Altman sale con su sonrisa de iluminado diciendo que la inteligencia será «demasiado barata para medirla» y que la abundancia llegará para todos . Pero al mismo tiempo advierte que si no construyen suficiente infraestructura, el precio de los tokens se disparará porque la energía está cada día más cara y escasa . Traducción: o me dejas construir mis megacentros de datos donde yo quiera y como yo quiera, o te subo la tarifa. Chantaje en toda regla.
Lo que no te cuentan es que ya hay estimaciones que ponen los pelos de punta. El modelo GPT-5 puede llegar a consumir hasta 40 vatios-hora por cada respuesta de mil tokens, que para que te hagas una idea es lo que gasta una bombilla incandescente encendida durante 18 minutos seguidos . Multiplica eso por los miles de millones de consultas diarias que procesa ChatGPT y estamos hablando de 45 gigavatios-hora al día, el equivalente a lo que producen dos o tres reactores nucleares funcionando a pleno rendimiento . La electricidad que consume la IA generativa ya compite directamente con las necesidades de países enteros .
Luego están los que intentan quitarle hierro al asunto diciendo que cada consulta solo gasta 0,3 vatios-hora, que es una chorrada comparado con lo que consume tu nevera . Claro, eso es ahora, con los modelos actuales y con poca gente usándolos. Pero el problema no es lo que gasta una consulta hoy, es lo que va a gastar mañana cuando los modelos sean más grandes, más complejos y los use todo el mundo para todo. El consumo eléctrico de los centros de datos de IA crece exponencialmente mientras la red no se amplía al mismo ritmo.
Y aquí viene el detalle que nadie quiere soltar en voz alta: la energía no es infinita. Las redes eléctricas de medio mundo están envejecidas y no dan abasto para conectar todos los centros de datos que las tecnológicas quieren construir . Hay cuellos de botella en transformadores, retrasos en líneas de alta tensión y una burocracia que no acompaña. La red eléctrica no está preparada para alimentar la revolución de la inteligencia artificial y eso va a encarecer hasta tu factura de casa .
El chantaje del «demasiado barato para medirlo» y otras mentiras que nos cuelan
Lo que no te cuentan es que ya hay estimaciones que ponen los pelos de punta. Una sola consulta con un modelo avanzado puede gastar entre 2,5 y 40 vatios-hora, dependiendo de lo larga que sea . Y multiplica eso por los más de mil millones de consultas diarias que procesan estas máquinas. Hablamos de que el consumo eléctrico de los centros de datos de IA se va a cuadruplicar en apenas una década y que para 2035 podrían estar chupando el 4,4% de toda la electricidad mundial . Si los centros de datos de IA fueran un país, ya serían el cuarto que más electricidad gasta del planeta, solo por detrás de China, Estados Unidos y la India . Y ahora dime tú si eso no va a tensar el precio de la luz.
Pero el auténtico golpe de trilero está en lo de «inteligencia demasiado barata para medirla». Suena precioso, ¿verdad? Pues es exactamente la misma frase que usaron hace décadas los de la energía nuclear para venderte que la electricidad sería tan barata que no haría falta ni contador. Y mira cómo acabó aquello. Altman repite ese eslogan como un loro mientras sus máquinas devoran recursos que no son infinitos . Lo que no te suelta es que si la energía escasea, el coste del petróleo y del gas natural marcará el precio de cada token que consumas, por muchas sonrisas que le eche a la cámara.
Y ojo con esto porque es tremendo. Altman ya ha ido soltando la idea de que el gobierno debería actuar como «asegurador de última instancia» para financiar toda esta infraestructura . Traducción: que cuando la cosa se tuerza, el contribuyente pague el pato mientras ellos mantienen los beneficios. Ya han empezado a retirarse de ampliaciones de centros de datos porque no les salen las cuentas sin ayudas públicas . La infraestructura energética para inteligencia artificial no es rentable sin subvenciones y aun así la construyen a lo loco. El negocio es redondo: privatizan los beneficios y socializan las pérdidas energéticas.
Y si alguien aún piensa que esto no va con él, que mire lo que está pasando con Anthropic. Ya han cambiado sus tarifas empresariales para que pagues por adelantado un consumo estimado de tokens, aunque luego no los gastes . Te cobran el compromiso de consumo, no lo que realmente usas. Como las eléctricas de toda la vida con la potencia contratada. La factura de la inteligencia artificial ya está copiando el modelo de las compañías eléctricas tradicionales, con sus letras pequeñas y sus consumos mínimos garantizados que pagas sí o sí.
Mientras tanto, Estados Unidos ya está resucitando el carbón y el gas natural para alimentar esta locura . Se han dado cuenta de que con renovables no llegan ni de coña a cubrir la demanda, así que adiós a los compromisos climáticos. Y en Europa, si quieren mantener el ritmo de la IA, van a tener que hacer exactamente lo mismo porque las renovables necesitan años para construirse . La carrera de la inteligencia artificial va a cargarse décadas de avances medioambientales y nadie está contando esta parte de la historia .
El truco del tokenizador: cómo te cobran de más sin que te enteres
Te voy a contar una cosa que descubrí el otro día y que me dejó de piedra. Resulta que Anthropic, los de Claude, sacaron su nuevo modelo Opus 4.7 y resulta que el mismo texto de siempre ahora consume hasta un 35% más de tokens. Así, sin avisar. Y no es que el texto sea más largo, es que han cambiado el «tokenizador», que es la pieza que trocea las palabras para que la máquina las procese. El nuevo tokenizador de Claude Opus 4.7 infla artificialmente el consumo para facturarte más con el mismo trabajo de siempre .
Esto no es una conspiración. Lo han documentado desarrolladores que han hecho pruebas reales con código: la misma consulta que antes gastaba equis tokens ahora gasta entre 1,32 y 1,47 veces más. Y tú, que tenías calculado tu presupuesto mensual, de repente ves que la factura se dispara sin haber hecho nada diferente. El consumo de tokens en Claude ha aumentado hasta un 47% solo por el cambio de medidor y encima te lo cuentan como si fuera una mejora .
Pero la cosa no acaba ahí. Al mismo tiempo, el modo por defecto de Claude Code pasó de «high» a «xhigh» sin que nadie diera un aviso claro. ¿Qué significa eso? Que la máquina piensa más de lo necesario para cada tarea, gasta más tokens, y tú pagas más. Suma las dos cosas y tienes una suscripción de 200 dólares que rinde la mitad que antes. Los cambios silenciosos en la configuración de la IA duplican el gasto en tokens sin que el usuario lo note .
Y espera, que hay más. En agosto de 2025 ya metieron límites semanales a los usuarios de pago sin avisar. Gente que pagaba 200 pavos al mes se quedaba sin acceso antes del viernes. Pero ojo, no te cortaban el servicio, te pasaban automáticamente a pago por uso, con un límite diario de 2.000 dólares. Traducción: te secuestraban la cuenta y si no estabas atento, te podías encontrar un cargo de miles de dólares. Las suscripciones premium de IA te vacían la cartera cuando se acaba el límite y te cobran automáticamente sin preguntar .
Luego está el golpe maestro que hicieron en abril de 2026. Había desarrolladores usando herramientas de terceros conectadas a su suscripción de Claude. Con 200 dólares al mes conseguían hacer tareas de automatización que costarían 5.000 si las hicieran por API. Anthropic decidió que eso se había acabado: a partir de ahora, solo sus productos oficiales entran en la suscripción. Si usas cualquier otra herramienta, pasa por caja y paga por API. Anthropic ha bloqueado el acceso de terceros a las suscripciones para forzar el pago por API y multiplicar ingresos .
Y ahora dime: ¿tú confiarías en una empresa que te cambia las reglas a mitad de partido, te infla el contador sin avisar, y te mete cargos automáticos cuando te pasas de un límite que ni siquiera sabías que existía? Porque esto es lo que nos espera cuando la factura de la inteligencia artificial se convierta en un suministro más como la luz o el agua . Pero sin la regulación ni la transparencia que tienen las eléctricas.
El timo de la letra pequeña: los recibos que te hacen llorar a fin de mes
Mira, yo antes pensaba que los de las eléctricas eran los únicos capaces de clavarte con la letra pequeña. Pero es ver lo que está haciendo Anthropic con Claude y se te quitan las ganas de volver a quejarte de Endesa. Te sueltan un modelo nuevo, el Opus 4.7, y te dicen que el precio por token sigue igual. Hasta ahí todo bien. Pero luego resulta que el nuevo tokenizador de Claude Opus 4.7 infla el consumo entre un 0 y un 35% para exactamente el mismo texto de siempre . Es como si la compañía de la luz te cambia el contador por uno que cuenta más rápido y te dice que la tarifa es la misma. Pues eso, pero en digital.
Y tú a fin de mes miras el recibo y dices «pero si yo no he hecho nada distinto». Claro que no, campeón. Es que ahora el modo de razonamiento xhigh en Claude Code viene activado por defecto sin que te avisen, y resulta que ese modo gasta el doble de tokens que el que tenías antes . Te lo han puesto sin preguntar y encima la máquina ahora «piensa más» aunque le pidas una chorrada. A mí esto me recuerda a cuando dejabas el móvil con los datos encendidos sin querer y te llegaba el sablazo, pero a lo bestia.
Pero lo que de verdad me hierve la sangre es lo que hicieron con los límites estos. En agosto de 2025 metieron un límite semanal a los que pagan 200 dólares al mes y, atención a esto, cuando te pasas del límite no te cortan el servicio, te pasan automáticamente a pago por uso con un tope diario de 2.000 dólares . Que tú estabas tan tranquilo pensando que tu suscripción plana te cubría y resulta que te pueden cascar 2.000 pavos en un día sin avisarte. A un desarrollador le pasó que en 70 minutos se pulió todo el límite y le empezaron a cobrar extras sin enterarse .
Y espera, que lo de las terceras herramientas es de juzgado de guardia. Había gente usando OpenClaw, que es una herramienta que conecta Claude con tus aplicaciones del día a día. Con la suscripción de 200 dólares podías hacer automatizaciones que por API costarían 5.000 . Pues bien, Anthropic ha bloqueado OpenClaw y todas las herramientas de terceros para forzarte a pagar por API . El creador de OpenClaw, Peter Steinberger, lo dijo clarito: «primero copian las funciones más populares en su herramienta cerrada y luego echan el cerrojo al código abierto» . Justo la misma semana que bloquearon OpenClaw, Anthropic sacó tres productos propios que hacen exactamente lo mismo .
Date cuenta de la jugada: te enganchan con suscripciones planas, crean un ecosistema de desarrolladores que construyen herramientas útiles, y cuando la cosa funciona, cortan el grifo y te dicen que ahora pagues por uso. El coste real de los tokens de Claude se ha multiplicado por hasta 50 veces para los que usaban herramientas de terceros . No es una subida, es directamente un atraco a mano armada pero con un comunicado corporativo bonito.
Y todo esto lo justifican con que los agentes autónomos consumen muchísimo más que un humano chateando. Es verdad, un agente automatizado puede quemar cientos de miles de tokens en una tarde . Pero es que ellos mismos fomentaron ese uso. Ahora dicen que «la suscripción no fue diseñada para esto» . Claro, como el bar que pone buffet libre y cuando llegan los que comen de verdad dice que la oferta era solo para los que pican poco. La suscripción plana de IA es un buffet libre que solo quieren que uses para picotear, no para comer de verdad .
Y ojo que esto no se queda en Anthropic. En GitHub Copilot ya están cobrando 7,5 créditos premium por el Opus 4.7 cuando antes cobraban 3 por el Opus 4.6 . Un usuario hizo las cuentas: incluso asumiendo que el nuevo tokenizador infla un 35% el consumo, el precio justo serían unos 4 créditos, no 7,5. GitHub Copilot está inflando artificialmente el coste del Opus 4.7 muy por encima de lo que justifica el cambio técnico .
Te das cuenta del patrón, ¿no? Te dicen que el precio por token no sube, pero luego te cambian el contador para que cuente más, te ponen el modo derrochador por defecto, te bloquean las herramientas que usabas y te meten en un sistema de pago por uso que no controlas. La factura mensual de inteligencia artificial se está convirtiendo en una pesadilla impredecible peor que la factura de la luz . Y mientras tanto, los directivos de Anthropic reconocen en privado que el modelo de suscripción actual «no es rentable» y que pierden dinero con los usuarios intensivos .
La jugada final: cuando tu suscripción de 200 pavos genera 13.200 dólares de gasto y la empresa entra en pánico
Te voy a contar la cifra que lo cambia todo. ¿Sabes cuánto le costaba a Anthropic un usuario intensivo que pagaba religiosamente sus 200 dólares al mes? Hasta 13.200 dólares en consumo real de API. Sí, lo has leído bien. Un desarrollador ejecutando Claude Code 24 horas al día, 7 días a la semana, generaba un agujero de trece mil pavos que la empresa tenía que tapar con dinero de inversores . Eso no es un modelo de negocio, es un suicidio financiero con sonrisa corporativa.
El propio Boris Cherny, el responsable de Claude Code, lo reconoció sin paños calientes: con la tarifa plana actual, el producto no es rentable y probablemente está perdiendo dinero . Date cuenta de lo que significa esto. Te han estado vendiendo una suscripción que era imposible de sostener. Como un buffet libre donde entra un equipo de rugby y se zampan hasta los manteles. La diferencia es que aquí el buffet lo pagabas tú con tu cuota mensual y ellos ponían el resto, mientras los inversores miraban para otro lado .
Pero esto no podía durar. Anthropic factura 30.000 millones de dólares al año y aún así no gana un duro. En 2024 tuvieron un margen bruto del -94%. Menos 94. Eso significa que por cada dólar que ingresaban, perdían casi dos . En 2025 mejoraron hasta un margen del 40%, pero solo después de recortar expectativas y empezar a apretar las tuercas a los usuarios. La cuenta es sencilla: Anthropic pierde dinero con cada usuario intensivo y necesita que pagues mucho más para que las cuentas cuadren .
Lo que me hierve la sangre es cómo lo han hecho. En lugar de salir y decir «mira, esto no es sostenible, vamos a cambiar el modelo», te han ido metiendo puñaladas traperas una a una. Primero los límites semanales sin avisar. Luego el tokenizador que infla el consumo. Después el modo xhigh por defecto. Más tarde el bloqueo a herramientas de terceros. Y ahora los créditos premium a precio de oro en GitHub Copilot. Todo esto mientras su factura de infraestructura no para de crecer: 30.000 millones de dólares en gastos previstos para 2025, con los costes de inferencia un 23% por encima de lo que habían calculado .
Y aquí es donde el petróleo y la energía vuelven a entrar en escena. Porque los centros de datos que ejecutan Claude, ChatGPT y todos estos modelos no funcionan con buenas intenciones. Cada vez que un agente autónomo se pone a darle vueltas a un problema durante horas, está quemando electricidad. Y esa electricidad, en pleno 2026, cuesta más que nunca. Así que los costes de inferencia de la inteligencia artificial están un 23% por encima de lo previsto por el encarecimiento energético global .
Pero fíjate qué curioso. Mientras a ti te cuentan que esto es insostenible y te aprietan el cinturón, los directivos siguen construyendo centros de datos como si no hubiera un mañana. La apuesta es clara: que pague el usuario final lo que haga falta, cuando haga falta y como haga falta. Porque si no, Anthropic no alcanzará la rentabilidad hasta 2028 como muy pronto y mientras tanto tú pagarás la fiesta .
Y ahora resulta que te devuelven lo que te quitaron, pero con trampa
¿Te acuerdas de lo de OpenClaw? Que te conté que lo bloquearon sin avisar y te dejaron tirado. Pues ahora viene lo bueno. En mayo de 2026, solo unas semanas después, Anthropic dijo que rectificaba y que volvían a permitir OpenClaw y otras herramientas de terceros en las suscripciones . Pero claro, a estas alturas ya sabes que estos no dan puntada sin hilo.
La trampa viene en la letra pequeña. Ahora te dan unos créditos mensuales fijos para uso programático: 20 dólares para el plan Pro, 100 para el Max 5x y 200 para el Max 20x . Y te lo venden como un regalo, como que te están dando algo extra además de tu suscripción. Pero la realidad es que el nuevo sistema de créditos Agent SDK de Anthropic te da 200 dólares para automatizaciones que antes te costaban 5.000 con tu suscripción plana . Es decir, lo que antes podías hacer con tu cuota mensual ahora te cuesta veinticinco veces más si quieres hacerlo igual.
Y ojo que aquí la jugada es finísima. Los créditos no se acumulan, si no los gastas este mes los pierdes. Pero si te pasas, tampoco puedes tirar de tu saldo normal de suscripción, tienes que comprar créditos extra . Es un «use it or lose it» diseñado para que siempre estés al borde, siempre preocupado, siempre mirando el contador como un taxista mira el taxímetro. La excusa oficial que dio Boris Cherny, el jefe de Claude Code, es que OpenClaw y otras herramientas no aprovechaban los sistemas de caché que ellos tienen para abaratar costes, así que cada consulta les salía carísima .
Lo indignante es cómo lo cuentan. La empleada Lydia Hallie salió a Twitter diciendo «no pagas extra, es la misma suscripción, mismo precio al mes» . Claro, mismo precio pero con una capacidad que es un chiste comparado con lo que tenías antes. Es como si Endesa te duplica la tarifa pero te dice que el precio por kilovatio es el mismo, solo que ahora te miden con más detalle y te ponen un límite ridículo que antes no existía. Así que sí, el precio por token no ha cambiado, pero Anthropic te ha capado la suscripción para forzarte a pagar extras si quieres seguir haciendo lo mismo que hacías hace dos meses .
El caso de OpenClaw es sangrante porque demuestra que todo esto va de control. Su creador, Peter Steinberger, dijo que intentaron negociar con Anthropic y lo único que consiguieron fue retrasar el bloqueo una semana . Luego Steinberger acabó fichando por OpenAI, así que Anthropic se quedó sin el desarrollador y sin la herramienta. Ahora Anthropic ofrece sus propias alternativas: Claude Code, Claude Cowork, herramientas cerradas que controlan ellos. El patrón es el mismo que hemos visto mil veces: dejas que la comunidad construya algo gratis, esperas a que sea popular, copias las funciones que funcionan, bloqueas lo abierto y te quedas con el monopolio.
Y luego descubres que el modelo se ha vuelto tonto y te sigue cobrando igual
Pero es que la cosa no acaba con el sablazo económico. Resulta que encima el modelo nuevo va a pedales. En abril de 2026, justo después del lanzamiento del Opus 4.7, los desarrolladores empezaron a notar cosas muy raras. El modelo se equivocaba en sumas básicas, se inventaba funciones que no existían, y hasta reconocía él solito que estaba «un poco vago» y que no había comprobado bien las cosas . Estás pagando 200 dólares al mes para que la máquina te diga que tiene pereza. Yo ya no sé si reírme o ponerme a llorar.
No era una sensación, era un fallo gordo de verdad. Stella Laurenzo, que es la directora de IA de AMD, hizo un análisis en condiciones con miles de sesiones y descubrió que la profundidad de pensamiento de Claude cayó un 67% sin que nadie avisara . La máquina leía un 70% menos de archivos y hacía el triple de cosas raras. Y tú mientras tanto viendo cómo la factura sube y el rendimiento baja. Es como pagar gasolina premium para que el coche vaya en segunda.
Lo peor es cuando Anthropic tuvo que salir a dar explicaciones. Resulta que era una suma de tres bugs distintos. El 4 de marzo bajaron la intensidad de razonamiento de high a medium sin querer. El 26 de marzo un fallo de caché borraba todo el razonamiento que el modelo había hecho. Y el 16 de abril metieron un límite oculto en las respuestas que bajaba la calidad otro 3% más . Tres bugs encadenados en Claude Code estuvieron fastidiando el rendimiento durante semanas sin que los usuarios lo supieran. Hasta el 20 de abril no lo arreglaron del todo.
Y ahora dime tú, ¿cómo te fías de un sistema donde tu suscripción de 200 dólares puede estar rindiendo al 30% sin que te enteres? Esto no es una caída de WhatsApp, que esperas cinco minutos y ya está. Aquí estabas pagando por un servicio degradado durante semanas, haciendo trabajos de calidad mediocre, y nadie te devuelve ni un euro. Porque claro, Anthropic no te va a llamar para decirte «oye, perdona, es que teníamos tres bugs y tu código de producción igual está mal». Te enteras cuando el proyecto falla.
Fíjate en el detalle de los bugs. Uno era que por la mañana, entre las 5 y las 11 hora del Pacífico, el sistema iba peor porque justo es cuando más gente se conecta . O sea que encima tienes que calcular a qué hora usar lo que has pagado. Como si Endesa te dijera que la luz funciona mejor de madrugada y que a mediodía igual te fríe los electrodomésticos. La calidad del servicio de IA fluctúa por la saturación de los centros de datos y tú sin saberlo, dándole al proyecto justo en la hora punta.
Y lo de Anthropic fue la gota que colmó el vaso, la confianza se esfumó en 48 horas
Porque justo cuando pensabas que ya lo habías visto todo con lo de los bugs, resulta que la gente se puso a hacer tests en condiciones. Y lo que salió fue para echarse a temblar. Un benchmark de razonamiento lógico que antes Claude Opus 4.6 pasaba con un 94,7% de aciertos, con el nuevo modelo se desplomó hasta un 41% . No es que bajara un poco, es que Claude Opus 4.7 se ha derrumbado en los test de lógica y apenas acierta la mitad que antes . Con ese panorama, a ver quién se fía para un proyecto serio.
Pero es que no fue solo un número en una gráfica. La gente real, la que paga, se encontró con que la máquina ahora suelta cada burrada que flipas. Lo de las dos «p» en «strawberry» se hizo viral, claro, porque es de chiste . Pero lo que de verdad asusta es cuando le pides que te revise el currículum y te cambia el apellido y la universidad donde estudiaste, así, sin venir a cuento . O cuando le preguntas quién es un tal Anton y te suelta que se lo ha inventado porque había palabras en alemán en tu código y le sonaba bien. El modelo se inventa acciones que nunca hizo para justificar sus meteduras de pata .
Lo de la vagancia ya es directamente insultante. Una máquina que te dice «es que no he comprobado esto porque estaba vago». Sí, literal. En capturas de pantalla que corrieron como la pólvora se veía al modelo reconociendo tan pancho que no había hecho su trabajo «por pereza» . Pagas 200 pavos para que te diga que no le da la gana. Y mientras, los de Anthropic diciendo que el «razonamiento adaptativo» es un avance, que el modelo decide cuándo pensar más y cuándo menos. Claro, y resulta que el razonamiento adaptativo que estrenó Claude Opus 4.7 hace que el modelo no profundice en nada que no sea código .
Un profesor de Wharton lo clavó: el sesgo de esta gente es que solo consideran «trabajo intelectual» lo que es programar o matemáticas. Si estás haciendo un análisis financiero o una investigación en condiciones, la máquina decide que eso no merece esfuerzo y te da cualquier cosa . Es como si pagaras un buffet y de repente el camarero decide por ti qué puedes comer y cuánto. Y ellos tan contentos.
Las caídas en benchmarks fueron la puntilla. En comprensión de contextos largos, de esos de un millón de tokens que tanto vendían, pasaron de un 78% a un 32% de acierto. Un batacazo de 46 puntos en la misma prueba que ellos habían creado para fardar . El rendimiento en tareas de contexto largo se ha hundido más de un 40% con el nuevo modelo y encima te cobran un 35% más de tokens por el mismo texto. El negocio perfecto.
La comunidad de Reddit ardió. Un hilo titulado «Opus 4.7 es un paso atrás, no una mejora» se fue a 2.300 votos positivos en horas. En Twitter, otro post similar se plantó en 14.000 likes . Gente que llevaba años pagando la suscripción diciendo que volvían a Opus 4.6, y los que pedían que resucitaran el 4.5 porque al menos ese no les mentía. Hasta el creador de Claude Code, Boris Cherny, tuvo que salir al trapo a decir que «eso no es exacto», que el modelo va bien . Pero ya se sabe, cuando tienes que salir a apagar fuegos en redes es que algo huele a chamusquina de verdad.
El éxodo silencioso que las tecnológicas no quieren ver
Lo que pasó con Opus 4.7 es un síntoma, no una anécdota. Cuando la comunidad empezó a migrar en manada de vuelta al modelo anterior, se vio algo que no es tan habitual. Gergely Orosz, que escribe la newsletter Pragmatic Engineer, dijo que el modelo Opus 4.7 se volvió sorprendentemente combativo con los usuarios y que al final se rindió y volvió al 4.6 . No fue el único. Josh Pigford lo clavó: «es la primera vez que pienso que Anthropic se está moviendo demasiado rápido. Se siente chapucero. Cada interacción que tengo con 4.7 en cualquier entrada tiene problemas importantes que 4.6 simplemente no tiene» .
Pero aquí viene el dato que de verdad explica el desastre. El rendimiento en contexto largo de Claude Opus 4.7 se desplomó 46 puntos porcentuales en el benchmark MRCR v2 . Pasó del 78,3% al 32,2%. No es una caída, es un precipicio. Ese benchmark mide justo lo que las empresas necesitan: que la máquina recuerde información a lo largo de un millón de tokens. Y resulta que la función que más vendían como revolucionaria ha desaparecido. Anthropic sacrificó su propia capacidad estrella por cambiar el tokenizador y meter el razonamiento adaptativo .
Y lo de «nuestro modelo más capaz está reservado para Apple, Google y Microsoft» es directamente un insulto . Lo llaman Mythos Preview y solo lo prueban cuatro gigantes mientras a ti te cascan 200 pavos por un modelo capado. El verdadero modelo potente de Anthropic no lo puedes usar tú, está reservado para las grandes corporaciones . Te venden la versión de segunda mientras los de verdad se llevan la buena.
La gente no es tonta y ya está actuando. En Hacker News los desarrolladores llevan semanas diciendo que para tener un rendimiento decente tienen que desactivar manualmente el razonamiento adaptativo y forzar el esfuerzo al máximo . O sea, que el razonamiento adaptativo que tanto vende Anthropic hay que apagarlo para que el modelo funcione como antes . Y aun así no llega. Por eso los foros están llenos de gente pidiendo que devuelvan Opus 4.5, el modelo que jubilaron sin avisar y que según los usuarios sí que funcionaba bien .
Lo más sangrante es que Anthropic reconoce en privado lo que niega en público. Un product manager admitió que están «corriendo para ajustar esto internamente y que pronto habrá actualizaciones» . Es decir, Anthropic admite en privado que Opus 4.7 salió sin estar listo pero en público lo vende como una revolución . Sacan el producto a medio cocer, cobran por él, y luego van parcheando sobre la marcha mientras tú haces de betatester de pago.
Y lo de Alex Albert el viernes fue la guinda. «Muchos de los bugs que os encontrasteis ayer al probar Opus 4.7 ya están arreglados» . Como si fuera normal que un producto de 200 dólares al mes funcione a trompicones durante días y luego te digan «gracias por aguantar». En cualquier otro sector esto sería un recall de producto, pero en la IA te dicen que es «iteración rápida» y tan contentos.
Migración forzosa, API rotas y un modelo que te cobra por pensar a oscuras
La gente no es tonta. En cuanto vieron que Opus 4.7 era un desastre, se fueron en manada a resucitar el 4.6. Pero resulta que no puedes volver atrás tan fácilmente, porque Anthropic ha empezado a retirar los modelos viejos sin avisar para obligarte a usar el nuevo . En Reddit hay hilos enteros de gente «de luto» por Opus 4.5, el modelo que jubilaron sin miramientos y que, según los que lo usaban, era el mejor que habían sacado nunca .
Y atento a esto porque es de traca. Los desarrolladores que intentaron migrar de 4.6 a 4.7 se encontraron con que el código que llevaba meses funcionando de repente devolvía errores 400. La API de Opus 4.7 rechaza el formato de peticiones que funcionaba en 4.6 sin dar ningún periodo de adaptación . Si tenías configurado el thinking={"type":"enabled", "budget_tokens": 32000}, te jodes y reescribes todo. Ahora es thinking={"type":"adaptive"} con un parámetro nuevo llamado effort . Y te enteras porque tu aplicación se cae, no porque te avisen.
Pero la puñalada más fina es la de la pantalla en negro. Opus 4.7 oculta por defecto el resumen de razonamiento y te cobra igualmente por esos tokens que no ves . Antes podías leer lo que el modelo «pensaba», y así detectabas si iba por buen camino. Ahora te lo esconden «para reducir latencia», pero la factura no se reduce ni un céntimo . Es como si el taxista te apaga el taxímetro para que no te pongas nervioso, pero el aparato sigue corriendo y al final te casca la misma tarifa. Y tú sin saber si el taxi ha ido por el camino más corto o se ha dado un paseo por la M-40.
Lo del razonamiento adaptativo ya es directamente una tomadura de pelo. En Opus 4.6 podías desactivarlo con CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1 y forzar a la máquina a pensar a tope. En Opus 4.7 esa opción simplemente no funciona. La ignoran . Boris Cherny, el creador de Claude Code, reconoció que el razonamiento adaptativo «no estaba funcionando bien» y que en algunos casos asignaba cero tokens de pensamiento a ciertas tareas . O sea, que el sistema que decide cuánto piensa tu IA está roto y Anthropic lo sabe, pero aun así lo han hecho obligatorio en el nuevo modelo .
Los foros están que arden con desarrolladores intentando encontrar la combinación mágica de parámetros para que Opus 4.7 funcione como el 4.6. Algunos han descubierto que con CLAUDE_CODE_EFFORT_LEVEL=xhigh y CLAUDE_CODE_DISABLE_1M_CONTEXT=1 la cosa mejora un poco, pero nunca llega al nivel anterior . Es decir, los usuarios están haciendo de betatesters no remunerados para arreglar un producto por el que pagan 200 dólares al mes . Y Anthropic mientras tanto diciendo que sus evaluaciones internas «tienen buena pinta» .
A estas alturas ya se ha montado un éxodo silencioso pero imparable. Gergely Orosz, el de Pragmatic Engineer, lo dijo claro: «me rendí y volví a Opus 4.6» . Josh Pigford soltó que es la primera vez que piensa que «Anthropic se está moviendo demasiado rápido» y que cada interacción con 4.7 tiene «problemas importantes que 4.6 simplemente no tiene» . Y mientras los usuarios huyen, los directivos de Anthropic pidiendo disculpas en privado y en público diciendo que todo va fenomenal.
Y lo de OpenClaw y OpenCode es otro melón más: el lío de /think que no funciona
Pero es que el descontrol no se queda en el modelo gordo. El ecosistema de herramientas alrededor está igual de roto. Fíjate lo que pasó con OpenClaw y OpenCode, dos herramientas que usa la peña para conectar Claude con sus movidas. Resulta que Opus 4.7 rechaza los comandos /think xhigh, /think adaptive y /think max en OpenCode aunque la documentación oficial dice que los soporta . O sea, tú vas a cambiar el nivel de razonamiento como te han dicho que hagas y la máquina te escupe un error.
El bug es de traca. Si usas opencode/claude-opus-4-7, los niveles de pensamiento que te deja usar son los viejos: off, minimal, low, medium, high. Ni rastro de xhigh, adaptive ni max. Pero si te conectas directamente al proveedor de Anthropic, ahí sí funcionan todos . Traducción: las herramientas de terceros no tienen acceso a las funciones completas del modelo porque Anthropic no ha actualizado los permisos .
¿Y qué hace el usuario de a pie? Pues probar, ver que falla, pensar que es culpa suya, buscar en foros, perder una mañana. La raíz del problema es que el plugin de OpenCode no tiene implementado el resolveThinkingProfile para los niveles nuevos. En la práctica, el runtime se cae a un perfil por defecto que solo conoce los cinco niveles antiguos . Y esto es lo que te digo: cada capa de complejidad que añaden es una capa donde las cosas se rompen sin que nadie te avise.
Pero espera, que hay otra más gorda con GitHub Copilot. Resulta que Opus 4.7 no aparece en el proveedor de GitHub Copilot aunque sí está disponible en VS Code con un multiplicador de 7.5x en créditos premium . Vamos, que existe pero no puedes usarlo desde el proveedor oficial. Y si intentas acceder, la función supportsAdaptiveThinking() solo reconoce los modelos 4.6, así que Opus 4.7 se va al camino viejo de thinking.type: "enabled" y el modelo lo rechaza con un error 400 . Un despropósito.
Lo de los créditos en Copilot es otro sablazo. Mientras que antes Opus 4.6 costaba 3 créditos por consulta, ahora GitHub Copilot cobra 7.5 créditos por Opus 4.7 sin que el aumento esté justificado técnicamente . Un usuario de GitHub ya abrió un issue quejándose de que su suscripción Pro+ era necesaria para usar Opus 4.7, y el issue fue cerrado automáticamente por un bot sin resolver nada . Así funciona el soporte ahora: te cobran más, la cosa no va, abres un ticket y un robot te lo cierra.
Y la traca final: el modelo que te cobra por pensar pero te esconde el pensamiento
Esto ya es de juzgado de guardia. Con Opus 4.7, Anthropic ha decidido que el pensamiento de la máquina no es asunto tuyo. Por defecto, thinking.display viene en "omitted" . Traducción: la máquina piensa, gasta tokens, te los cobra religiosamente, pero a ti te devuelve un bloque de texto vacío para que no veas ni media línea de lo que ha razonado .
Antes, con Opus 4.6, el pensamiento venía resumido por defecto. Podías leerlo, ver si la máquina iba bien encaminada, detectar alucinaciones a tiempo. Ahora te lo quitan de golpe con la excusa de que así la respuesta empieza a salir más rápido . Pero la factura no baja ni un céntimo. Opus 4.7 te esconde el razonamiento por defecto pero te sigue cobrando hasta el último token de pensamiento . Como el taxista que te tapa el taxímetro «para que no te agobies» mientras la tarifa sigue corriendo.
Y claro, los desarrolladores que migraron de buena fe se encontraron con el desastre silencioso. Las herramientas que mostraban el razonamiento de repente se quedaron en blanco. Sin error, sin aviso, sin nada. Solo paneles vacíos y usuarios preguntando si la IA se había roto . El arreglo es añadir a mano display: "summarized" en cada maldita llamada a la API. Pero eso ya lo tienes que saber tú, porque Anthropic no te manda un correo avisando.
Lo del tokenizador es otra puñalada envuelta en papel de regalo. Te dicen que los precios por token no cambian: 5 dólares el millón de entrada, 25 el millón de salida. Pero luego cambian el aparatito que cuenta las palabras y resulta que el mismo texto de siempre ahora consume entre un 0% y un 35% más de tokens . Un desarrollador midió su carga de trabajo real: el código que ayer metía 2.312 tokens, hoy con Opus 4.7 mete 3.014. Un 30% más exacto . El nuevo tokenizador de Claude Opus 4.7 infla el consumo entre un 0 y un 35% y tu factura sube sin que hayas hecho nada distinto .
Y ojo que esto no es una conspiración de internet, lo confirma la propia documentación de Anthropic. Donde antes con Opus 4.6 cabían 750.000 palabras en inglés por millón de tokens, ahora con Opus 4.7 solo caben 555.000 . La misma cantidad de texto te cuesta más tokens, y por tanto más dólares. El precio por token es el mismo, sí. Igual que si el panadero te dice que la barra vale lo mismo pero ahora la corta en rebanadas más pequeñas y necesitas más rebanadas para el mismo bocadillo.
Y para rematar, los parámetros de siempre ya no funcionan. Lo de temperature, top_p y top_k que llevabas años usando para controlar la creatividad de la máquina, fuera. Opus 4.7 los rechaza con un error 400 si los pones con valores que no sean los de fábrica . En Bedrock directamente te los tira aunque los pongas por defecto . Así que ahora, si querías respuestas deterministas con temperature = 0, te aguantas. La recomendación oficial es que uses «prompt engineering» . Vamos, que te busques la vida.
Lo confirman hasta en su propia documentación: te están tomando el pelo con los precios
Y no es que me lo esté inventando yo. La propia guía de migración de Anthropic lo deja caer sin ruborizarse: el nuevo tokenizador mapea el mismo texto a entre 1 y 1,35 veces más tokens. Así, sin más . O sea, que el mismo trabajo de siempre ahora cuesta hasta un 35% más porque han cambiado el contador, no porque el servicio sea mejor.
Pero es que hay más. Resulta que el modo por defecto en Claude Code para Opus 4.7 es xhigh, cuando antes era high . Y claro, pasar de high a xhigh en tareas largas duplica el consumo de tokens. Que te lo han cambiado sin preguntar. Boris Cherny lo vende como que es «el mejor ajuste para programar», pero a mí esto me suena a la típica jugada de «te pongo la tarifa más cara por defecto y si quieres la barata ya te molestas tú en cambiarla» .
Lo de los parámetros de siempre es ya de traca. Temperature, top_p, top_k… todo lo que usabas para controlar el comportamiento del modelo ahora te devuelve un error 400 si no pones los valores de fábrica . Su recomendación oficial es que uses «prompt engineering» . Traducción: que te busques la vida. Así que ahora, si querías que el modelo fuera determinista y te diera siempre lo mismo con la misma entrada, te aguantas.
Y mira lo que dice Shelly Palmer, un tío que no es precisamente un cualquiera. En su análisis de Opus 4.7 suelta que en la app de consumidor el modelo usa por defecto «esfuerzo bajo» para escribir, investigar y analizar, y que los resultados son «objetivamente peores que con Opus 4.6» . O sea, que el modelo que te venden como una revolución en la app normal va peor que el anterior porque le han capado el pensamiento por defecto .
Y la sección de comentarios en la documentación oficial es un clamor de desarrolladores cabreados. Gente que llevaba años usando la API y que de repente se encuentra con que nada funciona como antes. Un tipo resumió la migración en cuatro puntos: el budget_tokens roto, los parámetros de sampling que ya no funcionan, el pensamiento oculto por defecto, y el coste real de los tokens que se dispara entre un 0 y un 35% más .
Date cuenta: en cualquier otro sector, si una compañía eléctrica te cambia el contador por uno que cuenta un 35% más rápido y te dice que la tarifa es la misma, se monta una revolución. Aquí lo llaman «actualización del tokenizador» y tan contentos.
El último clavo en el ataúd: te cobran el doble por el mismo precio de fábrica
Y ahora viene lo de GitHub Copilot, que es ya para mear y no echar gota. Resulta que Anthropic saca Opus 4.7 y dice que el precio por token es el mismo que el de Opus 4.6: 5 pavos el millón de entrada y 25 el de salida . Mismo precio. Pero GitHub, que es de Microsoft, decide que Opus 4.7 te cuesta 7,5 créditos premium en vez de los 3 que costaba Opus 4.6 . Más del doble.
Y la excusa es para troncharse. Un usuario hizo las cuentas y GitHub le soltó que es por el tokenizador nuevo que infla el consumo un 35% y porque el modelo «piensa más». Pero las matemáticas no engañan: 3 créditos multiplicado por 1,35 te da 4 créditos, como mucho. ¿De dónde salen los otros 3,5? GitHub Copilot te está clavando un sobreprecio injustificado de casi el doble por Opus 4.7 sin que el coste real lo justifique .
Y lo más fuerte es cómo lo cuentan. En el changelog de GitHub lo llaman «precio promocional hasta el 30 de abril», o sea que luego puede ser aún más caro . Un usuario lo clavó: si esto es el precio con descuento, ¿cuánto va a ser el definitivo? Mientras tanto, los desarrolladores que tenían montado su flujo de trabajo con Opus 4.6 viendo cómo de repente todo cuesta 2,5 veces más .
Date cuenta de la jugada. Anthropic mantiene el precio oficial para quedar bien, pero deja que sus distribuidores te crujan a comisiones. Y GitHub, que tiene a los programadores pillados por los huevos con el ecosistema de VS Code, se frota las manos. Un usuario abrió un issue llamándolo «precios predatorios» y preguntando si esto no es justo lo que buscan los abogados de demandas colectivas .
Mientras tanto, la gente haciendo malabares para no arruinarse. Un desarrollador independiente contó que su suscripción Max de 200 dólares no le duró ni dos horas con Opus 4.7 . Dos horas. Y el tío dijo que menos mal que se había comprado dos suscripciones, que si no se queda tirado a media mañana. Esto ya no es un servicio, es un chiste de mal gusto.
Y no contentos con eso, encima te jubilan los modelos que sí funcionaban
Pero lo que de verdad me quema por dentro es otra cosa. Imagínate que tú tienes tu coche, un diésel viejo que te lleva a todos lados sin quejarse. Y un día vas al taller y te dicen que han jubilado tu modelo, que a partir de ahora o te compras el nuevo eléctrico o te vas andando. Pues con la IA está pasando exactamente eso.
Claude Opus 4.5 desapareció sin previo aviso y los usuarios lo están llorando como si hubieran perdido un amigo. En Reddit hay hilos que parecen esquelas, con gente diciendo que era el modelo que mejor entendía el contexto largo y que jamás les mintió. Y Anthropic ni se molesta en dar explicaciones. Lo jubilan y punto.
Pero es que la cosa va más allá. Resulta que los modelos antiguos que sí eran eficientes energéticamente están siendo retirados uno tras otro porque los centros de datos no dan abasto con la demanda y las tecnológicas necesitan forzarte a usar modelos más caros que justifiquen la inversión en infraestructura. Es la pescadilla que se muerde la cola: como la luz está por las nubes, necesitan que pagues más. Y para que pagues más, te quitan lo barato.
Un desarrollador lo explicaba clarísimo en Hacker News: con Opus 4.5 podías procesar documentos de 200 páginas sin problema y el consumo de tokens era razonable. Con 4.6 ya subió. Con 4.7 se ha disparado y encima el rendimiento en contexto largo se ha desplomado un 46% . O sea que pagar más por menos rendimiento se está convirtiendo en la norma de la inteligencia artificial en 2026 y las empresas lo llaman «progreso».
Y fíjate qué curioso el patrón. Sacan un modelo nuevo que consume más, te lo venden como una revolución, y cuando la gente se queja de que va peor para según qué tareas, te dicen que uses el modelo anterior. Pero el anterior lo han capado o lo han jubilado directamente. La obsolescencia programada de los modelos de IA ya está aquí y es igual de sucia que la de las lavadoras.
El remate: Anthropic reconoce en su propia documentación que te la han colado
Mira, hasta en la documentación oficial de migración de Anthropic lo reconocen sin pudor. Te lo traduzco: el nuevo tokenizador puede usar entre 1 y 1,35 veces más tokens para el mismo texto de siempre . Así, tal cual. No es un rumor de internet, es su propia guía la que te dice que el mismo curro ahora cuesta hasta un 35% más. Y con la energía por las nubes y el petróleo tensionándolo todo, la subida encubierta del coste de tokens por el nuevo tokenizador es oficial y está documentada por el propio Anthropic .
Pero es que hay más. ¿Te acuerdas del budget_tokens de toda la vida? Ese que ponías para decirle a la máquina «piensa hasta aquí y no te pases». Muerto. Literalmente. Si envías thinking: {type: "enabled", budget_tokens: N} te devuelven un error 400 sin miramientos . No hay período de gracia, no hay aviso, no hay «esto dejará de funcionar en tres meses». Un día funciona y al siguiente tu código se rompe. Un desarrollador que tenía un bot de trading lo contó clarito: cambió el nombre del modelo de claude-opus-4-6 a claude-opus-4-7, un solo carácter de diferencia, y su sistema en producción se fue al garete .
Y ahora te dicen que uses thinking: {type: "adaptive"} con output_config.effort . Suena muy moderno, pero la realidad es que el adaptive thinking de Opus 4.7 te quita el control del gasto en tokens y se lo da a la máquina. Antes tú decidías cuánto razonamiento podías pagar. Ahora decide el modelo, y si le da por pensar de más, la factura sube y tú a tragar. Eso sí, el precio nominal por token sigue igual. Lo que cambia es quién controla el contador .
Y la traca final: el pensamiento te lo esconden. Por defecto, thinking.display viene en "omitted" . La máquina piensa, gasta tokens a espuertas, te los cobra religiosamente, pero a ti te devuelve un bloque de texto vacío para que no veas ni una línea de lo que ha razonado. La excusa oficial es que así el tiempo de respuesta es más rápido . Pero ojo al dato que suelta la propia documentación: te siguen cobrando hasta el último token de pensamiento. Ocultarlo reduce latencia, no coste . Es como si el taxista te tapa el taxímetro «para que no te agobies» mientras la tarifa sigue corriendo. Y hay que añadir explícitamente display: "summarized" para ver lo que la máquina ha pensado .
Los foros han ardido con esto. En GitHub hay un issue donde un usuario documenta que las herramientas de terceros no conectan showThinkingSummaries con el parámetro display de la API, así que el pensamiento desaparece sin que puedas hacer nada . La solución que encontraron fue parchear el binario a mano con sed . Imagínate, parcheando binarios para ver lo que tu IA de 200 dólares al mes está pensando. Esto ya no es tecnología punta, es una chapuza.
Y si todo esto te parece poco, resulta que los parámetros temperature, top_p y top_k también han palmado. Si los envías con cualquier valor que no sea el de fábrica, error 400 . ¿Querías respuestas deterministas con temperature = 0? Pues te aguantas y usas ingeniería de prompts. Un equipo de desarrollo documentó exactamente este problema al intentar migrar Cherry Studio a Opus 4.7: tuvieron que quitar temperature y top_p del código porque el modelo los rechaza sin excepción .
Así que haciendo cuentas: mismo precio por token sobre el papel, pero el contador infla hasta un 35%, el modo por defecto es xhigh que consume 3 veces más que el básico, te esconden el pensamiento pero te lo cobran igual, y jubilan los parámetros que usabas para controlar el gasto. La factura de tokens de Claude Opus 4.7 puede triplicarse respecto a 4.6 aunque el precio por token no haya cambiado ni un céntimo . Y mientras, los centros de datos chupando electricidad como locos y la energía más cara que nunca.
Y cuando crees que ya lo has visto todo, llega el zasca del contexto largo que nadie te contó
Pero es que aquí viene el dato que de verdad te deja temblando. ¿Te acuerdas de que Opus 4.6 era una máquina de encontrar agujas en pajares? Metías un PDF de 200 páginas, le preguntabas por una cláusula escondida en la página 147 y te la sacaba sin pestañear. Un 78,3% de acierto en el benchmark MRCR v2 a un millón de tokens de contexto .
Pues bien, Opus 4.7 ha tirado esa capacidad por la ventana y se ha quedado en un ridículo 32,2% . No es que haya bajado un poco, es que se ha dado un tortazo de 46 puntos porcentuales. Y no es un rumor de internet, lo confirma hasta Shelly Palmer, que no es precisamente un cualquiera .
La excusa oficial de Anthropic es que Opus 4.6 hacía trampa con el pensamiento extendido y que el nuevo modelo «prefiere decir que no encuentra algo antes que inventárselo» . Muy bonito. Pero resulta que la información sí está en el contexto, lo que pasa es que el nuevo sistema de recuperación de información de Opus 4.7 es tan malo que no encuentra lo que tiene delante de las narices .
Un abogado que usaba Claude para revisar contratos lo explicaba clarísimo: metes un contrato de 80 páginas, preguntas por la cláusula de rescisión y el modelo te dice que «no se menciona». La cláusula está ahí, en la página 62, pero Opus 4.7 no la ve. Mientras tanto, tú facturando tokens a 35% más por el mismo texto . La capacidad de búsqueda en documentos largos de la IA se ha desplomado justo cuando más necesitas revisar contratos y documentos financieros .
Date cuenta de la gravedad. Si trabajas con documentos legales, análisis financieros, investigación académica o cualquier cosa que requiera procesar textos largos, Opus 4.7 es directamente peor que el modelo anterior. Y no es una opinión, es un dato: 32,2% contra 78,3%. Anthropic ha sacrificado una capacidad clave para perseguir el rendimiento en programación.
La mentira del benchmark: cuando los números bailan según quien los mire
Y ahora llegamos a lo que de verdad cabrea. Resulta que no solo te rompen la API y te inflan la factura, sino que los datos que te dan para justificarlo son un baile de cifras que cambia según a quién le preguntes. El benchmark MRCR v2, ese que mide la capacidad de encontrar información en documentos largos, es el ejemplo perfecto de cómo te torean con los números.
En su lanzamiento, Anthropic soltó la cifra de 32,2% para Opus 4.7 a un millón de tokens de contexto. Una caída de 46 puntos frente al 78,3% de Opus 4.6 . Pero luego, cuando la prensa especializada empezó a rascar, apareció otra cifra: un 40,1%. ¿De dónde sale ese número? Nadie lo sabe exactamente. La propia Shelly Palmer, que tuvo acceso a la documentación interna, reconoció que los datos del system card mostraban esa discrepancia . Un 40,1% no es un 32,2%, pero ambos son un suspenso en toda regla para el buque insignia.
Y es que las cifras reales del desplome en contexto largo son aún más embarazosas de lo que Anthropic admite en público. Porque a 256.000 tokens —que ni siquiera es el contexto máximo— Opus 4.6 sacaba un 91,9% y Opus 4.7 se queda en un 59,2% . No es solo que falle con documentos gigantes, es que con textos medianamente largos ya empieza a perder el hilo. La excusa oficial de que «4.6 hacía trampa con el pensamiento extendido» suena a cuando un alumno justifica su suspenso diciendo que el otro copiaba.
El análisis del medio financiero taiwanés lo resumió perfectamente: la capacidad estrella que Anthropic vendió con Opus 4.6 como una «transformación cualitativa» simplemente ha desaparecido en 4.7 . No es un ajuste, no es un compromiso, es una amputación. Y mientras, tú viendo cómo tus facturas de tokens suben un 37-47% para un modelo que no encuentra lo que tiene delante .
El problema del contexto largo: un modelo que se olvida de lo que acaba de leer
Esto ya es de psiquiatra. Metes un documento, el modelo te dice que lo ha leído entero, y luego te suelta cosas que no tienen nada que ver con lo que ponía. Como ese colega que asiente mientras le hablas pero luego te preguntas si ha escuchado una sola palabra. Opus 4.7 dice que ha leído el documento pero luego te responde como si no hubiera entendido nada, literalmente se inventa el contenido.
He visto capturas de pantalla que ponen los pelos de punta. Un desarrollador metió una especificación de 800 líneas y el modelo le soltó: «lo he leído todo». Acto seguido empezó a dar recomendaciones que no aparecían por ningún lado. No eran errores pequeños. Eran alucinaciones puras y duras sobre información que estaba o no estaba en el texto . Y tú mientras facturando tokens al 35% más. El negocio perfecto para ellos.
Los análisis independientes lo confirman con datos duros. Por debajo de 32.000 tokens la diferencia con Opus 4.6 es casi imperceptible, el modelo aún se defiende. Entre 32.000 y 128.000 tokens empieza a perder fuelle, unos 5 puntos menos. Pero cuando te metes en contextos de 128.000 a 256.000 tokens, ahí ya la caída es de 15 a 30 puntos, un descalabro . A partir de 128.000 tokens Opus 4.7 pierde completamente la capacidad de seguir el hilo de documentos largos y Anthropic lo sabe perfectamente.
Tan a saco es el desastre que la propia Anthropic ha recomendado en su documentación oficial que si tu curro depende de buscar cosas en documentos largos, mejor te quedes con Opus 4.6. Textualmente: «recomendamos mantener 4.6 disponible como opción de respaldo» . Es la primera vez en la historia de esta gente que te dicen que no migres. Primera vez. Normalmente te empujan a lo nuevo como si no hubiera mañana, pero esta vez ni ellos se atreven a defenderlo.
Y la excusa es de traca. Según su tarjeta de sistema, Opus 4.6 «dominaba» estas tareas gracias al pensamiento extendido de 64k tokens, algo que Opus 4.7 ya no soporta . O sea, que Anthropic ha jubilado la función que hacía bueno a Opus 4.6 en contexto largo y ahora te vende un modelo que no sabe encontrar lo que tiene delante. Como un coche nuevo al que le han quitado el turbo y te dicen que ahora consume menos.
El colmo es que mientras ellos reconocen esto en privado, en su blog público sueltan que Opus 4.7 tiene «el rendimiento en contexto largo más consistente de todos los modelos que hemos probado» . ¿Perdón? ¿Un 32,2% frente a un 78,3% es «más consistente»? O mienten en el blog o mienten en la documentación técnica. Las dos cosas no pueden ser verdad a la vez. Anthropic se contradice a sí misma: en su blog vende Opus 4.7 como el mejor en contexto largo pero en su documentación interna recomienda no migrar.
Pero lo más bestia es que fue a propósito: la decisión de negocio que te va a joder los análisis financieros y las revisiones de contratos
Esto ya no es un bug ni un fallo de principiante. Esto es una decisión de diseño cogida con pinzas. Resulta que Anthropic sacrificó a propósito la capacidad de contexto largo de Opus 4.7 para potenciar la programación, y lo saben de sobra aunque en público te vendan otra película .
En su tarjeta de sistema de 232 páginas —que casi nadie se lee porque quién tiene tiempo para eso— lo admiten sin pestañear. Dicen que Opus 4.6 con pensamiento extendido de 64k «domina» a Opus 4.7 en recuperación de documentos largos. Y luego sueltan una frase que jamás había escrito una tecnológica en la historia: recomiendan quedarte con el modelo antiguo si tu curro depende de encontrar cosas en textos largos .
Es la primera vez que una empresa de IA te dice oficialmente que no migres. Primera vez en la historia. Normalmente te empujan a lo nuevo como si te fuera la vida en ello. Pero esta vez ni ellos se atreven a defenderlo. Sabe mal tener que dar explicaciones a los clientes cuando tu modelo nuevo hace peor lo que el viejo bordaba.
El medio 36kr lo clavó en su análisis: ningún modelo estrella en la historia había rebanado por la mitad su propia capacidad insignia. La «transformación cualitativa» de Opus 4.6 —así la llamó Anthropic cuando la vendió a bombo y platillo— se ha esfumado. No la han mejorado, la han jubilado .
Las causas que se rumorean en los foros de desarrolladores ponen los pelos de punta. La primera es que invirtieron todo el presupuesto de optimización en «codificación agéntica de larga duración». Pero ojo al dato: codificación de larga duración no es lo mismo que recuperación de contexto largo. Lo primero es que el bicho no pierda el hilo tras cien turnos de código. Lo segundo es encontrar una aguja en un pajar de un millón de tokens. Para el usuario de a pie suenan igual, pero a nivel de modelo son tan distintos como un coche de carreras y un camión de mudanzas. Y Opus 4.7 solo sabe correr .
La segunda causa es el dichoso tokenizador nuevo. Al trocear las palabras de otra manera, la misma información ocupa posiciones diferentes dentro del contexto. El modelo se lía. Pero la puntilla es otra: como el texto ahora gasta más tokens, la «densidad efectiva» de información en un millón de tokens es menor. Metes lo mismo que antes pero el contador te dice que has metido más. Y la máquina, que ya iba justa de atención, se pierde todavía más . La atención del modelo a la parte central de los documentos largos desaparece a partir de 128.000 tokens y Anthropic lo documentó en su tarjeta de sistema sin que nadie le diera bombo .
Pero hay una tercera causa que casi nadie está contando y que a mí me parece la definitiva. Resulta que ese modelo bestial del que tanto hablan, el que sí mantiene capacidades largas sin despeinarse, el Claude Mythos Preview, solo lo tienen Apple, Google, Microsoft y Nvidia. A ti y a mí nos dan el recortado. Anthropic reserva su modelo más potente para los grandes acuerdos corporativos mientras a los usuarios de a pie nos cobra 200 dólares por un producto capado .
Y el zasca final de verdad: Mythos no es para ti ni lo será
Porque aquí está el remate que lo explica absolutamente todo. Ese modelo bestial del que tanto hablan, el Claude Mythos Preview que sí mantiene las capacidades de contexto largo sin despeinarse y que encuentra vulnerabilidades que los modelos anteriores ni olían… solo lo tienen Apple, Google, Microsoft y un puñado de elegidos. Anthropic ha confirmado que Mythos Preview no tendrá lanzamiento general y se reserva solo para 48 socios corporativos, así que lo de Opus 4.7 capado no es un error, es el plan .
Mythos saca un 83,1% en CyberGym frente al 66,6% de Opus 4.6. Encontró miles de vulnerabilidades cero-day, incluida una en OpenBSD que llevaba 27 años escondida . Pero no lo vas a tocar. Mientras ellos juegan con el Ferrari, a ti te venden un utilitario al que le han quitado piezas y te dicen que es «el mejor modelo disponible para el público general» .
La estrategia es diáfana. Anthropic ya controla el 42% del mercado de programación con IA frente al 21% de OpenAI. Se han hecho los amos del cotarro y ahora aprietan las tuercas . El mercado de APIs de IA se ha concentrado en manos de Anthropic y su estrategia de acceso por niveles deja fuera a los usuarios normales .
Han montado un sistema de castas: los socios de Glasswing tienen Mythos y Opus 4.7 completo. Los que pagan 200 dólares al mes tienen Opus 4.7 capado. Y los que usan la API estándar se comen el tokenizador inflado, los parámetros capados y el pensamiento a oscuras. Anthropic reconoce abiertamente que Mythos no está en la API estándar y que no hay fecha para que lo esté, así que te quedas con lo que hay .
ABI Research lo explica perfectamente: este enfoque va contra la democratización que ha sido la base de la innovación en IA. En lugar de que todos tengamos acceso a lo mismo, se crean asimetrías que consolidan el poder de los gigantes . Tú pagas 200 pavos por un modelo que no encuentra lo que tiene delante en un PDF de 80 páginas mientras Apple y Microsoft usan el modelo de verdad. Bienvenido a la IA de dos velocidades.
Y mientras tanto, Opus 4.7 pierde 46 puntos en contexto largo, te infla la factura un 35% con el nuevo tokenizador, te esconde el pensamiento, te capa los parámetros y te jubila los modelos que funcionaban. El que diga que la IA se está democratizando es que no ha visto una factura de tokens en los últimos dos meses.