ChatGPT está acabado
18-abr-2026 05:48
#31
| Mistral Le Chat es europea y cumple con el RGPD. Es un modelo grande, pero todavía le falta para alcanzar a los estadounidenses. |
18-abr-2026 07:24
#32
|
Para tareas que consumen muchos tokens, como proyectos de programación, parece haber un consenso de que Claude Code se come rápidamente los tokens de la suscripción "normal" (la de unos 20 euros al mes) y te deja tirado. Mi experiencia con Codex (el Claude Code de OpenAI) es que puedo trabajar todo el día, y los tokens no se acaban. Y esta es la parte que no comprendo. Y no es por defender a OpenAI frente Anthropic pero, ¿de qué coño sirve una herramienta supuestamente mas capaz, pero que se gasta enseguida? Es algo inaceptable. Anthropic tiene ganada la batalla de la publicidad y el "lavado de cerebro". Eso está claro. |
18-abr-2026 09:40
#33
| Yo hace meses también que no uso gpt para el día a día me gusta más gemini, incluso algunos meses pago subscripción. |
18-abr-2026 09:59
#34
|
Está claro. La diferencia que importa, para mí, es la "economía" de las herramientas que utilizan estos modelos.
Para tareas que consumen muchos tokens, como proyectos de programación, parece haber un consenso de que Claude Code se come rápidamente los tokens de la suscripción "normal" (la de unos 20 euros al mes) y te deja tirado. Mi experiencia con Codex (el Claude Code de OpenAI) es que puedo trabajar todo el día, y los tokens no se acaban. Y esta es la parte que no comprendo. Y no es por defender a OpenAI frente Anthropic pero, ¿de qué coño sirve una herramienta supuestamente mas capaz, pero que se gasta enseguida? Es algo inaceptable. Anthropic tiene ganada la batalla de la publicidad y el "lavado de cerebro". Eso está claro. Exacto. También te digo porque lo he investigado El plugin de Claude Code para VSC tiene (o tenia, hace 5 dias que no lo pruebo) un "bug" en el que hacia pull de muchisímo mas de lo que necesitaba al contexto, con un par de queries para solucionar algún bug etc me quedaba sin uso, lo cual parece una jodida broma. (Yo uso de normal Antigravity + los plugins de Claude Code y Codex) Si tienes setup similar, la solución por ahora parece ser lanzar Claude Code por terminal (sea en el mismo Antigravity o fuera) y es la noche y el día. Pongo bug entre comillas porque me extraña mucho que nadie lo haya visto mágicamente y que, mientras hice el seguimiento (toda una semana) no lo hubieran solucionado. Parece una táctica más un poco sombría para atraer a la gente a Claude Code? Por un lado les quiero dar el beneficio de la duda, por otro últimamente llevan unas cuantas que telita... Un saludo |
18-abr-2026 10:12
#35
|
La versión gratis de Claude me ha parecido muy buena pero tiene un límite de uso ridículo. Muchas veces con un mensaje se me acaba. En cambio chatgpt te pasa a un modelo peor pero puedes seguir usándolo Está claro. La diferencia que importa, para mí, es la "economía" de las herramientas que utilizan estos modelos.
Para tareas que consumen muchos tokens, como proyectos de programación, parece haber un consenso de que Claude Code se come rápidamente los tokens de la suscripción "normal" (la de unos 20 euros al mes) y te deja tirado. Mi experiencia con Codex (el Claude Code de OpenAI) es que puedo trabajar todo el día, y los tokens no se acaban. Y esta es la parte que no comprendo. Y no es por defender a OpenAI frente Anthropic pero, ¿de qué coño sirve una herramienta supuestamente mas capaz, pero que se gasta enseguida? Es algo inaceptable. Anthropic tiene ganada la batalla de la publicidad y el "lavado de cerebro". Eso está claro.
|
18-abr-2026 10:18
#36
| Doy fe que la de pago tiene el mismo problema. Vamos a sacar concurso para comprar más licencias y va a ser un cachondeo elegir,. |
18-abr-2026 10:38
#37
| Pues veras si cae openai, aparte del tema crisis, claude tendra la oportunidad de elevar x5 o 10 precios y todos los que hayan integrado IA en su empresa en modo copilot veras.. |
18-abr-2026 13:34
#38
| Chicos tengo quehacer un proyecto de integracion de un ITSM para una gran empresa y presentar documentos tecnicos etc etc y argumentos bien elaborados. Creeis que Claude no solo para desarrollo si no para otras cosas sigue siendo mejor? he leido que enseguida aunque sea de pago te cortan |
18-abr-2026 15:36
#39
|
Por un lado, pago el tier de ~20$ de Google (AI Pro), Claude (Pro) y OpenAI (Plus).
Por el otro, tengo montado un "golden path" completo en un monorepo. Next JS, libreria de componentes, postgres con plugins como pgvector, postgREST etc etc etc, hasta monitoreo, observabilidad... hasta mailpit para poder completar OTPs en local (en total son 12 dockers) todo siguiendo patrones específicos para que la IA los tome de ejemplo. Reglas, comandos, skills, evals, agentes... todo bien detallado y refinado a lo largo de dos años y obviamente una documentación muy completa y actualizada para cada cosa (seguridad, recetas de codigo, scripts, code contribution model, architecture decision records etc etc etc). Llevo desde el principio pegándome con la IA y buscando los límites así como formas de llegar más lejos. Con un stack bien documentado y diseñado... Gemini 3 Flash en Antigravity puede completar features completas sin despeinarse. Alguna vez se pega derrapada, claro.... pero también lo hacen los demás modelos y además, para eso estamos nosotros no? Lo de que Claude se merienda a los demás en código es un buen marketing, pero nada más que eso. Incluso han ido tan lejos como para crear su propia gilipollez con las skills y demás para que la gente lo monte todo según las reglas de Claude y que sea mas dificil cambiar de proveedor. La parte realista es que meter las "skills" como parte del AGENTS.md mejora la precisión incluso cuando usas Claude y que Claude no es mejor que los demás, simplemente han invertido mucho branding y marketing en el nicho de desarrollo de software. Bien hecho, pero llevo casi cuatro lustros en esto... developer, tech lead, team lead, arquitecto... dirección técnica. Cuando te acostumbras a tratar con vendors ves que por un lado todos mienten y por el otro nunca es a favor tuyo por eso uno tiene que buscar la forma de evaluarlos.Por último cuando digo que Google esta en el top no es solo porque sea la única empresa de AI que gana dinero en vez de perderlo, sino también porque tiene el ecosistema más grande y potente de todos con mucha diferencia... Microsoft va bastante por detrás y encima Copilot es como el primo tonto de las demás por eso ni lo meto en la lista (y eso que podría tenerlo gratis por empresa y no lo quiero ni regalado...) cada 6 meses o así le pego un tiento a ver que tal se comporta dentro de Office pero chico no hay manera, y mira que odio hacer Powerpoints, para una cosa que podrían hacer bien y aquí estamos... ajustando mierdas a mano ![]() Edit: Solo por si no ha quedado claro en el texto, da igual Google que Anthropic que OpenAI, yo uso los modelos de los 3 porque es necesario para mi evaluarlos. Los 3 tienen una performance cuantificada tan similar que no merece la pena discutir por lo pequeña que es la variación. Como regla general, si un modelo os va notablemente mejor que otro probablemente sea porque le pedís a la IA que os haga algo de forma vaga, imprecisa y sin mucha documentación, reglas, evaluaciones y automatismos. Como os habéis acostumbrado a hablar con un modelo en concreto, al cambiar a otro notáis fricción ya que la forma de expresaros, el idioma incluso etc pueden marcar la diferencia en situaciones ambiguas. Nótese que esto no es de lo que estoy hablando ni tendría sentido tratar de cuantificar algo así. |
18-abr-2026 15:39
#40
|
Chicos tengo quehacer un proyecto de integracion de un ITSM para una gran empresa y presentar documentos tecnicos etc etc y argumentos bien elaborados. Creeis que Claude no solo para desarrollo si no para otras cosas sigue siendo mejor? he leido que enseguida aunque sea de pago te cortan
Para desarrollo parece que está en el top 3. Mucha gente dice que consume muchos tokens y se acaba la fiesta rápido. |
18-abr-2026 16:01
#41
|
Si te interesa crear un set para tu caso de uso, lo que hago es establecer todas las reglas etc y luego ver cuantas de ellas quedan cubiertas y cuantas no tras una ejecución. Muchas veces verás pruebas usando SWE-bench, donde a la IA se le proporciona un problema "real" de GitHub/GitLab (bug o feature) y debe navegar por el repositorio completo, escribir el parche y pasar el conjunto de pruebas existente del repositorio. El problema que tengo con ello es que solamente evalúa que la tarea termine de forma correcta, ello no evalúa que la arquitectura, micro-arquitectura, el diseño de la solución, etc etc etc sean adecuados. Por eso prefiero evaluar que siga las reglas que sean relevantes para mi y cuantificarlas. Si te da flojera hacer la evaluación a mano puedes usar un modelo en el que confíes (habitualmente modelo gordo) con evals estrictos. Yo he terminado montando un script en TS que la IA puede reutilizar para sacar un score determinista, además de los evals basados en LLM. Espero te sirve. Un saludo! |
18-abr-2026 16:16
#42
| Yo no pago por ninguno, en free me va muy bien chatgpt para "uso diario" y para las tareas que yo necesito, que no son muy complejas, me va bien. |
18-abr-2026 17:00
#43
|
De momento estoy trabajando con Gemini y para el precio que tiene va muy bie. He sido capaz disenar y codificar apps, configurar servidores, levantar servicios sin tener ni idea. No he probado todavia claude por el precio 100€ es caro si no te paga la empresa o si realmente esta justificado su uso. Gpt utilizo muy poco para cosas del dia dia pero el gratis se agota muy rapido |
18-abr-2026 17:05
#44
| ¿Qué limitaciones tiene la opción gratuita? ¿Hay unos pocos usos de la versión pro al día y luego va a la versión veves como chatgpt y gemini? |
18-abr-2026 17:33
#45
|
Para lo personal uso duck.ai y Claude web, en su plan gratuito y por lo general el Sonnet 4.6 que trae ya me sirve para las cuatro dudas que tengo. Pero claro, lo abriré una o dos veces a la semana, pregunta, breve conversación e ya. Con ese uso nunca me he topado con su límite. En el trabajo tienen contratado Claude empresarial, pagan por uso y hay un límite configurado que nunca he alcanzado . Hace su trabajo y no me quejo la verdad. He probado herramientas como Junie y Codex y para las tareas que le hago hacer, todas llegaban al objetivo indicado. Ninguna me parece perfecta pero más o menos cumplen.
|
18-abr-2026 18:12
#46
|
Si te interesa crear un set para tu caso de uso, lo que hago es establecer todas las reglas etc y luego ver cuantas de ellas quedan cubiertas y cuantas no tras una ejecución.
Muchas veces verás pruebas usando SWE-bench, donde a la IA se le proporciona un problema "real" de GitHub/GitLab (bug o feature) y debe navegar por el repositorio completo, escribir el parche y pasar el conjunto de pruebas existente del repositorio. El problema que tengo con ello es que solamente evalúa que la tarea termine de forma correcta, ello no evalúa que la arquitectura, micro-arquitectura, el diseño de la solución, etc etc etc sean adecuados. Por eso prefiero evaluar que siga las reglas que sean relevantes para mi y cuantificarlas. Si te da flojera hacer la evaluación a mano puedes usar un modelo en el que confíes (habitualmente modelo gordo) con evals estrictos. Yo he terminado montando un script en TS que la IA puede reutilizar para sacar un score determinista, además de los evals basados en LLM. Espero te sirve. Un saludo! Me interesa eso que cuentas, pero casi más los resultados. |
18-abr-2026 20:16
#47
| Teneis localizado alguna IA que produzca buenos PPTs? Es que yo de todas las que he probado, me cuesta mucho que produzcan algo de calidad sin caer en 20 iteraciones… |
18-abr-2026 20:47
#49
| Por lo que he leido el plan pro de claude (el de 20€, no el de 200€) es un poco limitado |
18-abr-2026 22:26
#50
|
Si te interesa hacer un score de unos contra otros es mejor hacer el assertion a parte (puedes tirar varios modelos en devcontainers y darle la misma tarea a cada uno, por ejemplo, y luego revisar con una checklist a mano). Al ser parte del trabajo tendría que ver qué puedo compartir. Lo que si te puedo decir es que el orden del leaderboard no es el mismo en un stack que en otro, y que cada semana cambia. |
18-abr-2026 23:09
#51
|
... llevamos 2 semanas en el curro con Claude y ya no toco a ChatGPT ni con el palo.
De hecho estamos cancelando la subscripcion ahora mismo. ChatGPT ha pecado siempre de demasiado informal, adulador... y al final para tener trabajo extra en estructurar bien la información, cosa que Claude hace increiblemente bien... pues apaga y vámonos. Aparte que la gestión de plugins e integraciones es 300.000 veces mejor. OpenAI las va a pasar canutas ... |
19-abr-2026 00:29
#52
|
Claude hace siglos que no lo uso por precio y como no programo, me da un poco igual Entre gemini y gpt me quedo con gpt aunque si es cierto que Gemini la uso para ciertas cosas concretas que va muy bien, como hacer búsquedas en maps o resúmenes de yt |
19-abr-2026 01:29
#53
| Correcto. Poder generar proyectos y cargarle documentos es la hostia. He hecho un proyecto así y es genial. |
01-may-2026 10:41
#54
|
... llevamos 2 semanas en el curro con Claude y ya no toco a ChatGPT ni con el palo.
De hecho estamos cancelando la subscripcion ahora mismo. ChatGPT ha pecado siempre de demasiado informal, adulador... y al final para tener trabajo extra en estructurar bien la información, cosa que Claude hace increiblemente bien... pues apaga y vámonos. Aparte que la gestión de plugins e integraciones es 300.000 veces mejor. OpenAI las va a pasar canutas ... Edito* No digo que Claude sea malo, en absoluto, es una bestia pero estás menospreciando Chatgpt de forma injustificada en mi opinión. Yo uso Gemini, Chatgpt(codex) y Claude code en mi día a día y es cierto que cada una tiene sus menos y sus más pero en general gpt5.5 es una barbaridad aunque le falta algo más de creatividad pero en capacidades agenticas no hay nada igual. De hecho estoy pensando en deshacerme de Claude porque ya te digo, los límites son irrisorios. |
Editado: 01-may-2026 10:56 -
01-may-2026 14:08
#56
| a mi es que me cae bien, antes hablaba con elle probando idiomas nuevos, pero ahora llevo grok en el coche y en el pc tiro de claude casi para todo lo que uso yo. Me he dado de baja en chatgpt porque no lo uso, los errores los veo casi en todos igual, pero para mi uso día a día... geminy me sobra, claude para apoyarme en los scripts y ciertas labores y poco mas. |
01-may-2026 14:19
#57
| Un 70% menos en Claude también? aunque las respuestas sean más "cavernícolas" por qué ahorra tanto si al final el código te lo tiene que tocar sí o sí? Yo quería probar OpenCode que por 5leuros el primer mes y varios modelos "baratos" podría suplirme que con Codex no llego a los 3 días... Que si para planificar un modelo potente, que si ejecuta el plan con uno medio y plugin para ahorrar, que si revisa con un poco mejor...La era del EcoDeveloper ha llegado. |
01-may-2026 14:44
#58
|
Un 70% menos en Claude también? aunque las respuestas sean más "cavernícolas" por qué ahorra tanto si al final el código te lo tiene que tocar sí o sí? Yo quería probar OpenCode que por 5leuros el primer mes y varios modelos "baratos" podría suplirme que con Codex no llego a los 3 días... Que si para planificar un modelo potente, que si ejecuta el plan con uno medio y plugin para ahorrar, que si revisa con un poco mejor...La era del EcoDeveloper ha llegado.
- para uso delicado en implementaciones... No llega a los modelos top. Con Kimi 2.6 le pedí implementar una nueva característica en un proyecto, y me hizo una implementación bastante pobre. Lo volví a pasar por gpt 5.5, le dije que revisara el código, me sugirió no sé si 18 cambios, y lo clavó a la primera. Por cierto, GPT 5.5 en low thinking es canela en rama. |
01-may-2026 14:46
#59
|
Yo me he pillado la sub de OpenCode Go para probar por 5 pavos y opino lo siguiente:- para uso general en Openclaw y tareas básicas va de PM. Tanto Kimi 2.6 y DeepSeek v4 pro genial. Y los límites son muy generosos.
- para uso delicado en implementaciones... No llega a los modelos top. Con Kimi 2.6 le pedí implementar una nueva característica en un proyecto, y me hizo una implementación bastante pobre. Lo volví a pasar por gpt 5.5, le dije que revisara el código, me sugirió no sé si 18 cambios, y lo clavó a la primera. Por cierto, GPT 5.5 en low thinking es canela en rama. |
01-may-2026 14:51
#60
|
Mira acabo de mirar. La pillé el día 26. Desde ese día la usé en Openclaw para todo (estuve gestionando un vps que tengo desde ahí, desplegando unos docker y testeando unas cosas, aparte de los crons de noticias y otras cosas que tengo) y en opencode directamente en varias sesiones no muy intensivas (un ejemplo es esa característica que mencionaba antes)... Y llevo gastado 2% semanal y 1% mensual.... Lo que me hace pensar que los límite son muy generosos. |
El plugin de Claude Code para VSC tiene (o tenia, hace 5 dias que no lo pruebo) un "bug" en el que hacia pull de muchisímo mas de lo que necesitaba al contexto, con un par de queries para solucionar algún bug etc me quedaba sin uso, lo cual parece una jodida broma.

Lover