ChatGPT está acabado

1 23 4 5

2 / 5

Sabrosillo

ForoCoches: Usuario

18-abr-2026 05:48

Cita de EnxebreFC

Docker + vLLM con 64GB VRAM, no le cedo mis datos a empresas estadounidenses.

Los modelos medianos 26-30B cada vez son mejores.

Mistral Le Chat es europea y cumple con el RGPD. Es un modelo grande, pero todavía le falta para alcanzar a los estadounidenses.

g4bro

cadáver fresco

18-abr-2026 07:24

#32

Cita de DonDregon

da igual Google que Anthropic que OpenAI, yo uso los modelos de los 3 porque es necesario para mi evaluarlos. Los 3 tienen una performance cuantificada tan similar que no merece la pena discutir por lo pequeña que es la variación.

Está claro. La diferencia que importa, para mí, es la "economía" de las herramientas que utilizan estos modelos.

Para tareas que consumen muchos tokens, como proyectos de programación, parece haber un consenso de que Claude Code se come rápidamente los tokens de la suscripción "normal" (la de unos 20 euros al mes) y te deja tirado.

Mi experiencia con Codex (el Claude Code de OpenAI) es que puedo trabajar todo el día, y los tokens no se acaban.

Y esta es la parte que no comprendo. Y no es por defender a OpenAI frente Anthropic pero, ¿de qué coño sirve una herramienta supuestamente mas capaz, pero que se gasta enseguida? Es algo inaceptable.

Anthropic tiene ganada la batalla de la publicidad y el "lavado de cerebro". Eso está claro.

Thedoomcryer

ForoCoches: Miembro

18-abr-2026 09:40

#33

Yo hace meses también que no uso gpt para el día a día me gusta más gemini, incluso algunos meses pago subscripción.

DonDregon

Superusuario

18-abr-2026 09:59

#34

Cita de g4bro

Exacto. También te digo porque lo he investigado

El plugin de Claude Code para VSC tiene (o tenia, hace 5 dias que no lo pruebo) un "bug" en el que hacia pull de muchisímo mas de lo que necesitaba al contexto, con un par de queries para solucionar algún bug etc me quedaba sin uso, lo cual parece una jodida broma.

(Yo uso de normal Antigravity + los plugins de Claude Code y Codex)

Si tienes setup similar, la solución por ahora parece ser lanzar Claude Code por terminal (sea en el mismo Antigravity o fuera) y es la noche y el día.

Pongo bug entre comillas porque me extraña mucho que nadie lo haya visto mágicamente y que, mientras hice el seguimiento (toda una semana) no lo hubieran solucionado. Parece una táctica más un poco sombría para atraer a la gente a Claude Code? Por un lado les quiero dar el beneficio de la duda, por otro últimamente llevan unas cuantas que telita...

Cita de SorenH

Mis dieses por el texto, me encanta que la gente hable desde el conocimiento y autoridad.
Aburrido de leer a las personas que usan chatbots en sus versiones free y se piensan que saben usar la IA

Gracias por la explicación shur

De nada shur, gracias a ti por el comentario. De todos modos, no os creáis todo lo que yo diga tampoco, haced vuestras pruebas y sacad vuestras conclusiones.

Un saludo

Cletus Spuckle

No se pue

18-abr-2026 10:12

#35

Cita de Ramon Rivas

que tal la versión free?

La versión gratis de Claude me ha parecido muy buena pero tiene un límite de uso ridículo. Muchas veces con un mensaje se me acaba. En cambio chatgpt te pasa a un modelo peor pero puedes seguir usándolo

Cita de g4bro

Veo que la de pago peca de lo mismo

Riskito

Shurengineer Flamer

18-abr-2026 10:18

#36

Cita de Cletus Spuckle

Doy fe que la de pago tiene el mismo problema. Vamos a sacar concurso para comprar más licencias y va a ser un cachondeo elegir,.

Glenfi12

ForoCoches: Miembro

18-abr-2026 10:38

#37

Pues veras si cae openai, aparte del tema crisis, claude tendra la oportunidad de elevar x5 o 10 precios y todos los que hayan integrado IA en su empresa en modo copilot veras..

Anne

ForoCoches: Usuario

18-abr-2026 13:34

#38

Chicos tengo quehacer un proyecto de integracion de un ITSM para una gran empresa y presentar documentos tecnicos etc etc y argumentos bien elaborados. Creeis que Claude no solo para desarrollo si no para otras cosas sigue siendo mejor? he leido que enseguida aunque sea de pago te cortan

velajrande

lo mejor está por llegar

18-abr-2026 15:36

#39

Cita de DonDregon

Por un lado, pago el tier de ~20$ de Google (AI Pro), Claude (Pro) y OpenAI (Plus).

Por el otro, tengo montado un "golden path" completo en un monorepo.
Next JS, libreria de componentes, postgres con plugins como pgvector, postgREST etc etc etc, hasta monitoreo, observabilidad... hasta mailpit para poder completar OTPs en local (en total son 12 dockers) todo siguiendo patrones específicos para que la IA los tome de ejemplo.
Reglas, comandos, skills, evals, agentes... todo bien detallado y refinado a lo largo de dos años y obviamente una documentación muy completa y actualizada para cada cosa (seguridad, recetas de codigo, scripts, code contribution model, architecture decision records etc etc etc).

Llevo desde el principio pegándome con la IA y buscando los límites así como formas de llegar más lejos. Con un stack bien documentado y diseñado... Gemini 3 Flash en Antigravity puede completar features completas sin despeinarse. Alguna vez se pega derrapada, claro.... pero también lo hacen los demás modelos y además, para eso estamos nosotros no?

Lo de que Claude se merienda a los demás en código es un buen marketing, pero nada más que eso. Incluso han ido tan lejos como para crear su propia gilipollez con las skills y demás para que la gente lo monte todo según las reglas de Claude y que sea mas dificil cambiar de proveedor.

La parte realista es que meter las "skills" como parte del AGENTS.md mejora la precisión incluso cuando usas Claude y que Claude no es mejor que los demás, simplemente han invertido mucho branding y marketing en el nicho de desarrollo de software. Bien hecho, pero llevo casi cuatro lustros en esto... developer, tech lead, team lead, arquitecto... dirección técnica. Cuando te acostumbras a tratar con vendors ves que por un lado todos mienten y por el otro nunca es a favor tuyo

por eso uno tiene que buscar la forma de evaluarlos.

Por último cuando digo que Google esta en el top no es solo porque sea la única empresa de AI que gana dinero en vez de perderlo, sino también porque tiene el ecosistema más grande y potente de todos con mucha diferencia...

Microsoft va bastante por detrás y encima Copilot es como el primo tonto de las demás por eso ni lo meto en la lista (y eso que podría tenerlo gratis por empresa y no lo quiero ni regalado...) cada 6 meses o así le pego un tiento a ver que tal se comporta dentro de Office pero chico no hay manera, y mira que odio hacer Powerpoints, para una cosa que podrían hacer bien y aquí estamos... ajustando mierdas a mano

Edit:

Solo por si no ha quedado claro en el texto, da igual Google que Anthropic que OpenAI, yo uso los modelos de los 3 porque es necesario para mi evaluarlos. Los 3 tienen una performance cuantificada tan similar que no merece la pena discutir por lo pequeña que es la variación.

Como regla general, si un modelo os va notablemente mejor que otro probablemente sea porque le pedís a la IA que os haga algo de forma vaga, imprecisa y sin mucha documentación, reglas, evaluaciones y automatismos. Como os habéis acostumbrado a hablar con un modelo en concreto, al cambiar a otro notáis fricción ya que la forma de expresaros, el idioma incluso etc pueden marcar la diferencia en situaciones ambiguas. Nótese que esto no es de lo que estoy hablando ni tendría sentido tratar de cuantificar algo así.

Me interesa lo de tus evaluaciones.

velajrande

lo mejor está por llegar

18-abr-2026 15:39

#40

Cita de Anne

Si me dices por privado te puedo decir algo quizás.
Para desarrollo parece que está en el top 3.
Mucha gente dice que consume muchos tokens y se acaba la fiesta rápido.

DonDregon

Superusuario

18-abr-2026 16:01

#41

Cita de velajrande

Me interesa lo de tus evaluaciones.

Si te interesa crear un set para tu caso de uso, lo que hago es establecer todas las reglas etc y luego ver cuantas de ellas quedan cubiertas y cuantas no tras una ejecución.

Muchas veces verás pruebas usando SWE-bench, donde a la IA se le proporciona un problema "real" de GitHub/GitLab (bug o feature) y debe navegar por el repositorio completo, escribir el parche y pasar el conjunto de pruebas existente del repositorio.

El problema que tengo con ello es que solamente evalúa que la tarea termine de forma correcta, ello no evalúa que la arquitectura, micro-arquitectura, el diseño de la solución, etc etc etc sean adecuados.

Por eso prefiero evaluar que siga las reglas que sean relevantes para mi y cuantificarlas.

Si te da flojera hacer la evaluación a mano puedes usar un modelo en el que confíes (habitualmente modelo gordo) con evals estrictos. Yo he terminado montando un script en TS que la IA puede reutilizar para sacar un score determinista, además de los evals basados en LLM.

Espero te sirve. Un saludo!

Maikel Daglas

hijo de Kirk Duglas

18-abr-2026 16:16

#42

Yo no pago por ninguno, en free me va muy bien chatgpt para "uso diario" y para las tareas que yo necesito, que no son muy complejas, me va bien.

Caska

ForoCoches: Usuario

18-abr-2026 17:00

#43

De momento estoy trabajando con Gemini y para el precio que tiene va muy bie. He sido capaz disenar y codificar apps, configurar servidores, levantar servicios sin tener ni idea.

No he probado todavia claude por el precio 100€ es caro si no te paga la empresa o si realmente esta justificado su uso.

Gpt utilizo muy poco para cosas del dia dia pero el gratis se agota muy rapido

ruttinger

ForoCoches: Miembro

18-abr-2026 17:05

#44

¿Qué limitaciones tiene la opción gratuita? ¿Hay unos pocos usos de la versión pro al día y luego va a la versión veves como chatgpt y gemini?

DnBLover

ForoCoches: Miembro

18-abr-2026 17:33

#45

Para lo personal uso duck.ai y Claude web, en su plan gratuito y por lo general el Sonnet 4.6 que trae ya me sirve para las cuatro dudas que tengo. Pero claro, lo abriré una o dos veces a la semana, pregunta, breve conversación e ya. Con ese uso nunca me he topado con su límite.

En el trabajo tienen contratado Claude empresarial, pagan por uso y hay un límite configurado que nunca he alcanzado

. Hace su trabajo y no me quejo la verdad. He probado herramientas como Junie y Codex y para las tareas que le hago hacer, todas llegaban al objetivo indicado. Ninguna me parece perfecta pero más o menos cumplen.

velajrande

lo mejor está por llegar

18-abr-2026 18:12

#46

Cita de DonDregon

¿Qué hay del data contamination ?
Me interesa eso que cuentas, pero casi más los resultados.

mikeflight

ForoCoches: Miembro

18-abr-2026 20:16

#47

Teneis localizado alguna IA que produzca buenos PPTs? Es que yo de todas las que he probado, me cuesta mucho que produzcan algo de calidad sin caer en 20 iteraciones…

∆gus@

ForoCoches: Usuario

18-abr-2026 20:34

#48

Cita de alfacentauro

codex va muy bien. Lo uso a diario.

Sergitobe58

ForoCoches: Usuario

18-abr-2026 20:47

#49

Por lo que he leido el plan pro de claude (el de 20€, no el de 200€) es un poco limitado

DonDregon

Superusuario

18-abr-2026 22:26

#50

Cita de velajrande

¿Qué hay del data contamination?

Si te interesa hacer un score de unos contra otros es mejor hacer el assertion a parte (puedes tirar varios modelos en devcontainers y darle la misma tarea a cada uno, por ejemplo, y luego revisar con una checklist a mano).

Cita de velajrande

Me interesa eso que cuentas, pero casi más los resultados.

Al ser parte del trabajo tendría que ver qué puedo compartir.

Lo que si te puedo decir es que el orden del leaderboard no es el mismo en un stack que en otro, y que cada semana cambia.

ELtioPIO

ForoCoches: Miembro

18-abr-2026 23:09

#51

Cita de Llondru

... llevamos 2 semanas en el curro con Claude y ya no toco a ChatGPT ni con el palo.

De hecho estamos cancelando la subscripcion ahora mismo.
ChatGPT ha pecado siempre de demasiado informal, adulador... y al final para tener trabajo extra en estructurar bien la información, cosa que Claude hace increiblemente bien... pues apaga y vámonos.

Aparte que la gestión de plugins e integraciones es 300.000 veces mejor.

OpenAI las va a pasar canutas ...

Sí, estoy totalmente de acuerdo contigo. Tengo ChatGPT y llevo ya tres meses con la versión Pro, y cada vez lo veo más erróneo. No sé cómo explicarlo, pero no lo veo como una inteligencia artificial, sino como un chatbot de estos antiguos que descartan una cosa y ponen otra, pero no piensa de manera lógica. Ni siquiera acierta en bastantes cosas, cada vez menos.

Xanthar

Schumi rules

19-abr-2026 00:29

#52

Claude hace siglos que no lo uso por precio y como no programo, me da un poco igual

Entre gemini y gpt me quedo con gpt aunque si es cierto que Gemini la uso para ciertas cosas concretas que va muy bien, como hacer búsquedas en maps o resúmenes de yt

Pintxas

ForoCoches: Usuario

19-abr-2026 01:29

#53

Cita de carlos3146

Si, yo también he probado Claude y es una auténtica pasada, creo está mucho mejor pensada para grandes tareas, estructura la idea, la desarrolla y te la divide en partes para una mejor implementación.

Correcto. Poder generar proyectos y cargarle documentos es la hostia. He hecho un proyecto así y es genial.

YexLord

Trafalgar D. Water Law

01-may-2026 10:41

#54

Cita de Llondru

Creo que no sabes de lo que hablas, la realidad es que anthropic ha caído una barbaridad, su nuevo modelo opus es peor y con 4 prompts has consumido toda la cuota. En cambio codex está pegando muy fuerte con el nuevo 5.5, los benchmarks y comunidad lo corrobora.

Edito* No digo que Claude sea malo, en absoluto, es una bestia pero estás menospreciando Chatgpt de forma injustificada en mi opinión. Yo uso Gemini, Chatgpt(codex) y Claude code en mi día a día y es cierto que cada una tiene sus menos y sus más pero en general gpt5.5 es una barbaridad aunque le falta algo más de creatividad pero en capacidades agenticas no hay nada igual. De hecho estoy pensando en deshacerme de Claude porque ya te digo, los límites son irrisorios.

Editado: 01-may-2026 10:56 -

casevi

ForoCoches: Usuario

01-may-2026 13:43

#55

Cita de Meiden

Claude quema tokens que no te da la olla. Yo entre Opus 4.6 y GPT-5.4 me quedo con el segundo de lejos. Y he usado ambos mucho.

tienes que ponerle caveman y otras extensiones para que consuma 70 menos

zhemn

ForoCoches: PrImium™ ⭐

01-may-2026 14:08

#56

a mi es que me cae bien, antes hablaba con elle probando idiomas nuevos, pero ahora llevo grok en el coche y en el pc tiro de claude casi para todo lo que uso yo. Me he dado de baja en chatgpt porque no lo uso, los errores los veo casi en todos igual, pero para mi uso día a día... geminy me sobra, claude para apoyarme en los scripts y ciertas labores y poco mas.

eThor

ForoCoches: Usuario

01-may-2026 14:19

#57

Cita de casevi

tienes que ponerle caveman y otras extensiones para que consuma 70 menos

Un 70% menos en Claude también? aunque las respuestas sean más "cavernícolas" por qué ahorra tanto si al final el código te lo tiene que tocar sí o sí? Yo quería probar OpenCode que por 5leuros el primer mes y varios modelos "baratos" podría suplirme que con Codex no llego a los 3 días... Que si para planificar un modelo potente, que si ejecuta el plan con uno medio y plugin para ahorrar, que si revisa con un poco mejor...La era del EcoDeveloper ha llegado.

Meiden

uәpᴉәɯ

01-may-2026 14:44

#58

Cita de eThor

Yo me he pillado la sub de OpenCode Go para probar por 5 pavos y opino lo siguiente:- para uso general en Openclaw y tareas básicas va de PM. Tanto Kimi 2.6 y DeepSeek v4 pro genial. Y los límites son muy generosos.
- para uso delicado en implementaciones... No llega a los modelos top. Con Kimi 2.6 le pedí implementar una nueva característica en un proyecto, y me hizo una implementación bastante pobre. Lo volví a pasar por gpt 5.5, le dije que revisara el código, me sugirió no sé si 18 cambios, y lo clavó a la primera.

Por cierto, GPT 5.5 en low thinking es canela en rama.

eThor

ForoCoches: Usuario

01-may-2026 14:46

#59

Cita de Meiden

Consumen poco Kimi 2.6 y DeepSeek? El uso que le quiero dar es algo como tú shur, para OpenClaw y para el trabajo Codex va muy muy justo.

Meiden

uәpᴉәɯ

01-may-2026 14:51

#60

Cita de eThor

Consumen poco Kimi 2.6 y DeepSeek? El uso que le quiero dar es algo como tú shur, para OpenClaw y para el trabajo Codex va muy muy justo.

Llevo unos dias con ella, no puedo dar datos precisos. Pero por lo que he probado debería de sobrar para Openclaw incluso con uso intensivo.

Mira acabo de mirar. La pillé el día 26. Desde ese día la usé en Openclaw para todo (estuve gestionando un vps que tengo desde ahí, desplegando unos docker y testeando unas cosas, aparte de los crons de noticias y otras cosas que tengo) y en opencode directamente en varias sesiones no muy intensivas (un ejemplo es esa característica que mencionaba antes)... Y llevo gastado 2% semanal y 1% mensual.... Lo que me hace pensar que los límite son muy generosos.

1 23 4 5

2 / 5

← A Electrónica / Informática

ChatGPT está acabado

Foros relacionados

General

Electrónica / Informática

Videojuegos

Empleo / Emprendimiento

Oposiciones

Viajes

Basket

InverForo

Criptomonedas