IA local

GuanBunny

ForoCoches: Miembro

26-may-2026 08:19

Buenos dias shurs , estaba pensando en montarme un equipo para tener ia local pero nose muy bien que tener , he oido openclaw, hermes y cosas asi , que con un mac mini m4 era suficiente , pero que tan rentable es? , que me recomendais ?

eThor

ForoCoches: Usuario

26-may-2026 08:31

Una cosa es correr una IA en local, para que lo necesitas una GPU y RAM potente y ejecutar los LLM sobre ellos..Y otra correr agentes que tiran de modelos en la nube, para lo segundo con un miniPC barato de 200€ vas sobrado.

ViktorTroska

ForoCoches: Usuario

26-may-2026 09:16

Si quieres que sea 100% en local vas a necesitar mucha VRAM y procesador para que no te haga cuello de botella. Nate Gentile usó openclaw y parecía muy impresionante pero el cabrón lo hizo con 120GB de VRAM y encima lo brikeó.

Xpr0o

¯¯¯¯¯¯¯¯

26-may-2026 09:27

Cita de ViktorTroska

Op para que te hagas una idea, nate gentile lo hizo en un pc de 10.000€ y a la cuarta frase le dijo que tenía la memoria full

Jack07

ForoCoches: Miembro

26-may-2026 09:42

Forocuñados te va a decir que es imposible, pero lo principal es saber el uso que le quieres dar a esa IA

Hay bastantes modelos que pueden correr perfectamente en local. Eso si, no esperes tener un ChatGPT completo en local.

Bangk

Forero Respetuoso

26-may-2026 09:50

Mac mini con el max de gb de ram posibles

GuanBunny

ForoCoches: Miembro

26-may-2026 10:09

Cita de eThor

hablame de dinero en plan modelos en nube cuales me recomiendas y asi

eThor

ForoCoches: Usuario

26-may-2026 10:30

Cita de GuanBunny

hablame de dinero en plan modelos en nube cuales me recomiendas y asi

Cómo te han comentado por aquí, depende de lo que quieras y para qué. Con OpenCode puedes ir con una suscripción tipo de 15€ mes, viendo que modelos necesitas, optimizando consumo de tokens y un miniPC pachanguero de 200€.

CibernoX_CTDI

ForoCoches: Miembro

26-may-2026 18:11

Va a costarte un dinero. Echale que al final facil 1800€ salvo que saques cosas de segunda mano.
Las GPUs con 24gb de vram se te van, nuevas, a 1200€. A nada que le metas 32 de ram, placa, CPU, fuente tocha y un SSD, estás en 1800€ y no te has enterado.

Menos que 24gb de vram no te lo plantees para algo medio serio.

kaizen_e12

Pyloric Valve inside

26-may-2026 21:31

#10

Cita de GuanBunny

Un equipo con iA local tienes que pensar dos cosas:

NVidia 5090
RAM a mansalva
CPU con NPU

Con una 5070 y un Ryzen nosequé X3D harás poco o nada. Bueno sí, el ridículo.

bytewin

ForoCoches: Miembro

27-may-2026 02:39

#11

Obviamente recursos de hardware necesitas si o si.

Oysterrrr

in pace leones

27-may-2026 06:11

#12

No hace falta que tengas la ultima gráfica por existir, yo tengo una 4060 ti y tira casi todo, lo unico que varia es el tiempo y para algunas llm tira mas de procesador.

JMGH

ForoCoches: Miembro

27-may-2026 06:36

#13

Echa un ojo a esto: https://forocoches.com/foro/showthread.php?t=10099080

Lord-Blade

ForoCoches: Miembro

27-may-2026 09:15

#14

Cita de Xpr0o

Op para que te hagas una idea, nate gentile lo hizo en un pc de 10.000€ y a la cuarta frase le dijo que tenía la memoria full

Si le digo a una IA que me haga una historia son 2000 tokens, si le digo que se conecte a las luces de mi casa son 25000, en unos ves los tokens y en el otro no, pensar, escribir, consume.

De ahí que la comparación no sea justa. Todo depende de para que lo uses y que modelo(y su contexto máximo)

Nate la cago cargando modelos mas grandes de lo que podía...no lo pondría como referencia de IA

monguerlander9

ForoCoches: Usuario

29-may-2026 15:06

#15

Yo he intentado montar Ia desde ollama, aumente la ram a 32 , tengo un ryzen 7 y no chuta. Al final he metido diez pavos en openrouter y usando el nemotron 3 con hermes, y no me termina de convencer, hace nada metí diez pavos más en Google one para antigravity 2.0 y creo decididamente que es lo mejor que he hecho, he probado openclaw, Hermes, VStudio, he usado Ia gratis de kilo, ollama, lmstudio, groq, y el problema siempre el mismo, contexto. Ahora el problema con antigravity es otro, va como un tiro, estoy programando bots de arbitraje, y me da para una hora y luego cuatro horas y medio de recreo de espera de recarga. No hay nada perfecto. Pero los modelos de ia local aunque estén cuantificados no creo que puedas mover más de 28b parametros, a no ser que tengas un super equipo, creo que sale más rentable cuentas de tarifa plana, mírate modelos chinos si quieres ahorrar algo. Para todo lo demás, mastercard

DonDregon

Superusuario

29-may-2026 15:55

#16

Veo muchas ideas rarunas en el hilo, voy a intentar aclarar algunos conceptos.

Cita de GuanBunny

Lo primero que debes definir es qué quieres hacer exactamente.

Veo que mencionas OpenClaw y Hermes, pero en si mismo no hacen "nada", tienes que instruirles para hacer lo que tu quieras y hay un esfuerzo detrás si quieres que sea consistente con algunas tareas. El boom al que dio salida OpenClaw, se ha deshinchado bastante porque no hay tantos casos de uso reales que necesiten esto. Como concepto hace gracia pero no super util tampoco.

Así que define primero qué quieres/necesitas conseguir con IA y luego hablamos de la estrategia (herramientas, metodologías, integración y finalmente construir vs comprar)

Cita de eThor

Esto tampoco es cierto, hay muchos flujos de trabajo que levantan sub-agentes en local que consumen recursos del equipo, aunque el trabajo de "pensar" lo haga la IA en un Cloud, necesitas cierta cantidad de memoria y potencia de procesado en local de todos modos para alimentar esa IA remota.

Cita de monguerlander9

Para IA local el procesador no afecta tanto, es más la gráfica. Tampoco es tanto la RAM sino la vRAM (o memoria compartida en caso de un SoC). Por mucho que le pongan "AI" en el nombre de los procesadores significa que poder pueden correr cosas pequeñitas pero no son muy potentes para este tema.

En el caso concreto que mencionas (Antigravity) entiendo que tu uso es programar software, obviamente openclaw, hermes y similares no están pensados ni mucho menos optimizados para ello, solo sirven para gastar tokens extra tontamente.

Cita de Oysterrrr

No hace falta que tengas la ultima gráfica por existir, yo tengo una 4060 ti y tira casi todo, lo unico que varia es el tiempo y para algunas llm tira mas de procesador.

Otro error mas al carro. Lo que te pasa es lo siguiente: El modelo que has cargado (+ contexto + kv cache + ...) no cabe en la vRAM de tu gráfica -> tiene que utilizar la RAM de buffer y por tanto utilizar la CPU de intermediario. Es decir, si tira de procesador es mala señal, te falta hardware (memoria gráfica justamente) y pasas a tener un cuello de botella. Esto se conoce como offloading de capas a la CPU.

La 4060 ti creo salía en versión de 8Gb y 16Gb de vRAM, sea cual sea, para correr IA en local, en términos generales, es más bien poco.

Corrijo. Si tu caso de uso es por ejemplo hacer OCR de tickets del supermercado esto lo puedes hacer perfectísimamente con un modelo pequeñito de apenas 0.9B (como este). Unos 2.2Gb en memoria + lo que ocupe contexto, kv cache etc <-- esto es configurable, el mismo modelo pequeñito si metes el máximo de ventana de contexto puede llegar a ocupar más de 20Gb en vRAM, vigilad con eso!

Pero para uso general, un Gemma 4 26B ya ocupa más que los 16Gb que tienes (en el mejor de los casos) en una 4060 ti, y eso sin contar contexto ni kv cache etc

Cita de kaizen_e12

Un equipo con iA local tienes que pensar dos cosas:

NVidia 5090
RAM a mansalva
CPU con NPU

Con una 5070 y un Ryzen nosequé X3D harás poco o nada. Bueno sí, el ridículo.

Otra mezcla de churros con merinas.

La IA puede correr en:

CPU + RAM
La gráfica

Cita de CibernoX_CTDI

Va a costarte un dinero. Menos que 24gb de vram no te lo plantees para algo medio serio.

Depende del uso en particular pero a efectos generales, esta frase es correcta.

____

Mac la verdad es una muy buena opción, el motivo es que es un SoC con capacidad de tener mucha memoria compartida. Puedes correr los mismos workflows en un Macbook Pro M5 Pro 48Gb de RAM que en un PC con una RTX 5090 (donde habría que sumar el coste del resto del equipo, claro).

El problema que tenemos es que los chips M5 son los que llevan aceleradores de AI (los M4 todavía no lo llevaban), y por otro lado, tampoco tenemos versión M5 del Mac Mini, ni del Mac Studio... La realidad es que si Apple hoy saca un mac mini con un M5 Pro y opción a subirlo a 64Gb de RAM, sería probablemente la mejor opción para correr IA rendimiento/precio de lejos, pero también probablemente tendrían millones de pedidos y el tiempo de espera de los Mac Mini está ya en más de 2 meses

En resumen, explica bien qué es lo que quieres hacer y con ello podremos definir una solución mejor. Hay cosas que con una RTX 3060 de 12Gb vas sobrao, otras que con una 5090 te quedas corto, quiza interesa saber lo mejorcito para sacarle partido a IA en remoto etc

CibernoX_CTDI

ForoCoches: Miembro

29-may-2026 18:37

#17

Cita de DonDregon

Veo muchas ideas rarunas en el hilo, voy a intentar aclarar algunos conceptos.

Lo primero que debes definir es qué quieres hacer exactamente.

Veo que mencionas OpenClaw y Hermes, pero en si mismo no hacen "nada", tienes que instruirles para hacer lo que tu quieras y hay un esfuerzo detrás si quieres que sea consistente con algunas tareas. El boom al que dio salida OpenClaw, se ha deshinchado bastante porque no hay tantos casos de uso reales que necesiten esto. Como concepto hace gracia pero no super util tampoco.

Así que define primero qué quieres/necesitas conseguir con IA y luego hablamos de la estrategia (herramientas, metodologías, integración y finalmente construir vs comprar)

Esto tampoco es cierto, hay muchos flujos de trabajo que levantan sub-agentes en local que consumen recursos del equipo, aunque el trabajo de "pensar" lo haga la IA en un Cloud, necesitas cierta cantidad de memoria y potencia de procesado en local de todos modos para alimentar esa IA remota.

Para IA local el procesador no afecta tanto, es más la gráfica. Tampoco es tanto la RAM sino la vRAM (o memoria compartida en caso de un SoC). Por mucho que le pongan "AI" en el nombre de los procesadores significa que poder pueden correr cosas pequeñitas pero no son muy potentes para este tema.

En el caso concreto que mencionas (Antigravity) entiendo que tu uso es programar software, obviamente openclaw, hermes y similares no están pensados ni mucho menos optimizados para ello, solo sirven para gastar tokens extra tontamente.

Otro error mas al carro. Lo que te pasa es lo siguiente: El modelo que has cargado (+ contexto + kv cache + ...) no cabe en la vRAM de tu gráfica -> tiene que utilizar la RAM de buffer y por tanto utilizar la CPU de intermediario. Es decir, si tira de procesador es mala señal, te falta hardware (memoria gráfica justamente) y pasas a tener un cuello de botella. Esto se conoce como offloading de capas a la CPU.

La 4060 ti creo salía en versión de 8Gb y 16Gb de vRAM, sea cual sea, para correr IA en local, en términos generales, es más bien poco.

Corrijo. Si tu caso de uso es por ejemplo hacer OCR de tickets del supermercado esto lo puedes hacer perfectísimamente con un modelo pequeñito de apenas 0.9B (como este). Unos 2.2Gb en memoria + lo que ocupe contexto, kv cache etc <-- esto es configurable, el mismo modelo pequeñito si metes el máximo de ventana de contexto puede llegar a ocupar más de 20Gb en vRAM, vigilad con eso!

Pero para uso general, un Gemma 4 26B ya ocupa más que los 16Gb que tienes (en el mejor de los casos) en una 4060 ti, y eso sin contar contexto ni kv cache etc

Otra mezcla de churros con merinas.

La IA puede correr en:

CPU + RAM
La gráfica

Entendamos que una gráfica es simplemente un SoC (system on a chip), que contiene un procesador especializado con su propia RAM (vRAM).

Si un modelo es demasiado grande y el servidor (Ollama, Ollama cpp, LM Studio o el que sea) tiene que hacer offloading hacia la RAM, ahi ya cagaste. Si te pillas una 5090 deberias restringir tu workflow a los 32Gb de vRAM de la 5090, si empieza a consumir RAM y CPU es que ya está haciendo offloading y todo empieza a ir lento.

Depende del uso en particular pero a efectos generales, esta frase es correcta.

____

Mac la verdad es una muy buena opción, el motivo es que es un SoC con capacidad de tener mucha memoria compartida. Puedes correr los mismos workflows en un Macbook Pro M5 Pro 48Gb de RAM que en un PC con una RTX 5090 (donde habría que sumar el coste del resto del equipo, claro).

El problema que tenemos es que los chips M5 son los que llevan aceleradores de AI (los M4 todavía no lo llevaban), y por otro lado, tampoco tenemos versión M5 del Mac Mini, ni del Mac Studio... La realidad es que si Apple hoy saca un mac mini con un M5 Pro y opción a subirlo a 64Gb de RAM, sería probablemente la mejor opción para correr IA rendimiento/precio de lejos, pero también probablemente tendrían millones de pedidos y el tiempo de espera de los Mac Mini está ya en más de 2 meses

Yo tiré bastante tiempo con una 3060 de 12gb y me daba para reconocimiendo de voz con parakeet + modelos de 8/14B sin problema, aunque hay que reconocer que el salto de calidad a los modelos de ~30B es grande. Yo voy a meter una segunda tarjeta de 24gb para tener 48gb de vram. Sale más barato que pagar por una 5090.

felizycontento

ForoCoches: Miembro

30-may-2026 04:52

#18

Necesitas ordenador con memoria unificada, porque a base de tarjetas graficas te dejas la pasta que te cuesta una suscripción los próximos 5 años.

El mac mini básico es una mierda para eso, lo sé porque tengo uno y lo he intentado. Además que ya no hay.

Sobre todo porque el ancho de banda de la memoria es una décima parte que el de una tarjeta gráfica.

Te quedan dos opciones no excluyentes:

1.Te esperas a que salga el mac mini m5 pro con 48 gb y rezas para que no pase de los 3.000 pavos
2. Te vas a por un equipo con ryzen 9 ai hx 395 con memoria unificada y con bus de memoria de 256 bits, que tiene un ancho de banda similar, como el GMKtec EVO-X2.

Aún así no te esperes un gemini 3,5 o un sonnet 4.6

kaizen_e12

Pyloric Valve inside

30-may-2026 15:16

#19

Cita de DonDregon

Otra mezcla de churros con merinas.

La IA puede correr en:

CPU + RAM
La gráfica

Mac Studio esa es la referencia de arquitectura del mercado actual para iA en local. Lo que saque AMD e Intel van en esa dirección. Yo me esperarría.

Lo que dije antes es para funcionar en iA local sin frustraciones y más o menos minimizar desgaste de hardware acelerado, aunque bien pensado ... comprar ahora es un error, mejor observar como va el mercado

Caska

ForoCoches: Usuario

30-may-2026 15:49

#20

IA local hoy en día sirve solo para jugar, no vale la pena invertir pasta en hardware. Si quieres uso profesional mejor pagar por un servicio mensual y ir cambiando según sale alguno mejor o mas barato.

g4bro

cadáver fresco

30-may-2026 16:50

#21

Lo mas cómodo hoy en día para IA local es un Mac Studio con 64 gigas de memoria o mas.

Eso sí, la dolorosa va a ser a partir de 3200 euros IVA incluido.

Pero al precio al que están las gráficas de PC y la RAM, no me parece ni mal. Y encima te queda un Mac de la polla para trabajar, y no una enorme y ruidosa central térmica como el PC.

MalditoBendito

ForoCoches: Usuario

30-may-2026 18:43

#22

Cita de GuanBunny

Podrás usar modelos ligeros y optimizados, pero no será tan completo como un modelo en la nube.
Si quieres un equipo en condiciones para tener una experiencia lo mas similar a los modelos en la nube, prepara bien el bolsillo, porque algo serio se mete en 50k
Para que te hagas una idea, no usan gráficas como tal, sino tarjetas dedicadas para IA, como las H100 con 80Gb de VRAM.

Sale a cuenta buscar ias en la nube de segundas marcas no tan conocidas que tengan buen rendimiento. Minimax por ejemplo.

← A Electrónica / Informática

IA local

Foros relacionados

General

Electrónica / Informática

Videojuegos

Empleo / Emprendimiento

Oposiciones

Viajes

Basket

InverForo

Criptomonedas