IA local
26-may-2026 08:19
#1
| Buenos dias shurs , estaba pensando en montarme un equipo para tener ia local pero nose muy bien que tener , he oido openclaw, hermes y cosas asi , que con un mac mini m4 era suficiente , pero que tan rentable es? , que me recomendais ? |
26-may-2026 08:31
#2
| Una cosa es correr una IA en local, para que lo necesitas una GPU y RAM potente y ejecutar los LLM sobre ellos..Y otra correr agentes que tiran de modelos en la nube, para lo segundo con un miniPC barato de 200€ vas sobrado. |
26-may-2026 09:16
#3
| Si quieres que sea 100% en local vas a necesitar mucha VRAM y procesador para que no te haga cuello de botella. Nate Gentile usó openclaw y parecía muy impresionante pero el cabrón lo hizo con 120GB de VRAM y encima lo brikeó. |
26-may-2026 09:27
#4
| Op para que te hagas una idea, nate gentile lo hizo en un pc de 10.000€ y a la cuarta frase le dijo que tenía la memoria full |
26-may-2026 09:42
#5
|
Forocuñados te va a decir que es imposible, pero lo principal es saber el uso que le quieres dar a esa IA Hay bastantes modelos que pueden correr perfectamente en local. Eso si, no esperes tener un ChatGPT completo en local. |
26-may-2026 10:30
#8
| Cómo te han comentado por aquí, depende de lo que quieras y para qué. Con OpenCode puedes ir con una suscripción tipo de 15€ mes, viendo que modelos necesitas, optimizando consumo de tokens y un miniPC pachanguero de 200€. |
26-may-2026 18:11
#9
|
Va a costarte un dinero. Echale que al final facil 1800€ salvo que saques cosas de segunda mano. Las GPUs con 24gb de vram se te van, nuevas, a 1200€. A nada que le metas 32 de ram, placa, CPU, fuente tocha y un SSD, estás en 1800€ y no te has enterado. Menos que 24gb de vram no te lo plantees para algo medio serio. |
26-may-2026 21:31
#10
|
NVidia 5090 RAM a mansalva CPU con NPU Con una 5070 y un Ryzen nosequé X3D harás poco o nada. Bueno sí, el ridículo. |
27-may-2026 06:11
#12
| No hace falta que tengas la ultima gráfica por existir, yo tengo una 4060 ti y tira casi todo, lo unico que varia es el tiempo y para algunas llm tira mas de procesador. |
27-may-2026 09:15
#14
|
De ahí que la comparación no sea justa. Todo depende de para que lo uses y que modelo(y su contexto máximo) Nate la cago cargando modelos mas grandes de lo que podía...no lo pondría como referencia de IA |
29-may-2026 15:06
#15
| Yo he intentado montar Ia desde ollama, aumente la ram a 32 , tengo un ryzen 7 y no chuta. Al final he metido diez pavos en openrouter y usando el nemotron 3 con hermes, y no me termina de convencer, hace nada metí diez pavos más en Google one para antigravity 2.0 y creo decididamente que es lo mejor que he hecho, he probado openclaw, Hermes, VStudio, he usado Ia gratis de kilo, ollama, lmstudio, groq, y el problema siempre el mismo, contexto. Ahora el problema con antigravity es otro, va como un tiro, estoy programando bots de arbitraje, y me da para una hora y luego cuatro horas y medio de recreo de espera de recarga. No hay nada perfecto. Pero los modelos de ia local aunque estén cuantificados no creo que puedas mover más de 28b parametros, a no ser que tengas un super equipo, creo que sale más rentable cuentas de tarifa plana, mírate modelos chinos si quieres ahorrar algo. Para todo lo demás, mastercard |
29-may-2026 15:55
#16
|
Veo muchas ideas rarunas en el hilo, voy a intentar aclarar algunos conceptos. Lo primero que debes definir es qué quieres hacer exactamente. Veo que mencionas OpenClaw y Hermes, pero en si mismo no hacen "nada", tienes que instruirles para hacer lo que tu quieras y hay un esfuerzo detrás si quieres que sea consistente con algunas tareas. El boom al que dio salida OpenClaw, se ha deshinchado bastante porque no hay tantos casos de uso reales que necesiten esto. Como concepto hace gracia pero no super util tampoco. Así que define primero qué quieres/necesitas conseguir con IA y luego hablamos de la estrategia (herramientas, metodologías, integración y finalmente construir vs comprar) Esto tampoco es cierto, hay muchos flujos de trabajo que levantan sub-agentes en local que consumen recursos del equipo, aunque el trabajo de "pensar" lo haga la IA en un Cloud, necesitas cierta cantidad de memoria y potencia de procesado en local de todos modos para alimentar esa IA remota. Yo he intentado montar Ia desde ollama, aumente la ram a 32 , tengo un ryzen 7 y no chuta. Al final he metido diez pavos en openrouter y usando el nemotron 3 con hermes, y no me termina de convencer, hace nada metí diez pavos más en Google one para antigravity 2.0 y creo decididamente que es lo mejor que he hecho, he probado openclaw, Hermes, VStudio, he usado Ia gratis de kilo, ollama, lmstudio, groq, y el problema siempre el mismo, contexto. Ahora el problema con antigravity es otro, va como un tiro, estoy programando bots de arbitraje, y me da para una hora y luego cuatro horas y medio de recreo de espera de recarga. No hay nada perfecto. Pero los modelos de ia local aunque estén cuantificados no creo que puedas mover más de 28b parametros, a no ser que tengas un super equipo, creo que sale más rentable cuentas de tarifa plana, mírate modelos chinos si quieres ahorrar algo. Para todo lo demás, mastercard
Para IA local el procesador no afecta tanto, es más la gráfica. Tampoco es tanto la RAM sino la vRAM (o memoria compartida en caso de un SoC). Por mucho que le pongan "AI" en el nombre de los procesadores significa que poder pueden correr cosas pequeñitas pero no son muy potentes para este tema. En el caso concreto que mencionas (Antigravity) entiendo que tu uso es programar software, obviamente openclaw, hermes y similares no están pensados ni mucho menos optimizados para ello, solo sirven para gastar tokens extra tontamente. Otro error mas al carro. Lo que te pasa es lo siguiente: El modelo que has cargado (+ contexto + kv cache + ...) no cabe en la vRAM de tu gráfica -> tiene que utilizar la RAM de buffer y por tanto utilizar la CPU de intermediario. Es decir, si tira de procesador es mala señal, te falta hardware (memoria gráfica justamente) y pasas a tener un cuello de botella. Esto se conoce como offloading de capas a la CPU. La 4060 ti creo salía en versión de 8Gb y 16Gb de vRAM, sea cual sea, para correr IA en local, en términos generales, es más bien poco. Corrijo. Si tu caso de uso es por ejemplo hacer OCR de tickets del supermercado esto lo puedes hacer perfectísimamente con un modelo pequeñito de apenas 0.9B (como este). Unos 2.2Gb en memoria + lo que ocupe contexto, kv cache etc <-- esto es configurable, el mismo modelo pequeñito si metes el máximo de ventana de contexto puede llegar a ocupar más de 20Gb en vRAM, vigilad con eso! Pero para uso general, un Gemma 4 26B ya ocupa más que los 16Gb que tienes (en el mejor de los casos) en una 4060 ti, y eso sin contar contexto ni kv cache etc Otra mezcla de churros con merinas. La IA puede correr en:
Entendamos que una gráfica es simplemente un SoC (system on a chip), que contiene un procesador especializado con su propia RAM (vRAM). Si un modelo es demasiado grande y el servidor (Ollama, Ollama cpp, LM Studio o el que sea) tiene que hacer offloading hacia la RAM, ahi ya cagaste. Si te pillas una 5090 deberias restringir tu workflow a los 32Gb de vRAM de la 5090, si empieza a consumir RAM y CPU es que ya está haciendo offloading y todo empieza a ir lento. Depende del uso en particular pero a efectos generales, esta frase es correcta. ____ Mac la verdad es una muy buena opción, el motivo es que es un SoC con capacidad de tener mucha memoria compartida. Puedes correr los mismos workflows en un Macbook Pro M5 Pro 48Gb de RAM que en un PC con una RTX 5090 (donde habría que sumar el coste del resto del equipo, claro). El problema que tenemos es que los chips M5 son los que llevan aceleradores de AI (los M4 todavía no lo llevaban), y por otro lado, tampoco tenemos versión M5 del Mac Mini, ni del Mac Studio... La realidad es que si Apple hoy saca un mac mini con un M5 Pro y opción a subirlo a 64Gb de RAM, sería probablemente la mejor opción para correr IA rendimiento/precio de lejos, pero también probablemente tendrían millones de pedidos y el tiempo de espera de los Mac Mini está ya en más de 2 meses En resumen, explica bien qué es lo que quieres hacer y con ello podremos definir una solución mejor. Hay cosas que con una RTX 3060 de 12Gb vas sobrao, otras que con una 5090 te quedas corto, quiza interesa saber lo mejorcito para sacarle partido a IA en remoto etc |
29-may-2026 18:37
#17
|
Veo muchas ideas rarunas en el hilo, voy a intentar aclarar algunos conceptos.
Lo primero que debes definir es qué quieres hacer exactamente. Veo que mencionas OpenClaw y Hermes, pero en si mismo no hacen "nada", tienes que instruirles para hacer lo que tu quieras y hay un esfuerzo detrás si quieres que sea consistente con algunas tareas. El boom al que dio salida OpenClaw, se ha deshinchado bastante porque no hay tantos casos de uso reales que necesiten esto. Como concepto hace gracia pero no super util tampoco. Así que define primero qué quieres/necesitas conseguir con IA y luego hablamos de la estrategia (herramientas, metodologías, integración y finalmente construir vs comprar) Esto tampoco es cierto, hay muchos flujos de trabajo que levantan sub-agentes en local que consumen recursos del equipo, aunque el trabajo de "pensar" lo haga la IA en un Cloud, necesitas cierta cantidad de memoria y potencia de procesado en local de todos modos para alimentar esa IA remota. Para IA local el procesador no afecta tanto, es más la gráfica. Tampoco es tanto la RAM sino la vRAM (o memoria compartida en caso de un SoC). Por mucho que le pongan "AI" en el nombre de los procesadores significa que poder pueden correr cosas pequeñitas pero no son muy potentes para este tema. En el caso concreto que mencionas (Antigravity) entiendo que tu uso es programar software, obviamente openclaw, hermes y similares no están pensados ni mucho menos optimizados para ello, solo sirven para gastar tokens extra tontamente. Otro error mas al carro. Lo que te pasa es lo siguiente: El modelo que has cargado (+ contexto + kv cache + ...) no cabe en la vRAM de tu gráfica -> tiene que utilizar la RAM de buffer y por tanto utilizar la CPU de intermediario. Es decir, si tira de procesador es mala señal, te falta hardware (memoria gráfica justamente) y pasas a tener un cuello de botella. Esto se conoce como offloading de capas a la CPU. La 4060 ti creo salía en versión de 8Gb y 16Gb de vRAM, sea cual sea, para correr IA en local, en términos generales, es más bien poco. Corrijo. Si tu caso de uso es por ejemplo hacer OCR de tickets del supermercado esto lo puedes hacer perfectísimamente con un modelo pequeñito de apenas 0.9B (como este). Unos 2.2Gb en memoria + lo que ocupe contexto, kv cache etc <-- esto es configurable, el mismo modelo pequeñito si metes el máximo de ventana de contexto puede llegar a ocupar más de 20Gb en vRAM, vigilad con eso! Pero para uso general, un Gemma 4 26B ya ocupa más que los 16Gb que tienes (en el mejor de los casos) en una 4060 ti, y eso sin contar contexto ni kv cache etc Otra mezcla de churros con merinas. La IA puede correr en:
Entendamos que una gráfica es simplemente un SoC (system on a chip), que contiene un procesador especializado con su propia RAM (vRAM). Si un modelo es demasiado grande y el servidor (Ollama, Ollama cpp, LM Studio o el que sea) tiene que hacer offloading hacia la RAM, ahi ya cagaste. Si te pillas una 5090 deberias restringir tu workflow a los 32Gb de vRAM de la 5090, si empieza a consumir RAM y CPU es que ya está haciendo offloading y todo empieza a ir lento. Depende del uso en particular pero a efectos generales, esta frase es correcta. ____ Mac la verdad es una muy buena opción, el motivo es que es un SoC con capacidad de tener mucha memoria compartida. Puedes correr los mismos workflows en un Macbook Pro M5 Pro 48Gb de RAM que en un PC con una RTX 5090 (donde habría que sumar el coste del resto del equipo, claro). El problema que tenemos es que los chips M5 son los que llevan aceleradores de AI (los M4 todavía no lo llevaban), y por otro lado, tampoco tenemos versión M5 del Mac Mini, ni del Mac Studio... La realidad es que si Apple hoy saca un mac mini con un M5 Pro y opción a subirlo a 64Gb de RAM, sería probablemente la mejor opción para correr IA rendimiento/precio de lejos, pero también probablemente tendrían millones de pedidos y el tiempo de espera de los Mac Mini está ya en más de 2 meses En resumen, explica bien qué es lo que quieres hacer y con ello podremos definir una solución mejor. Hay cosas que con una RTX 3060 de 12Gb vas sobrao, otras que con una 5090 te quedas corto, quiza interesa saber lo mejorcito para sacarle partido a IA en remoto etc |
30-may-2026 04:52
#18
|
Necesitas ordenador con memoria unificada, porque a base de tarjetas graficas te dejas la pasta que te cuesta una suscripción los próximos 5 años. El mac mini básico es una mierda para eso, lo sé porque tengo uno y lo he intentado. Además que ya no hay. Sobre todo porque el ancho de banda de la memoria es una décima parte que el de una tarjeta gráfica. Te quedan dos opciones no excluyentes: 1.Te esperas a que salga el mac mini m5 pro con 48 gb y rezas para que no pase de los 3.000 pavos 2. Te vas a por un equipo con ryzen 9 ai hx 395 con memoria unificada y con bus de memoria de 256 bits, que tiene un ancho de banda similar, como el GMKtec EVO-X2. Aún así no te esperes un gemini 3,5 o un sonnet 4.6 |
30-may-2026 15:16
#19
|
Otra mezcla de churros con merinas. La IA puede correr en:
Si un modelo es demasiado grande y el servidor (Ollama, Ollama cpp, LM Studio o el que sea) tiene que hacer offloading hacia la RAM, ahi ya cagaste. Si te pillas una 5090 deberias restringir tu workflow a los 32Gb de vRAM de la 5090, si empieza a consumir RAM y CPU es que ya está haciendo offloading y todo empieza a ir lento. Mac Studio esa es la referencia de arquitectura del mercado actual para iA en local. Lo que saque AMD e Intel van en esa dirección. Yo me esperarría. Lo que dije antes es para funcionar en iA local sin frustraciones y más o menos minimizar desgaste de hardware acelerado, aunque bien pensado ... comprar ahora es un error, mejor observar como va el mercado |
30-may-2026 15:49
#20
| IA local hoy en día sirve solo para jugar, no vale la pena invertir pasta en hardware. Si quieres uso profesional mejor pagar por un servicio mensual y ir cambiando según sale alguno mejor o mas barato. |
30-may-2026 16:50
#21
|
Lo mas cómodo hoy en día para IA local es un Mac Studio con 64 gigas de memoria o mas. Eso sí, la dolorosa va a ser a partir de 3200 euros IVA incluido. Pero al precio al que están las gráficas de PC y la RAM, no me parece ni mal. Y encima te queda un Mac de la polla para trabajar, y no una enorme y ruidosa central térmica como el PC. |
30-may-2026 18:43
#22
|
Podrás usar modelos ligeros y optimizados, pero no será tan completo como un modelo en la nube. Si quieres un equipo en condiciones para tener una experiencia lo mas similar a los modelos en la nube, prepara bien el bolsillo, porque algo serio se mete en 50k Para que te hagas una idea, no usan gráficas como tal, sino tarjetas dedicadas para IA, como las H100 con 80Gb de VRAM. Sale a cuenta buscar ias en la nube de segundas marcas no tan conocidas que tengan buen rendimiento. Minimax por ejemplo. |