IA local

GuanBunny
ForoCoches: Miembro
#1
Buenos dias shurs , estaba pensando en montarme un equipo para tener ia local pero nose muy bien que tener , he oido openclaw, hermes y cosas asi , que con un mac mini m4 era suficiente , pero que tan rentable es? , que me recomendais ?
eThor
ForoCoches: Usuario
#2
Una cosa es correr una IA en local, para que lo necesitas una GPU y RAM potente y ejecutar los LLM sobre ellos..Y otra correr agentes que tiran de modelos en la nube, para lo segundo con un miniPC barato de 200€ vas sobrado.
ViktorTroska
ForoCoches: Usuario
#3
Si quieres que sea 100% en local vas a necesitar mucha VRAM y procesador para que no te haga cuello de botella. Nate Gentile usó openclaw y parecía muy impresionante pero el cabrón lo hizo con 120GB de VRAM y encima lo brikeó.
Xpr0o
¯¯¯¯¯¯¯¯
#4
Cita de ViktorTroska
Si quieres que sea 100% en local vas a necesitar mucha VRAM y procesador para que no te haga cuello de botella. Nate Gentile usó openclaw y parecía muy impresionante pero el cabrón lo hizo con 120GB de VRAM y encima lo brikeó.
Op para que te hagas una idea, nate gentile lo hizo en un pc de 10.000€ y a la cuarta frase le dijo que tenía la memoria full
Jack07
ForoCoches: Miembro
#5
Forocuñados te va a decir que es imposible, pero lo principal es saber el uso que le quieres dar a esa IA

Hay bastantes modelos que pueden correr perfectamente en local. Eso si, no esperes tener un ChatGPT completo en local.
Bangk
Forero Respetuoso
#6
Mac mini con el max de gb de ram posibles
GuanBunny
ForoCoches: Miembro
#7
Cita de eThor
Una cosa es correr una IA en local, para que lo necesitas una GPU y RAM potente y ejecutar los LLM sobre ellos..Y otra correr agentes que tiran de modelos en la nube, para lo segundo con un miniPC barato de 200€ vas sobrado.
hablame de dinero en plan modelos en nube cuales me recomiendas y asi
eThor
ForoCoches: Usuario
#8
Cita de GuanBunny
hablame de dinero en plan modelos en nube cuales me recomiendas y asi
Cómo te han comentado por aquí, depende de lo que quieras y para qué. Con OpenCode puedes ir con una suscripción tipo de 15€ mes, viendo que modelos necesitas, optimizando consumo de tokens y un miniPC pachanguero de 200€.
CibernoX_CTDI
ForoCoches: Miembro
#9
Va a costarte un dinero. Echale que al final facil 1800€ salvo que saques cosas de segunda mano.
Las GPUs con 24gb de vram se te van, nuevas, a 1200€. A nada que le metas 32 de ram, placa, CPU, fuente tocha y un SSD, estás en 1800€ y no te has enterado.

Menos que 24gb de vram no te lo plantees para algo medio serio.
kaizen_e12
Pyloric Valve inside
#10
Cita de GuanBunny
Buenos dias shurs , estaba pensando en montarme un equipo para tener ia local pero nose muy bien que tener , he oido openclaw, hermes y cosas asi , que con un mac mini m4 era suficiente , pero que tan rentable es? , que me recomendais ?
Un equipo con iA local tienes que pensar dos cosas:


NVidia 5090
RAM a mansalva
CPU con NPU


Con una 5070 y un Ryzen nosequé X3D harás poco o nada. Bueno sí, el ridículo.
bytewin
ForoCoches: Miembro
#11
Obviamente recursos de hardware necesitas si o si.
Oysterrrr
in pace leones
#12
No hace falta que tengas la ultima gráfica por existir, yo tengo una 4060 ti y tira casi todo, lo unico que varia es el tiempo y para algunas llm tira mas de procesador.
JMGH
ForoCoches: Miembro
#13
Echa un ojo a esto: https://forocoches.com/foro/showthread.php?t=10099080
Lord-Blade
ForoCoches: Miembro
#14
Cita de Xpr0o
Op para que te hagas una idea, nate gentile lo hizo en un pc de 10.000€ y a la cuarta frase le dijo que tenía la memoria full
Si le digo a una IA que me haga una historia son 2000 tokens, si le digo que se conecte a las luces de mi casa son 25000, en unos ves los tokens y en el otro no, pensar, escribir, consume.


De ahí que la comparación no sea justa. Todo depende de para que lo uses y que modelo(y su contexto máximo)


Nate la cago cargando modelos mas grandes de lo que podía...no lo pondría como referencia de IA
monguerlander9
ForoCoches: Usuario
#15
Yo he intentado montar Ia desde ollama, aumente la ram a 32 , tengo un ryzen 7 y no chuta. Al final he metido diez pavos en openrouter y usando el nemotron 3 con hermes, y no me termina de convencer, hace nada metí diez pavos más en Google one para antigravity 2.0 y creo decididamente que es lo mejor que he hecho, he probado openclaw, Hermes, VStudio, he usado Ia gratis de kilo, ollama, lmstudio, groq, y el problema siempre el mismo, contexto. Ahora el problema con antigravity es otro, va como un tiro, estoy programando bots de arbitraje, y me da para una hora y luego cuatro horas y medio de recreo de espera de recarga. No hay nada perfecto. Pero los modelos de ia local aunque estén cuantificados no creo que puedas mover más de 28b parametros, a no ser que tengas un super equipo, creo que sale más rentable cuentas de tarifa plana, mírate modelos chinos si quieres ahorrar algo. Para todo lo demás, mastercard
DonDregon
Superusuario
#16
Veo muchas ideas rarunas en el hilo, voy a intentar aclarar algunos conceptos.


Cita de GuanBunny
Buenos dias shurs , estaba pensando en montarme un equipo para tener ia local pero nose muy bien que tener , he oido openclaw, hermes y cosas asi , que con un mac mini m4 era suficiente , pero que tan rentable es? , que me recomendais ?


Lo primero que debes definir es qué quieres hacer exactamente.


Veo que mencionas OpenClaw y Hermes, pero en si mismo no hacen "nada", tienes que instruirles para hacer lo que tu quieras y hay un esfuerzo detrás si quieres que sea consistente con algunas tareas. El boom al que dio salida OpenClaw, se ha deshinchado bastante porque no hay tantos casos de uso reales que necesiten esto. Como concepto hace gracia pero no super util tampoco.


Así que define primero qué quieres/necesitas conseguir con IA y luego hablamos de la estrategia (herramientas, metodologías, integración y finalmente construir vs comprar)




Cita de eThor
Una cosa es correr una IA en local, para que lo necesitas una GPU y RAM potente y ejecutar los LLM sobre ellos..Y otra correr agentes que tiran de modelos en la nube, para lo segundo con un miniPC barato de 200€ vas sobrado.


Cita de eThor
Cómo te han comentado por aquí, depende de lo que quieras y para qué. Con OpenCode puedes ir con una suscripción tipo de 15€ mes, viendo que modelos necesitas, optimizando consumo de tokens y un miniPC pachanguero de 200€.


Esto tampoco es cierto, hay muchos flujos de trabajo que levantan sub-agentes en local que consumen recursos del equipo, aunque el trabajo de "pensar" lo haga la IA en un Cloud, necesitas cierta cantidad de memoria y potencia de procesado en local de todos modos para alimentar esa IA remota.




Cita de monguerlander9
Yo he intentado montar Ia desde ollama, aumente la ram a 32 , tengo un ryzen 7 y no chuta. Al final he metido diez pavos en openrouter y usando el nemotron 3 con hermes, y no me termina de convencer, hace nada metí diez pavos más en Google one para antigravity 2.0 y creo decididamente que es lo mejor que he hecho, he probado openclaw, Hermes, VStudio, he usado Ia gratis de kilo, ollama, lmstudio, groq, y el problema siempre el mismo, contexto. Ahora el problema con antigravity es otro, va como un tiro, estoy programando bots de arbitraje, y me da para una hora y luego cuatro horas y medio de recreo de espera de recarga. No hay nada perfecto. Pero los modelos de ia local aunque estén cuantificados no creo que puedas mover más de 28b parametros, a no ser que tengas un super equipo, creo que sale más rentable cuentas de tarifa plana, mírate modelos chinos si quieres ahorrar algo. Para todo lo demás, mastercard


Para IA local el procesador no afecta tanto, es más la gráfica. Tampoco es tanto la RAM sino la vRAM (o memoria compartida en caso de un SoC). Por mucho que le pongan "AI" en el nombre de los procesadores significa que poder pueden correr cosas pequeñitas pero no son muy potentes para este tema.


En el caso concreto que mencionas (Antigravity) entiendo que tu uso es programar software, obviamente openclaw, hermes y similares no están pensados ni mucho menos optimizados para ello, solo sirven para gastar tokens extra tontamente.




Cita de Oysterrrr
No hace falta que tengas la ultima gráfica por existir, yo tengo una 4060 ti y tira casi todo, lo unico que varia es el tiempo y para algunas llm tira mas de procesador.


Otro error mas al carro. Lo que te pasa es lo siguiente: El modelo que has cargado (+ contexto + kv cache + ...) no cabe en la vRAM de tu gráfica -> tiene que utilizar la RAM de buffer y por tanto utilizar la CPU de intermediario. Es decir, si tira de procesador es mala señal, te falta hardware (memoria gráfica justamente) y pasas a tener un cuello de botella. Esto se conoce como offloading de capas a la CPU.


La 4060 ti creo salía en versión de 8Gb y 16Gb de vRAM, sea cual sea, para correr IA en local, en términos generales, es más bien poco.


Corrijo. Si tu caso de uso es por ejemplo hacer OCR de tickets del supermercado esto lo puedes hacer perfectísimamente con un modelo pequeñito de apenas 0.9B (como este). Unos 2.2Gb en memoria + lo que ocupe contexto, kv cache etc <-- esto es configurable, el mismo modelo pequeñito si metes el máximo de ventana de contexto puede llegar a ocupar más de 20Gb en vRAM, vigilad con eso!


Pero para uso general, un Gemma 4 26B ya ocupa más que los 16Gb que tienes (en el mejor de los casos) en una 4060 ti, y eso sin contar contexto ni kv cache etc




Cita de kaizen_e12
Un equipo con iA local tienes que pensar dos cosas:


NVidia 5090
RAM a mansalva
CPU con NPU

Con una 5070 y un Ryzen nosequé X3D harás poco o nada. Bueno sí, el ridículo.


Otra mezcla de churros con merinas.


La IA puede correr en:
  • CPU + RAM
  • La gráfica


Entendamos que una gráfica es simplemente un SoC (system on a chip), que contiene un procesador especializado con su propia RAM (vRAM).




Si un modelo es demasiado grande y el servidor (Ollama, Ollama cpp, LM Studio o el que sea) tiene que hacer offloading hacia la RAM, ahi ya cagaste. Si te pillas una 5090 deberias restringir tu workflow a los 32Gb de vRAM de la 5090, si empieza a consumir RAM y CPU es que ya está haciendo offloading y todo empieza a ir lento.



Cita de CibernoX_CTDI
Va a costarte un dinero. Menos que 24gb de vram no te lo plantees para algo medio serio.




Depende del uso en particular pero a efectos generales, esta frase es correcta.




____


Mac la verdad es una muy buena opción, el motivo es que es un SoC con capacidad de tener mucha memoria compartida. Puedes correr los mismos workflows en un Macbook Pro M5 Pro 48Gb de RAM que en un PC con una RTX 5090 (donde habría que sumar el coste del resto del equipo, claro).


El problema que tenemos es que los chips M5 son los que llevan aceleradores de AI (los M4 todavía no lo llevaban), y por otro lado, tampoco tenemos versión M5 del Mac Mini, ni del Mac Studio... La realidad es que si Apple hoy saca un mac mini con un M5 Pro y opción a subirlo a 64Gb de RAM, sería probablemente la mejor opción para correr IA rendimiento/precio de lejos, pero también probablemente tendrían millones de pedidos y el tiempo de espera de los Mac Mini está ya en más de 2 meses




En resumen, explica bien qué es lo que quieres hacer y con ello podremos definir una solución mejor. Hay cosas que con una RTX 3060 de 12Gb vas sobrao, otras que con una 5090 te quedas corto, quiza interesa saber lo mejorcito para sacarle partido a IA en remoto etc
CibernoX_CTDI
ForoCoches: Miembro
#17
Cita de DonDregon
Veo muchas ideas rarunas en el hilo, voy a intentar aclarar algunos conceptos.






Lo primero que debes definir es qué quieres hacer exactamente.


Veo que mencionas OpenClaw y Hermes, pero en si mismo no hacen "nada", tienes que instruirles para hacer lo que tu quieras y hay un esfuerzo detrás si quieres que sea consistente con algunas tareas. El boom al que dio salida OpenClaw, se ha deshinchado bastante porque no hay tantos casos de uso reales que necesiten esto. Como concepto hace gracia pero no super util tampoco.


Así que define primero qué quieres/necesitas conseguir con IA y luego hablamos de la estrategia (herramientas, metodologías, integración y finalmente construir vs comprar)












Esto tampoco es cierto, hay muchos flujos de trabajo que levantan sub-agentes en local que consumen recursos del equipo, aunque el trabajo de "pensar" lo haga la IA en un Cloud, necesitas cierta cantidad de memoria y potencia de procesado en local de todos modos para alimentar esa IA remota.








Para IA local el procesador no afecta tanto, es más la gráfica. Tampoco es tanto la RAM sino la vRAM (o memoria compartida en caso de un SoC). Por mucho que le pongan "AI" en el nombre de los procesadores significa que poder pueden correr cosas pequeñitas pero no son muy potentes para este tema.


En el caso concreto que mencionas (Antigravity) entiendo que tu uso es programar software, obviamente openclaw, hermes y similares no están pensados ni mucho menos optimizados para ello, solo sirven para gastar tokens extra tontamente.








Otro error mas al carro. Lo que te pasa es lo siguiente: El modelo que has cargado (+ contexto + kv cache + ...) no cabe en la vRAM de tu gráfica -> tiene que utilizar la RAM de buffer y por tanto utilizar la CPU de intermediario. Es decir, si tira de procesador es mala señal, te falta hardware (memoria gráfica justamente) y pasas a tener un cuello de botella. Esto se conoce como offloading de capas a la CPU.


La 4060 ti creo salía en versión de 8Gb y 16Gb de vRAM, sea cual sea, para correr IA en local, en términos generales, es más bien poco.


Corrijo. Si tu caso de uso es por ejemplo hacer OCR de tickets del supermercado esto lo puedes hacer perfectísimamente con un modelo pequeñito de apenas 0.9B (como este). Unos 2.2Gb en memoria + lo que ocupe contexto, kv cache etc <-- esto es configurable, el mismo modelo pequeñito si metes el máximo de ventana de contexto puede llegar a ocupar más de 20Gb en vRAM, vigilad con eso!


Pero para uso general, un Gemma 4 26B ya ocupa más que los 16Gb que tienes (en el mejor de los casos) en una 4060 ti, y eso sin contar contexto ni kv cache etc








Otra mezcla de churros con merinas.


La IA puede correr en:
  • CPU + RAM
  • La gráfica

Entendamos que una gráfica es simplemente un SoC (system on a chip), que contiene un procesador especializado con su propia RAM (vRAM).




Si un modelo es demasiado grande y el servidor (Ollama, Ollama cpp, LM Studio o el que sea) tiene que hacer offloading hacia la RAM, ahi ya cagaste. Si te pillas una 5090 deberias restringir tu workflow a los 32Gb de vRAM de la 5090, si empieza a consumir RAM y CPU es que ya está haciendo offloading y todo empieza a ir lento.









Depende del uso en particular pero a efectos generales, esta frase es correcta.




____


Mac la verdad es una muy buena opción, el motivo es que es un SoC con capacidad de tener mucha memoria compartida. Puedes correr los mismos workflows en un Macbook Pro M5 Pro 48Gb de RAM que en un PC con una RTX 5090 (donde habría que sumar el coste del resto del equipo, claro).


El problema que tenemos es que los chips M5 son los que llevan aceleradores de AI (los M4 todavía no lo llevaban), y por otro lado, tampoco tenemos versión M5 del Mac Mini, ni del Mac Studio... La realidad es que si Apple hoy saca un mac mini con un M5 Pro y opción a subirlo a 64Gb de RAM, sería probablemente la mejor opción para correr IA rendimiento/precio de lejos, pero también probablemente tendrían millones de pedidos y el tiempo de espera de los Mac Mini está ya en más de 2 meses




En resumen, explica bien qué es lo que quieres hacer y con ello podremos definir una solución mejor. Hay cosas que con una RTX 3060 de 12Gb vas sobrao, otras que con una 5090 te quedas corto, quiza interesa saber lo mejorcito para sacarle partido a IA en remoto etc
Yo tiré bastante tiempo con una 3060 de 12gb y me daba para reconocimiendo de voz con parakeet + modelos de 8/14B sin problema, aunque hay que reconocer que el salto de calidad a los modelos de ~30B es grande. Yo voy a meter una segunda tarjeta de 24gb para tener 48gb de vram. Sale más barato que pagar por una 5090.
felizycontento
ForoCoches: Miembro
#18
Necesitas ordenador con memoria unificada, porque a base de tarjetas graficas te dejas la pasta que te cuesta una suscripción los próximos 5 años.

El mac mini básico es una mierda para eso, lo sé porque tengo uno y lo he intentado. Además que ya no hay.


Sobre todo porque el ancho de banda de la memoria es una décima parte que el de una tarjeta gráfica.


Te quedan dos opciones no excluyentes:


1.Te esperas a que salga el mac mini m5 pro con 48 gb y rezas para que no pase de los 3.000 pavos
2. Te vas a por un equipo con ryzen 9 ai hx 395 con memoria unificada y con bus de memoria de 256 bits, que tiene un ancho de banda similar, como el GMKtec EVO-X2.


Aún así no te esperes un gemini 3,5 o un sonnet 4.6
kaizen_e12
Pyloric Valve inside
#19
Cita de DonDregon




Otra mezcla de churros con merinas.


La IA puede correr en:
  • CPU + RAM
  • La gráfica
Entendamos que una gráfica es simplemente un SoC (system on a chip), que contiene un procesador especializado con su propia RAM (vRAM).




Si un modelo es demasiado grande y el servidor (Ollama, Ollama cpp, LM Studio o el que sea) tiene que hacer offloading hacia la RAM, ahi ya cagaste. Si te pillas una 5090 deberias restringir tu workflow a los 32Gb de vRAM de la 5090, si empieza a consumir RAM y CPU es que ya está haciendo offloading y todo empieza a ir lento.







Mac Studio esa es la referencia de arquitectura del mercado actual para iA en local. Lo que saque AMD e Intel van en esa dirección. Yo me esperarría.




Lo que dije antes es para funcionar en iA local sin frustraciones y más o menos minimizar desgaste de hardware acelerado, aunque bien pensado ... comprar ahora es un error, mejor observar como va el mercado
Caska
ForoCoches: Usuario
#20
IA local hoy en día sirve solo para jugar, no vale la pena invertir pasta en hardware. Si quieres uso profesional mejor pagar por un servicio mensual y ir cambiando según sale alguno mejor o mas barato.
g4bro
cadáver fresco
#21
Lo mas cómodo hoy en día para IA local es un Mac Studio con 64 gigas de memoria o mas.

Eso sí, la dolorosa va a ser a partir de 3200 euros IVA incluido.

Pero al precio al que están las gráficas de PC y la RAM, no me parece ni mal. Y encima te queda un Mac de la polla para trabajar, y no una enorme y ruidosa central térmica como el PC.
MalditoBendito
ForoCoches: Usuario
#22
Cita de GuanBunny
Buenos dias shurs , estaba pensando en montarme un equipo para tener ia local pero nose muy bien que tener , he oido openclaw, hermes y cosas asi , que con un mac mini m4 era suficiente , pero que tan rentable es? , que me recomendais ?

Podrás usar modelos ligeros y optimizados, pero no será tan completo como un modelo en la nube.
Si quieres un equipo en condiciones para tener una experiencia lo mas similar a los modelos en la nube, prepara bien el bolsillo, porque algo serio se mete en 50k
Para que te hagas una idea, no usan gráficas como tal, sino tarjetas dedicadas para IA, como las H100 con 80Gb de VRAM.


Sale a cuenta buscar ias en la nube de segundas marcas no tan conocidas que tengan buen rendimiento. Minimax por ejemplo.
Herramientas

← A Electrónica / Informática