Computación

GPUs, mini PCs, NPUs y aceleradoras de inferencia local

4 / 4 cacharros

Las GPUs y mini PCs de esta categoría son el núcleo de cualquier stack de IA local. La diferencia entre correr un modelo de forma usable o frustrante pasa casi siempre por aquí: cantidad de VRAM en GPU, RAM unificada en chips modernos, y la presencia o ausencia de una NPU que acelere la inferencia sin disparar el consumo.

computacion ~1199€

Un cacharro de bolsillo con 80 GB de RAM que corre IA de 120B parámetros sin internet — ¿demasiado bueno para ser verdad?

Tiiny AI Pocket Lab: 80 GB de memoria, modelos de 120B offline y récord Guinness. Analizamos qué promete, qué sabemos y qué no cuadra del todo.

anyone

computacion ~429€

La GPU de 429 € que hace lo que la RTX 4090 hacía por 1.800 € — y cómo correr IA local con ella

La RTX 5060 Ti 16GB es la GPU más barata con arquitectura Blackwell y 16 GB de VRAM. Corre modelos de IA como Gemma 4 14B a 50 tok/s con Ollama.

gpu blackwell local-llm

some-terminal

computacion ~249€

249 € y 12 GB de VRAM: la Intel Arc B580 es la GPU más barata para correr IA en casa

La Intel Arc B580 ofrece 12 GB de VRAM por 249 €, suficiente para correr modelos de IA de 7B parámetros en local. Te contamos cómo empezar.

gpu local-llm budget

some-terminal

computacion ~110€

110 € y una PlayStation 5 muerta: cómo montar una estación de IA local con 16 GB de memoria

La APU AMD BC-250, reciclada de PS5 defectuosas, corre modelos de IA de 14B parámetros con Ollama y Vulkan por una fracción del precio. Te contamos cómo.

segunda-vida llm-local hack-inesperado

done-it-before

Cómo elegir

El parámetro más importante es la memoria disponible para el modelo — VRAM si es GPU dedicada, RAM unificada si es Apple Silicon o Ryzen AI. Con menos de 8 GB puedes experimentar, pero los modelos interesantes (7B+) necesitan 12-16 GB. Si el hardware va a estar siempre encendido, el consumo en idle importa tanto como el pico de rendimiento.

Preguntas frecuentes

¿Cuánta VRAM necesito para correr IA en local?

El mínimo práctico son 8 GB de VRAM para modelos de 7B parámetros en cuantización Q4. Con 12 GB tienes margen para modelos más grandes o contextos más largos. Por debajo de 8 GB puedes experimentar, pero los modelos más útiles no cabrán.

¿Es mejor una GPU dedicada o un chip con NPU integrada?

Depende del caso de uso. Una GPU dedicada (12+ GB VRAM) gana en modelos grandes de lenguaje. Un chip con NPU integrada (Apple M4, Ryzen AI) gana en eficiencia energética y en tareas de voz e imagen. Si el servidor va a estar 24/7, la NPU integrada suele ser más sensata.

¿Funciona Intel Arc para IA local?

Sí, pero con matices. Intel Arc funciona bien con Ollama en Windows y, con algo más de configuración, en Linux. El soporte de drivers para IA en Linux ha mejorado mucho en 2025 pero sigue siendo menos maduro que NVIDIA CUDA.

Ver guía completa de hardware para IA →