placas some-terminal

195 € y una Raspberry Pi: esta tarjeta china de IA le da una paliza al HAT oficial

El M5Stack LLM-8850 es una tarjeta M.2 con 24 TOPS y 8 GB de RAM que convierte tu Raspberry Pi 5 en una estación de IA local. Análisis, setup y veredicto.

ver producto ~195€
195 € y una Raspberry Pi: esta tarjeta china de IA le da una paliza al HAT oficial

💡 Antes de empezar Necesitas: Raspberry Pi 5 (4 u 8 GB), fuente de alimentación oficial de 27W y conexión a internet para la instalación inicial Tiempo estimado: Una tarde (~2-3 horas la primera vez) Nivel: Necesitas perder el miedo a la terminal — hay que copiar comandos, pero la documentación te lleva de la mano

Alguien en un foro chino conectó esta tarjeta a una Raspberry Pi 5, le lanzó un modelo de lenguaje de 1.500 millones de parámetros y obtuvo 15 tokens por segundo — más del doble de lo que consigue el HAT oficial de Raspberry Pi, que cuesta más. Lo probaron con reconocimiento de voz, con análisis de vídeo de 16 cámaras simultáneas, y con un asistente de voz que funciona sin internet. Todo local. Todo en una plaquita del tamaño de un chicle.

Qué es exactamente

El M5Stack LLM-8850 es una tarjeta en formato M.2 2242 — un estándar de tarjetas pequeñas que se conectan directamente a la placa base, como los SSD de los portátiles — construida alrededor del SoC Axera AX8850. Dentro lleva tres cosas importantes:

  • Una NPU de 24 TOPS — un chip especializado en cálculos de inteligencia artificial, capaz de hacer 24 billones de operaciones por segundo con datos en formato INT8, que es el tipo de precisión que usan los modelos de IA optimizados para dispositivos pequeños.
  • 8 GB de RAM LPDDR4x propia, dedicada exclusivamente a los modelos de IA. Esto es clave: tu Raspberry Pi no pierde ni un megabyte de su RAM.
  • Un VPU — procesador de vídeo por hardware — capaz de decodificar H.265 hasta 8K, lo que en la práctica significa que puede manejar 16 streams de cámaras 1080p a la vez sin despeinarse.

La tarjeta viene de M5Stack, una empresa del ecosistema maker chino vinculada a Espressif — sí, los mismos del ESP32 que mueve medio mundo IoT. El kit que analizamos incluye el adaptador HAT para Raspberry Pi 5. El módulo M.2 solo cuesta unos 139 $, pero sin el adaptador no lo vas a poder enchufar fácilmente a la Pi.

Por qué nos interesa

La respuesta corta: porque es la primera tarjeta asequible que permite correr un pipeline completo de IA de voz — STT → LLM → TTS (reconocimiento de voz, modelo de lenguaje para pensar la respuesta y síntesis de voz para hablar) — en una Raspberry Pi 5, completamente offline.

La respuesta larga empieza con los números. CNX Software, una referencia en hardware embebido, midió 15 tokens/s con Qwen2.5-1.5B en esta tarjeta. El Hailo-10 del Raspberry Pi AI HAT+ 2 oficial se queda en 6,7 tokens/s con el mismo modelo. Eso es más del doble de velocidad generando texto — la diferencia entre una respuesta que fluye y una que te hace esperar.

Pero lo que realmente la hace interesante es la versatilidad. Soporta Llama 3.2 y Qwen3 — dos familias de LLMs (modelos de lenguaje grandes, los “cerebros” que generan texto como ChatGPT) — optimizados para correr en su NPU. También corre Whisper — el sistema de transcripción de voz de OpenAI, gratuito y open source — para convertir lo que dices en texto. Y CLIP, el modelo de visión de OpenAI que entiende imágenes. Y YOLO v8/v11 para detección de objetos en tiempo real. Todo acelerado por hardware.

La comunidad china en Zhihu — algo así como el Reddit técnico de China — ya está usando esta tarjeta como cerebro de NVRs inteligentes con Frigate (un sistema de videovigilancia open source que detecta personas, coches y animales con IA) conectado a Home Assistant — la plataforma de domótica open source más popular. Jeff Geerling, probablemente el youtuber de Raspberry Pi más conocido del mundo, ya tiene issues abiertos en GitHub explorando la integración.

Cómo empezar

Lo primero: conecta el módulo M.2 al adaptador HAT, enchufa el HAT en los pines GPIO — los 40 pines de conexión que tiene la Raspberry Pi en su parte superior — y conecta el cable plano al conector PCIe de tu Pi 5.

Después, con tu Raspberry Pi encendida y Raspberry Pi OS instalado, abre la terminal y ejecuta estos comandos para instalar el runtime AXCL — el software que permite que tu sistema operativo hable con la NPU:

# Descarga e instala el runtime de Axera para la tarjeta
wget https://github.com/axera-tech/axcl-runtime/releases/latest/download/axcl-runtime-arm64.deb
sudo dpkg -i axcl-runtime-arm64.deb

Una vez instalado, puedes comprobar que la tarjeta está detectada correctamente:

# Verifica que el sistema reconoce la NPU
axcl-smi

Si ves la tarjeta listada con sus 8 GB de memoria, ya estás listo. AXCL ofrece APIs — interfaces de programación, formas de hablar con el hardware desde tu código — en Python y C, así que desplegar un modelo es cuestión de unas pocas líneas. La documentación oficial de M5Stack tiene guías paso a paso en inglés para cargar Whisper, Llama 3.2 y YOLO con ejemplos funcionales que puedes copiar y pegar.

Lo que no te van a contar

El ecosistema Axera es joven y muy centrado en China. La documentación en inglés existe pero es más escueta que la china, y cuando algo falla, las respuestas suelen estar en foros en mandarín. Los modelos tienen que estar convertidos al formato de Axera — no puedes coger cualquier GGUF de Hugging Face y lanzarlo directamente como harías con llama.cpp (el motor open source que corre LLMs en CPU). La lista de modelos soportados crece rápido, pero hoy no es tan amplia como la de Hailo o Coral. Y los 15 tokens/s son impresionantes para el precio, pero estamos hablando de modelos de 1.5B parámetros — si necesitas modelos más grandes, vas a notar el cuello de botella del ancho de banda PCIe Gen 2 de la Raspberry Pi 5. Por último: a 195 € el kit completo, más el coste de la Pi 5, estás rondando los 300 € de inversión total.

Veredicto

Si quieres montar un asistente de voz local, un NVR inteligente con Frigate o simplemente experimentar con IA en el edge sin vender un riñón — y no te asusta que la comunidad hable más mandarín que inglés — esta tarjeta es la mejor relación potencia/precio que puedes comprar hoy para una Raspberry Pi 5. Si prefieres un ecosistema maduro con soporte en inglés y no te importa ir más lento, el Hailo-10 sigue siendo la apuesta segura. Pero los números no mienten: por menos dinero, la M5Stack va más rápido.