automatizacion anyone

135 € y una tarde: monté un asistente de IA con voz, pantalla y cámara sin soldar nada

El Pironman 5 Pro Max convierte tu Raspberry Pi 5 en un asistente de voz local con pantalla táctil, altavoces, micrófono y cámara. Todo integrado por 135 €.

ver producto ~135€
135 € y una tarde: monté un asistente de IA con voz, pantalla y cámara sin soldar nada

💡 Antes de empezar Necesitas: Una Raspberry Pi 5 (4 u 8 GB), una tarjeta microSD de 32 GB (o un SSD NVMe si quieres ir más rápido) y un cargador USB-C de 27W Tiempo estimado: 2-3 horas (montaje físico + instalación de software) Nivel: Sin experiencia previa — solo seguir pasos

El asistente que no necesita la nube

Cada vez que alguien dice “quiero montar un asistente de IA en casa”, la lista de compras se dispara: una placa, un micrófono, unos altavoces, una pantalla, una cámara, cables, adaptadores, y tres tardes pegando cosas con cinta. SunFounder ha metido todo eso en una carcasa de torre compacta que parece un mini PC de escritorio y que, literalmente, viene con su propio destornillador. Lo montas, ejecutas unos scripts, y tienes un asistente de voz local que no envía nada a ningún servidor.

Qué es exactamente el Pironman 5 Pro Max

Es una carcasa — o más bien un kit completo — diseñada para la Raspberry Pi 5 que integra todo lo que necesitas para construir un agente de IA tangible:

  • Pantalla táctil IPS de 4.3 pulgadas — lo suficiente para mostrar respuestas, controles o lo que vea la cámara
  • Altavoces estéreo de 3W — no son un home cinema, pero para respuestas de voz y notificaciones van de sobra
  • Micrófono USB con detección de palabra clave a hasta 10 metros de distancia
  • Cámara de 5 megapíxeles con soporte ajustable para visión por computador
  • Dos ranuras M.2 para SSD NVMe — una para almacenamiento rápido y otra para un acelerador Hailo-8 — un chip dedicado a procesamiento de IA, como una GPU en miniatura pero especializada en inferencia — es decir, en ejecutar modelos ya entrenados
  • UPS integrado — una pequeña batería que mantiene la Pi funcionando si se va la luz, para que no corrompa datos

La estructura es de aluminio con panel lateral transparente y ventilación activa (ventilador con LEDs RGB controlable por software). Parece un PC gaming en miniatura, pero todo tiene una función real.

Por qué nos interesa

Lo que hace especial a este cacharro no es cada pieza por separado — es que alguien se ha tomado la molestia de integrarlas todas y, sobre todo, de documentar cómo usarlas juntas para montar un asistente de IA.

SunFounder incluye una guía completa para crear un asistente de voz local usando tres herramientas open source:

  • Piper TTS — un sistema de texto a voz — es decir, TTS o Text-to-Speech — que convierte texto en una voz natural sin necesitar internet
  • Vosk STT — un sistema de voz a texto — STT o Speech-to-Text — que escucha lo que dices y lo transcribe, también sin conexión
  • Ollama — una app gratuita que te permite correr modelos de lenguaje (LLMs — los cerebros detrás de ChatGPT y similares) directamente en tu ordenador, sin depender de la nube

La combinación de los tres te da un asistente que escucha, piensa y responde, todo dentro de tu red local. La documentación también cubre la opción de usar Gemini de Google como cerebro si prefieres respuestas más potentes a cambio de conexión a internet.

Además, el kit es compatible con OpenClaw, el framework de agente personal de SunFounder, y con Home Assistant — la plataforma open source más popular para domótica — lo que significa que puedes pedirle a tu asistente que encienda las luces o suba la calefacción.

Si añades un acelerador Hailo-8 en la segunda ranura M.2, desbloqueas visión por computador local: la cámara de 5MP puede identificar objetos, personas o gestos sin enviar imágenes a ningún sitio. Esto es lo que convierte el Pironman en algo más que un altavoz inteligente — es un agente con ojos.

Cómo empezar

El montaje físico es puro Lego para adultos: la guía ilustrada te lleva paso a paso y viene hasta con destornillador. No necesitas soldar nada.

Para el software, SunFounder proporciona scripts que hacen el trabajo pesado. Primero, instala Raspberry Pi OS Trixie en tu microSD (o NVMe) usando el Raspberry Pi Imager desde cualquier ordenador. Después, abre la terminal — la aplicación de tu Pi donde escribes comandos — y ejecuta esto para instalar Ollama, que será el cerebro de tu asistente:

curl -fsSL https://ollama.com/install.sh | sh
ollama pull gemma3:4b

La primera línea descarga e instala Ollama. La segunda descarga Gemma 3 en su versión de 4 mil millones de parámetros — un modelo de Google bastante capaz que cabe en una Pi 5 con 8 GB de RAM. Es la versión «pequeña pero espabilada»: no va a escribir una novela, pero mantiene una conversación con coherencia.

Para el asistente de voz completo (micrófono + altavoces + LLM), SunFounder tiene un repo — un repositorio, es decir, una carpeta pública con código — con todo preconfigurado:

git clone https://github.com/sunfounder/openclaw-assistant.git
cd openclaw-assistant
./install.sh

El script instala Piper, Vosk y conecta todo con Ollama. Cuando termina, dices la palabra clave y el asistente responde por los altavoces.

Lo que no te van a contar

La Raspberry Pi 5 con 8 GB de RAM puede ejecutar modelos pequeños con Ollama, pero no esperes velocidades de ChatGPT. Con Gemma 3 4B vas a notar pausas de varios segundos entre que preguntas y recibes respuesta — es inferencia — el proceso de generar texto con un LLM — corriendo en un procesador ARM, no en una GPU potente. Para conversaciones fluidas, la documentación sugiere usar Gemini por API — una conexión a los servidores de Google — lo cual funciona bien pero rompe la promesa de «todo local». El micrófono USB detecta wake words a distancia, sí, pero en habitaciones con ruido de fondo (televisión, niños) la fiabilidad baja bastante. Y el precio total real es más alto de lo que parece: los 135 € son solo la carcasa. Súmale la Pi 5 (~80 €), un SSD NVMe (~30 €) y opcionalmente el Hailo-8 (~70 €). El paquete completo ronda los 250-315 €.

Veredicto

Si llevas meses queriendo un asistente de IA local con cara y ojos — literalmente — y la idea de comprar piezas sueltas y pegarlas con cinta te frena, esto es lo tuyo. Es el camino más corto entre «no tengo nada» y «tengo un agente de IA en mi escritorio». Si ya tienes una Pi 5 montada con periféricos y sabes moverte por la terminal, probablemente no necesites pagar 135 € por la integración — pero admitirás que queda bonito.