Audio

Micrófonos, DACs y hardware para STT/TTS

2 / 2 cacharros
Nivel:
Ordenar:

El micrófono es la pieza más infravalorada de un stack de IA local con voz. La precisión de Whisper — el modelo de transcripción de referencia — depende directamente de la calidad de la señal de entrada. Un micrófono malo convierte en inútil incluso el modelo más potente. Y un buen micrófono en un entorno con eco o ruido ambiente tampoco funciona. El hardware de audio para IA local tiene sus propias reglas.

Cómo elegir

Para transcripción local con Whisper, prioriza micrófonos con supresión de ruido por hardware o direccionalidad cardiode. Los micrófonos omnidireccionales captan demasiado ruido ambiente. Para asistentes de voz que responden a distancia, los arrays de micrófonos (como los ReSpeaker) superan a cualquier micrófono de cápsula individual.

Preguntas frecuentes

¿Qué micrófono recomiendas para usar Whisper en local?

Depende del caso de uso. Para transcripción de voz cerca del micro (podcasting, dictado), cualquier USB con patrón cardioide funciona bien. Para detección de wake word y comandos a distancia, un array de micrófonos como el ReSpeaker marca una diferencia enorme.

¿Puedo usar los AirPods o auriculares Bluetooth como micrófono para IA local?

Técnicamente sí, pero con limitaciones. Los auriculares Bluetooth en modo manos libres bajan la calidad de audio a 8kHz para reducir latencia. Whisper funciona mejor con 16kHz o más. Para experimentar está bien, pero para uso continuo un micrófono USB dedicado da mejores resultados.

Ver guía completa de hardware para IA →