Construcción de HMIs industriales impulsados por IA

Consideraciones arquitectónicas y un camino modular hacia el futuro

Los operadores de planta interactúan con máquinas complejas a través de pantallas táctiles, paneles de control y displays que deben adaptarse a los requisitos de seguridad y a los objetivos de producción. Al mismo tiempo, las plantas enfrentan escasez de personal, metas de productividad agresivas y crecientes preocupaciones de seguridad.

Las interfaces hombre‑máquina (HMI) mejoradas con IA pueden reconocer a operadores individuales, optimizar flujos de trabajo, reducir errores humanos y hacer cumplir políticas de acceso. Por ejemplo, un acceso de usuario personalizado mediante reconocimiento facial puede identificar a los operadores autorizados a través de una cámara antes de permitirles acceder a equipos o documentación. Esto reduce el riesgo de interacciones no autorizadas y garantiza que solo personal capacitado opere maquinaria crítica.

Esta capacidad impulsada por IA constituye una actualización incremental de las arquitecturas HMI existentes y ofrece a los OEM e integradores de sistemas un camino para desarrollar portafolios de productos HMI del tipo “bueno‑mejor‑excelente”.

Comprender el mejor enfoque para diseñar dicho portafolio comienza definiendo la arquitectura básica y los componentes de un HMI industrial típico.

Arquitectura de un HMI industrial estándar y ampliación con IA

Un HMI industrial convencional es un sistema complejo que normalmente ejecuta un sistema operativo embebido (como Linux o Windows), se comunica con controladores lógicos programables (PLC) y con sensores a través de puertos seriales o Ethernet, y presenta pantallas de operador creadas con una herramienta HMI/SCADA.

Para soportar esta funcionalidad, un HMI industrial estándar incluye como mínimo los siguientes componentes:

  • Una pantalla (a menudo entre 7" y 15") con panel táctil
  • Un procesador embebido, memoria y almacenamiento
  • Conectividad de campo y Ethernet
  • Una carcasa robusta diseñada para operar en entornos industriales con clasificación IP

La ampliación de la arquitectura HMI convencional con capacidades de IA requiere mayores recursos. Por ejemplo, el reconocimiento facial se basa en redes neuronales convolucionales. Modelos “ligeros” como FaceNet o YOLOv3Face pueden ejecutarse mediante OpenCV y LiteRT (TensorFlow Lite), optimizando la inferencia en CPU y en unidades de procesamiento neuronal (NPU).

En cuanto al rendimiento, ofrecer una experiencia fluida de reconocimiento facial exige baja latencia y reducido consumo de memoria. Aunque los modelos ligeros pueden requerir solo ~1 MB de RAM, se necesita al menos 1 GB de memoria del sistema para múltiples procesos y almacenamiento seguro de plantillas biométricas.

Pruebas de una aplicación ejemplo en el SECO App Hub muestran que la inferencia en una NPU dedicada logra latencias de alrededor de 36 ms, mientras que en CPU puede superar los 440 ms. Es evidente que distintos ordenadores de visualización se ajustan mejor o peor a cargas de trabajo de IA; por lo tanto, una NPU o GPU ayuda a mantener el rendimiento en tiempo real sin sobrecargar la CPU.

Por supuesto, se necesitan también componentes adicionales no presentes en un HMI convencional para hacer realidad esta aplicación de IA:

  • Módulo de cámara con resolución suficiente y lente adecuada, junto con capacidad infrarroja (IR) para condiciones de baja luz; montado en el bisel del display y conectado mediante MIPI‑CSI o USB
  • Aceleración de IA en el borde mediante procesador con NPU, GPU o VPU integrados
  • ≥4 GB RAM y 16 GB eMMC para alojar el sistema operativo, el modelo de IA y el software de aplicación
  • Hardware root of trust, arranque seguro y cifrado para proteger plantillas faciales y autenticar a los operadores

Enfoques de diseño para ordenadores industriales HMI listos para IA

Los proveedores de equipos de automatización pueden concebir portafolios de productos HMI convencionales, con acceso personalizado y versiones más avanzadas con funciones como asistencia de alertas al operador.

Los dos enfoques de diseño más comunes son diseño monolítico o arquitectura modular:

  • Diseños monolíticos: cada HMI se crea para un caso de uso específico (display básico, acceso personalizado o IA avanzada). Cada modelo utiliza hardware propio, lo que eleva costes de desarrollo y complejidad de la cadena de suministro.
  • Arquitecturas modulares: se basan en estándares COM (computer‑on‑module). La placa base o carrier expone todas las interfaces (Ethernet, USB, puertos seriales, cámara, display, etc.) y permite escalar desde módulos CPU básicos (HMI simples) hasta procesadores de IA de alto rendimiento.

Image

La arquitectura Modular Vision HMI de SECO, al separar el módulo de cómputo del carrier de E/S, posibilita actualizar procesadores sin rediseñar todo el sistema. Los estándares COM como SMARC reducen además el time‑to‑market y minimizan riesgos al permitir usar en la misma base tanto módulos Arm como x86.

Modular Vision: un enfoque flexible para HMIs listos para IA

SECO emplea el concepto Modular Vision basado en SMARC, alineando tamaños de pantalla, procesadores y requisitos IA/no‑IA. La siguiente tabla compara tres modelos Modular Vision:

Modular Vision SKUTamaño de pantalla (pulg.)ProcesadorRendimiento IA (Acceso personalizado)Tolerancia ambientalCosto
Modular Vision 7 MX 937NXP i.MX93 (dual A55 con NPU U‑65)Precisión moderada, ~150‑200 ms; apto para autenticación facial básica.IP65 frontal; 0 °C a 60 °CBajo – precio de entrada
Modular Vision 10.1 MX 8M‑Plus10.1NXP i.MX 8M Plus (quad A53 con NPU de 2.3 TOPS)Alta precisión, latencia en tiempo real (~36 ms); soporta múltiples rostros y comandos de voz.IP65 frontal; 0 °C a 60 °CMedio – balance de costo y rendimiento
Modular Vision 15.6 ASL15.6Intel Atom x7000RE (2/4/8 núcleos con UHD Graphics)Muy alta precisión, con CPU e instrucciones VNNI más gráficos integrados; escalable a reconocimiento multi‑rostro; latencia variable según núcleos (12‑25 / 20‑40 / 35‑70 ms).IP65 frontal; 0 °C a 60 °CAlto – rendimiento premium

Todos los modelos Modular Vision comparten la misma base y pantallas, y únicamente intercambian el módulo de cómputo. El OEM puede comenzar con el modelo de 7" y luego migrar a los de 10.1" o 15.6" para añadir funciones avanzadas de IA.

Diseñar con Modular Vision

Adoptando una arquitectura Modular Vision basada en SMARC, los fabricantes de maquinaria pueden utilizar una familia escalable de HMIs que comparten diseño mecánico, conectores y entorno software. Con distribuciones modernas como Clea OS, el sistema ofrece gestión remota de dispositivos, actualizaciones seguras e integración con protocolos IIoT. Los desarrolladores pueden implementar aplicaciones de IA preconstruidas –como reconocimiento facial– y tener la seguridad de que sus algoritmos funcionarán en módulos Arm o x86 con ajustes mínimos de rendimiento.

Los modelos destacados muestran cómo el tamaño de la pantalla, la capacidad de cómputo y el costo se alinean para distintos casos de uso con IA. Con carcasas resistentes, pantallas de grado industrial e interfaces estandarizadas, estos sistemas pueden fabricarse e implementarse a escala en la línea de producción.

¿Tiene una aplicación industrial para un HMI? Contacte con SECO para analizar cómo Modular Vision, Clea OS y algoritmos de IA pueden satisfacer sus requisitos.