Architektonische Überlegungen und ein modularer Weg nach vorn
Werksbodenbediener interagieren mit komplexen Maschinen über Touchscreens, Dashboards und Displays, die sich an Sicherheitsanforderungen und Produktionsziele anpassen müssen. Gleichzeitig kämpfen Werke mit Personalmangel, ehrgeizigen Produktivitätszielen und erhöhten Sicherheitsbedenken.
KI‑erweiterte Human‑Machine‑Interfaces (HMIs) können einzelne Bediener erkennen, Arbeitsabläufe optimieren, menschliche Fehler reduzieren und Zugriffsrichtlinien durchsetzen. Beispielsweise kann ein personalisierter Benutzerzugang über Gesichtserkennung autorisierte Bediener per Kamera identifizieren, bevor der Zugriff auf Ausrüstung oder Dokumentation erlaubt wird. Dies verringert das Risiko unbefugter Interaktionen und stellt sicher, dass nur geschultes Personal kritische Maschinen bedient.
Diese KI‑getriebene Funktion stellt ein inkrementelles Upgrade bestehender HMI‑Architekturen dar und bietet OEMs und Systemintegratoren einen Weg zur Entwicklung von „gut‑besser‑am besten“ Industrie‑HMI‑Produktportfolios.
Das Verständnis des besten Ansatzes für die Gestaltung eines solchen Portfolios beginnt mit der Definition der Grundarchitektur und der Komponenten eines typischen industriellen HMIs.
Architektur eines Standard‑Industrie‑HMI & KI‑Erweiterung
Ein herkömmliches industrielles HMI ist ein komplexes System, das typischerweise ein Embedded‑Betriebssystem (wie Linux oder Windows) ausführt, über serielle Anschlüsse oder Ethernet mit speicherprogrammierbaren Steuerungen (PLCs) und Sensoren kommuniziert und Anwenderoberflächen darstellt, die mit einem HMI/SCADA‑Tool erstellt werden.
Zur Unterstützung dieser Funktionalität umfasst ein Standard‑Industrie‑HMI mindestens die folgenden Komponenten:
- Ein Display (häufig zwischen 7" und 15") mit Touchscreen
- Einen Embedded‑Prozessor sowie Speicher und Massenspeicher
- Schnittstellen für Feldbus‑ und Ethernet‑Konnektivität
- Ein robustes Gehäuse für den Einsatz in Industrieumgebungen mit entsprechender IP‑Schutzklasse
Die Erweiterung der konventionellen HMI‑Architektur mit KI‑Fähigkeiten erfordert zusätzliche Ressourcen. Gesichtserkennung beispielsweise basiert auf Convolutional Neural Networks. „Leichtgewichtige“ Modelle wie FaceNet oder YOLOv3Face sind für solche Aufgaben verfügbar und können mit OpenCV und LiteRT (TensorFlow Lite) zur Optimierung der Inferenz auf CPU‑ und NPU‑Hardware ausgeführt werden.
Hinsichtlich der Leistung erfordert eine flüssige Gesichtserkennung niedrige Latenz und geringen Speicherbedarf. Während Modelle zwar leichtgewichtig sein können (~1 MB RAM), benötigen sie dennoch mindestens 1 GB Systemspeicher, um mehrere Prozesse und die sichere Speicherung biometrischer Templates zu unterstützen.
Benchmarks einer Beispielanwendung im SECO App Hub zeigen, dass die Inferenz auf einer dedizierten NPU eine Latenz von ca. 36 ms erreicht, während die reine CPU‑Ausführung über 440 ms überschreiten kann. Offensichtlich sind manche Display‑Computer besser für KI‑Workloads geeignet als andere, was bedeutet, dass eine integrierte oder diskrete NPU oder GPU hilft, Echtzeitleistung zu liefern, ohne die CPU zu überlasten.
Natürlich sind zusätzlich zu den Komponenten eines herkömmlichen HMIs noch weitere notwendig, um diese KI‑Anwendung Realität werden zu lassen:
- Kameramodul mit ausreichender Auflösung und Linsenqualität sowie Infrarot (IR)‑Funktion für schwache Lichtverhältnisse; in der Blende des Displays montiert, über MIPI‑CSI oder USB angeschlossen
- Edge‑KI‑Beschleunigung mittels Prozessor mit integrierter NPU, GPU oder VPU für die Entlastung von Inferenz‑Workloads
- ≥4 GB RAM und 16 GB eMMC zur Aufnahme des Betriebssystems, des KI‑Modells und der Applikationssoftware
- Hardware Root of Trust, Secure Boot und Verschlüsselung zum Schutz von Gesichtstemplates und zur Authentifizierung von Bedienern
Designansätze für KI‑fähige Industrie‑Display‑Computer
Anbieter von Automatisierungstechnik können HMI‑Produktlinien entwerfen, die z. B. ein konventionelles HMI, ein HMI mit personalisiertem Benutzerzugang und weiterentwickelte Versionen mit Funktionen wie Operator‑Alarm‑Assistance umfassen.
Zwei der gängigsten Designansätze sind monolithische Entwürfe und modulare Architekturen:
- Monolithische Entwürfe: Für jeden Anwendungsfall (konventionelles Display, personalisierter Zugang, fortgeschrittene KI) wird ein eigenes HMI entwickelt. Jedes Modell nutzt eine spezielle Hardwarekonfiguration, was die Instandhaltung mehrerer Designs verteuert und die Lieferkette komplexer macht.
- Modulare Architekturen: Sie basieren auf COM‑Standards (Computer‑on‑Module) mit steckbaren Rechenmodulen. Die Carrier‑Platine stellt sämtliche Schnittstellen bereit (Ethernet, USB, seriell, Kamera, Display usw.), wodurch Entwickler mit einer einheitlichen Basis starten und durch Wahl des passenden COMs vom Einstiegs‑CPU‑Modul (Basis‑HMI) bis hin zum High‑End‑KI‑Modul skalieren können.
Image
Durch die Trennung des Rechenkerns von der I/O‑Basisplatine ermöglicht SECOs Modular Vision HMI‑Architektur Prozessor‑Upgrades ohne eine komplette Neuentwicklung des HMIs. COM‑Standards wie SMARC verkürzen zudem die Time‑to‑Market und verringern Risiken, da dieselbe Carrier‑Platine sowohl Arm‑ als auch x86‑Module aufnehmen kann.
Modular Vision: Ein flexibler Ansatz für KI‑fähige HMIs
SECO setzt auf das SMARC‑basierte Modular‑Vision‑Konzept, das Displaygrößen, Prozessoren und die Anforderungen an KI‑ bzw. Nicht‑KI‑Applikationen aufeinander abstimmt. Die folgende Tabelle vergleicht drei Modular‑Vision‑Modelle:
| Modular Vision SKU | Displaygröße (Zoll) | Prozessor | KI‑Leistung (Personalisierter Zugriff) | Umwelttoleranz | Kosten |
|---|
| Modular Vision 7 MX 93 | 7 | NXP i.MX93 (Dual A55 mit U‑65 NPU) | Moderate Genauigkeit, ~150‑200 ms; geeignet für einfache Gesichtsauthentifizierung. | IP65 Front; 0 °C bis 60 °C | Niedrig – Einstiegspreis |
| Modular Vision 10.1 MX 8M‑Plus | 10.1 | NXP i.MX 8M Plus (Quad A53 mit 2.3 TOPS NPU) | Hohe Genauigkeit, Echtzeitlatenz (~36 ms); unterstützt Mehrfachgesichtserkennung und Sprachbefehle. | IP65 Front; 0 °C bis 60 °C | Mittel – ausgewogen zwischen Kosten und Leistung |
| Modular Vision 15.6 ASL | 15.6 | Intel Atom x7000RE (2/4/8 Kerne mit UHD Graphics) | Sehr hohe Genauigkeit mithilfe von CPU mit VNNI‑Instruktionen und integrierter Grafik; Mehrfachgesichtskalierung möglich; Latenz abhängig von Kernanzahl (12‑25 / 20‑40 / 35‑70 ms). | IP65 Front; 0 °C bis 60 °C | Hoch – Premiumleistung |
Alle diese Modular‑Vision‑Produkte basieren auf der gleichen Basisplatine und denselben Displayoptionen, variieren jedoch im Rechenmodul. OEMs können mit dem 7"‑Einsteigermodell beginnen und später auf leistungsfähigere 10.1"‑ oder 15.6"‑Varianten umsteigen.
Design mit Modular Vision
Durch die SMARC‑basierte Modular‑Vision‑Architektur können Maschinenbauer eine skalierbare Familie von HMIs nutzen, die dasselbe mechanische Design, dieselben Anschlüsse und dieselbe Softwareumgebung teilen. In Kombination mit modernen Linux‑Distributionen wie Clea OS ermöglicht das System Remote‑Gerätemanagement, sichere Updates und die Integration mit IIoT‑Protokollen. Entwickler können vorbereitete KI‑Apps – wie die Gesichtserkennung im SECO App Hub – mit TensorFlow Lite, OpenCV oder PyTorch einsetzen und sicher sein, dass ihre Algorithmen sowohl auf Arm‑ als auch auf x86‑SMARC‑Modulen laufen.
Die aufgeführten Modelle verdeutlichen, wie Bildschirmgröße, Rechenleistung und Kosten auf verschiedene KI‑gestützte Anwendungsfälle abgestimmt werden können. Mit robusten Gehäusen, Industrie‑Displays und standardisierten Schnittstellen können diese Systeme in großem Maßstab produziert und am Fertigungsband eingesetzt werden.
Haben Sie eine industrielle Anwendung für ein HMI? Kontaktieren Sie SECO, um zu besprechen, wie Modular Vision, Clea OS und KI‑Algorithmen Ihre Anforderungen erfüllen können.