Effiziente Prozessoroptionen für KI und ML in IoT-Anwendungen

Mikrocontroller Schnelle Bereitstellung leistungsstarker und effizienter KI und maschinellen Lernens mit den MCUs

25.04.2024 Von Rolf Horn 5 min Lesedauer

Anbieter zum Thema

DigiKey Corp

MicroConsult Microelectronics Consulting & Training GmbH

MES Electronic Connect GmbH & Co. KG

NetModule AG

Der Anstieg der künstlichen Intelligenz (KI), des maschinellen Lernens (ML) und anderer rechenintensiver Arbeitslasten am Netzwerkrand für das Internet der Dinge (IoT) belastet Mikrocontroller (MCUs) zusätzlich mit Rechenleistung. Die Bewältigung dieser neuen Arbeitslasten erhöht den Stromverbrauch, auch wenn die Entwickler aufgefordert sind, den Stromverbrauch zu minimieren und die Markteinführung zu beschleunigen.

Bild 1: Die MCU RA8M1 von Renesas basiert auf einem Arm-Cortex-M85 und umfasst die Helium-Technologie zur Beschleunigung der KI- und ML-Verarbeitung.
(Bild: Renesas)

Es wird eine Prozessoroption benötigt, die die Effizienz einer MCU beibehält und gleichzeitig leistungsstarke Funktionen bietet, die speziell auf Anwendungen mit geringem Stromverbrauch zugeschnitten sind. Diese Option sollte auch die einfachen Bereitstellungsmodelle, die mit herkömmlichen MCUs verbunden sind, beibehalten und gleichzeitig genügend Funktionen hinzufügen, um die anspruchsvollen Anwendungen zu unterstützen, die durch KI und ML ermöglicht werden, wie Sprachsteuerung und vorausschauende Wartung.

In diesem Beitrag werden die Faktoren erörtert, die die Nachfrage nach KI und ML antreiben, und es wird erklärt, warum neue Prozessorarchitekturen erforderlich sind, um diese Fähigkeiten effizient bereitzustellen. Anschließend wird die MCU-Familie RA8M1 von Renesas vorgestellt und gezeigt, wie sie diese Anforderungen erfüllen kann.

Bildergalerie

Bild 2: Helium verwendet die FPU-Registerbank auch für die Vektorverarbeitung.

Bild 3: Die TrustZone des Cortex-M85 bietet Hardware-Isolierung für kritische Firmware, Daten und private Informationen.

Bild 4: Das Evaluierungsboard EK-RA8M1 verfügt über eine robuste I/O-Unterstützung, um die RA8M1-MCU zu testen.

Die Anforderungen von AI und ML am Netzwerkrand (Edge)

Die Nachfrage nach KI und ML steigt bei Edge-IoT-Anwendungen, die von der Gebäudeautomatisierung über Industriegeräte bis hin zu Haushaltsgeräten reichen. Selbst relativ kleine, eingebettete Systeme mit geringem Stromverbrauch werden heute mit Aufgaben wie der Erkennung von Schlüsselwörtern, der Steuerung über Sprachbefehle und der Audio-/Bildverarbeitung betraut. Zu den Zielanwendungen gehören Sensor-Hubs, Drohnennavigation und -steuerung, Augmented Reality (AR), Virtual Reality (VR) und Kommunikationsausrüstung.

Um den Energieverbrauch, den Overhead und die Latenzzeit zu minimieren und gleichzeitig den Datenschutz zu gewährleisten, wird die Verarbeitung von Daten am Rande des Netzwerks (Edge) häufig der Übertragung in die Cloud vorgezogen. Dies ist bei der Entwicklung eine Herausforderung, da Edge-Geräte häufig nur über begrenzte Ressourcen verfügen, insbesondere wenn sie batteriebetrieben sind.

Verbesserte MCUs für Edge-Computing

Bei KI- und ML-Arbeitslasten werden in der Regel dieselben mathematischen Operationen wiederholt in einem großen Datensatz durchgeführt. Diese Arbeitslasten lassen sich durch die SIMD-Verarbeitung (Single Instruction, Multiple Data) beschleunigen. SIMD führt mehrere mathematische Operationen parallel aus, wodurch ein wesentlich höherer Durchsatz und eine bessere Energieeffizienz als bei der herkömmlichen Verarbeitung erreicht werden.

Da herkömmlichen MCUs die SIMD-Funktionalität fehlt, benötigen sie Hilfe bei der Ausführung von KI- und ML-Workloads. Eine Lösung besteht darin, neben der MCU einen digitalen Signalprozessor (DSP) oder andere SIMD-Beschleuniger einzusetzen. Dieser Multiprozessor-Ansatz erschwert jedoch den Systementwurf.

Eine andere Möglichkeit ist der Wechsel zu einer leistungsstärkeren Mikroprozessoreinheit (MPU) mit SIMD-Fähigkeiten. Dies kann die erforderliche Leistung in einem Ein-Prozessor-Setup liefern, aber bei MPUs müssen häufig Kompromisse in Bezug auf Stromverbrauch und Funktionsumfang eingegangen werden. So sind beispielsweise nicht alle MPUs für die deterministischen Berechnungen mit geringer Latenz ausgelegt, die in MCU-orientierten Anwendungen erforderlich sind.

Ermöglichung von AI und ML in MCUs

Renesas hat den Bedarf an einer optimierten MCU-Suite zur Unterstützung von KI- und ML-Workloads erkannt und die MCU-Serie RA8M1 eingeführt (Bild 1). Die Serie basiert auf einer Arm-Cortex-M85-Architektur mit Helium und TrustZone und kann mit 480 MHz bei einem typischen Stromverbrauch von 225 µA/MHz laufen.

Die RA8M1-MCU wurde für effiziente Performance und geringen Stromverbrauch entwickelt und verfügt über Merkmale wie Determinismus, kurze Interrupt-Zeiten und hochmodernes Energiemanagement. Der Prozessor erreicht eine Leistungseffizienz von 6,39 CoreMark/MHz.

Helium ist eine SIMD-MVE (M-Profile Vector Extension), die Signalverarbeitung und ML erheblich beschleunigt. Es fügt 150 skalare und vektorielle Befehle hinzu und ermöglicht die Verarbeitung von 128-Bit-Registern. Es ist für ressourcenbeschränkte Mikrocontroller mit geringerem Stromverbrauch optimiert. Helium verwendet zum Beispiel die Register der Gleitkommaeinheit (FPU) wieder, anstatt neue SIMD-Register einzuführen. Dies trägt dazu bei, den Stromverbrauch des Prozessors zu senken und die Komplexität des Designs zu reduzieren.

Jetzt Newsletter abonnieren

Verpassen Sie nicht unsere besten Inhalte

Geschäftliche E-Mail

Bitte geben Sie eine gültige E-Mailadresse ein.

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Stand vom 15.04.2021

Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.

Einwilligung in die Verwendung von Daten zu Werbezwecken

Ich bin damit einverstanden, dass die Vogel Communications Group GmbH & Co. KG, Max-Planckstr. 7/9, 97082 Würzburg einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von redaktionellen Newslettern nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.

Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.

Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden.

Recht auf Widerruf

Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung, Abschnitt Redaktionelle Newsletter.

Wie in Bild 3 dargestellt, enthält der Cortex-M85 des RA8M1 die TrustZone-Technologie von Arm. TrustZone bietet Hardware-Isolierung für kritische Firmware, Daten und private Informationen. Der Cortex-M85 bietet auch neue Sicherheitsfunktionen, z. B. die Erweiterung PACBTI (Pointer Authentication and Branch Target Identification). Diese Sicherheitsmerkmale sind besonders wertvoll in einem KI-Kontext, in dem ein Gerät mit persönlichen Daten interagieren kann.

Hardware-Merkmale, die eine KI-fähige MCU aufweisen sollte

Eine MCU sollte eine effiziente Performance mit einem robusten Funktionsumfang kombinieren, um KI-Anwendungen zu unterstützen. Der RA8M1 ist für Motorsteuerungen, speicherprogrammierbare Steuerungen (SPS), Messgeräte und andere Industrie- und IoT-Anwendungen bestens gerüstet.

KI-Algorithmen zum Beispiel benötigen viel Speicherplatz. Der Systemspeicher des RA8M1 umfasst bis zu 2 MByte Flash und 1 MByte SRAM. Der SRAM umfasst 128 KByte TCM (Tightly Coupled Memory), das einen schnellen Speicherzugriff für Hochleistungsberechnungen ermöglicht.

Um einen zuverlässigen Betrieb zu gewährleisten, sind 384 KByte des Benutzer-SRAM und die gesamten 128 KByte des TCM als ECC-Speicher (Error Correction Code) konfiguriert. Die 32 KByte großen Befehls- und Daten-Caches sind ebenfalls ECC-geschützt.

Der RA8M1 verfügt über mehrere Sicherheitsfunktionen, die über die des Arm-Kerns hinausgehen. Dazu gehören die kryptografische Engine RSIP (Reprogrammable Secure Intellectual Property) für eine sichere Datenverarbeitung, unveränderlicher Speicher für den Schutz kritischer Daten und Schutzmechanismen gegen Manipulation.

Als Kommunikationsschnittstellen ist die MCU mit Ethernet für Netzwerkverbindungen, CAN FD (Controller Area Network Flexible Data Rate) für Automobil- und Industrieanwendungen und USB High-Speed/Full-Speed für allgemeine Verbindungen ausgestattet. Außerdem verfügt sie über eine Kamera-Schnittstelle und eine oktale serielle Peripherieschnittstelle (SPI) mit On-the-Fly-Entschlüsselung für externe Speicher.

Zu den analogen Schnittstellen gehören 12 Bit breite Analog/Digital-Wandler (ADCs) und Digital/Analog-Wandler (DACs), analoge Highspeed-Komparatoren und drei Sample-and-Hold-Schaltungen. Für die serielle Kommunikation unterstützt der RA8M1 mehrere Protokolle, darunter eine serielle Kommunikationsschnittstelle (SCI) mit SPI, einen UART (Universal Asynchronous Receiver/Transmitter) und I²C-Modi (Inter-Integrated Circuit). Die MCU bietet außerdem I³C (Improved Inter-Integrated Circuit) für verbesserte Datenübertragungsraten und Effizienz.

Für vollen Zugriff auf diese I/O-Fähigkeiten können BGA-Gehäuse (Ball Grid Array) wie das R7FA8M1AHECBD#UC0 mit 224 Kontakten verwendet werden. Diejenigen, die einen schlankeren Leiterplattendesign- und Bestückungsprozess anstreben, könnten ein LQFP-Gehäuse (Low-Profile-Quad-Flat) wie das R7FA8M1AHECFB#AA0 mit 144 Kontakten in Betracht ziehen.

Entwicklungsumgebungen für KI-Anwendungen

Wer mit der RA8M1-Serie experimentieren möchten, kann mit dem Evaluierungsboard EK-RA8M1 R7FA8M beginnen (Bild 4). Das Board verfügt über eine RJ45-RMII-Ethernet-Schnittstelle, eine USB-Highspeed-Host- und -Geräteschnittstelle und eine dreipolige CAN-FD-Steckleiste. Als Speicher verfügt es über 64 MByte oktalen SPI-Flash.

Der RA8M1 wird vom Flexible Software Package (FSP) von Renesas unterstützt, einem umfassenden Framework, das eine benutzerfreundliche, skalierbare und qualitativ hochwertige Softwarebasis für Embedded-Systemdesigns bietet.

Das Paket bietet Entwicklungstools wie die integrierte Entwicklungsumgebung (IDE) e² studio, die auf der beliebten Eclipse-IDE basiert. Darüber hinaus enthält es zwei bekannte, lizenzfreie Echtzeitbetriebssysteme: Azure RTOS und FreeRTOS.

Das Paket enthält schlanke, produktionsreife Treiber, die gängige Anwendungsfälle in eingebetteten Systemen unterstützen. In Kombination mit dem Evaluierungsboard ermöglichen diese Treiber einen schnellen Einstieg in das Experimentieren mit dem RA8M1-I/O.

Fazit

Der RA8M1 bietet eine neue Option für die Implementierung von KI- und ML-Workloads in Edge-IoT-Anwendungen, die Strom spart, die Performance erhöht, die Komplexität reduziert und die Markteinführungszeit verkürzt. (mk)

* Rolf Horn ist Applikationsingenieur bei DigiKey.

Artikelfiles und Artikellinks

Link: Zu DigiKey

(ID:49988065)