Mikrocontroller Schnelle Bereitstellung leistungsstarker und effizienter KI und maschinellen Lernens mit den MCUs

Von Rolf Horn 5 min Lesedauer

Anbieter zum Thema

Der Anstieg der künstlichen Intelligenz (KI), des maschinellen Lernens (ML) und anderer rechenintensiver Arbeitslasten am Netzwerkrand für das Internet der Dinge (IoT) belastet Mikrocontroller (MCUs) zusätzlich mit Rechenleistung. Die Bewältigung dieser neuen Arbeitslasten erhöht den Stromverbrauch, auch wenn die Entwickler aufgefordert sind, den Stromverbrauch zu minimieren und die Markteinführung zu beschleunigen.

Bild 1: Die MCU RA8M1 von Renesas basiert auf einem Arm-Cortex-M85 und umfasst die Helium-Technologie zur Beschleunigung der KI- und ML-Verarbeitung.
Bild 1: Die MCU RA8M1 von Renesas basiert auf einem Arm-Cortex-M85 und umfasst die Helium-Technologie zur Beschleunigung der KI- und ML-Verarbeitung.
(Bild: Renesas)

Es wird eine Prozessoroption benötigt, die die Effizienz einer MCU beibehält und gleichzeitig leistungsstarke Funktionen bietet, die speziell auf Anwendungen mit geringem Stromverbrauch zugeschnitten sind. Diese Option sollte auch die einfachen Bereitstellungsmodelle, die mit herkömmlichen MCUs verbunden sind, beibehalten und gleichzeitig genügend Funktionen hinzufügen, um die anspruchsvollen Anwendungen zu unterstützen, die durch KI und ML ermöglicht werden, wie Sprachsteuerung und vorausschauende Wartung.

In diesem Beitrag werden die Faktoren erörtert, die die Nachfrage nach KI und ML antreiben, und es wird erklärt, warum neue Prozessorarchitekturen erforderlich sind, um diese Fähigkeiten effizient bereitzustellen. Anschließend wird die MCU-Familie RA8M1 von Renesas vorgestellt und gezeigt, wie sie diese Anforderungen erfüllen kann.

Bildergalerie

Die Anforderungen von AI und ML am Netzwerkrand (Edge)

Die Nachfrage nach KI und ML steigt bei Edge-IoT-Anwendungen, die von der Gebäudeautomatisierung über Industriegeräte bis hin zu Haushaltsgeräten reichen. Selbst relativ kleine, eingebettete Systeme mit geringem Stromverbrauch werden heute mit Aufgaben wie der Erkennung von Schlüsselwörtern, der Steuerung über Sprachbefehle und der Audio-/Bildverarbeitung betraut. Zu den Zielanwendungen gehören Sensor-Hubs, Drohnennavigation und -steuerung, Augmented Reality (AR), Virtual Reality (VR) und Kommunikationsausrüstung.

Um den Energieverbrauch, den Overhead und die Latenzzeit zu minimieren und gleichzeitig den Datenschutz zu gewährleisten, wird die Verarbeitung von Daten am Rande des Netzwerks (Edge) häufig der Übertragung in die Cloud vorgezogen. Dies ist bei der Entwicklung eine Herausforderung, da Edge-Geräte häufig nur über begrenzte Ressourcen verfügen, insbesondere wenn sie batteriebetrieben sind.

Verbesserte MCUs für Edge-Computing

Bei KI- und ML-Arbeitslasten werden in der Regel dieselben mathematischen Operationen wiederholt in einem großen Datensatz durchgeführt. Diese Arbeitslasten lassen sich durch die SIMD-Verarbeitung (Single Instruction, Multiple Data) beschleunigen. SIMD führt mehrere mathematische Operationen parallel aus, wodurch ein wesentlich höherer Durchsatz und eine bessere Energieeffizienz als bei der herkömmlichen Verarbeitung erreicht werden.

Da herkömmlichen MCUs die SIMD-Funktionalität fehlt, benötigen sie Hilfe bei der Ausführung von KI- und ML-Workloads. Eine Lösung besteht darin, neben der MCU einen digitalen Signalprozessor (DSP) oder andere SIMD-Beschleuniger einzusetzen. Dieser Multiprozessor-Ansatz erschwert jedoch den Systementwurf.

Eine andere Möglichkeit ist der Wechsel zu einer leistungsstärkeren Mikroprozessoreinheit (MPU) mit SIMD-Fähigkeiten. Dies kann die erforderliche Leistung in einem Ein-Prozessor-Setup liefern, aber bei MPUs müssen häufig Kompromisse in Bezug auf Stromverbrauch und Funktionsumfang eingegangen werden. So sind beispielsweise nicht alle MPUs für die deterministischen Berechnungen mit geringer Latenz ausgelegt, die in MCU-orientierten Anwendungen erforderlich sind.

Ermöglichung von AI und ML in MCUs

Renesas hat den Bedarf an einer optimierten MCU-Suite zur Unterstützung von KI- und ML-Workloads erkannt und die MCU-Serie RA8M1 eingeführt (Bild 1). Die Serie basiert auf einer Arm-Cortex-M85-Architektur mit Helium und TrustZone und kann mit 480 MHz bei einem typischen Stromverbrauch von 225 µA/MHz laufen.

Die RA8M1-MCU wurde für effiziente Performance und geringen Stromverbrauch entwickelt und verfügt über Merkmale wie Determinismus, kurze Interrupt-Zeiten und hochmodernes Energiemanagement. Der Prozessor erreicht eine Leistungseffizienz von 6,39 CoreMark/MHz.

Helium ist eine SIMD-MVE (M-Profile Vector Extension), die Signalverarbeitung und ML erheblich beschleunigt. Es fügt 150 skalare und vektorielle Befehle hinzu und ermöglicht die Verarbeitung von 128-Bit-Registern. Es ist für ressourcenbeschränkte Mikrocontroller mit geringerem Stromverbrauch optimiert. Helium verwendet zum Beispiel die Register der Gleitkommaeinheit (FPU) wieder, anstatt neue SIMD-Register einzuführen. Dies trägt dazu bei, den Stromverbrauch des Prozessors zu senken und die Komplexität des Designs zu reduzieren.

Jetzt Newsletter abonnieren

Verpassen Sie nicht unsere besten Inhalte

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung

Wie in Bild 3 dargestellt, enthält der Cortex-M85 des RA8M1 die TrustZone-Technologie von Arm. TrustZone bietet Hardware-Isolierung für kritische Firmware, Daten und private Informationen. Der Cortex-M85 bietet auch neue Sicherheitsfunktionen, z. B. die Erweiterung PACBTI (Pointer Authentication and Branch Target Identification). Diese Sicherheitsmerkmale sind besonders wertvoll in einem KI-Kontext, in dem ein Gerät mit persönlichen Daten interagieren kann.

Hardware-Merkmale, die eine KI-fähige MCU aufweisen sollte

Eine MCU sollte eine effiziente Performance mit einem robusten Funktionsumfang kombinieren, um KI-Anwendungen zu unterstützen. Der RA8M1 ist für Motorsteuerungen, speicherprogrammierbare Steuerungen (SPS), Messgeräte und andere Industrie- und IoT-Anwendungen bestens gerüstet.

KI-Algorithmen zum Beispiel benötigen viel Speicherplatz. Der Systemspeicher des RA8M1 umfasst bis zu 2 MByte Flash und 1 MByte SRAM. Der SRAM umfasst 128 KByte TCM (Tightly Coupled Memory), das einen schnellen Speicherzugriff für Hochleistungsberechnungen ermöglicht.

Um einen zuverlässigen Betrieb zu gewährleisten, sind 384 KByte des Benutzer-SRAM und die gesamten 128 KByte des TCM als ECC-Speicher (Error Correction Code) konfiguriert. Die 32 KByte großen Befehls- und Daten-Caches sind ebenfalls ECC-geschützt.

Der RA8M1 verfügt über mehrere Sicherheitsfunktionen, die über die des Arm-Kerns hinausgehen. Dazu gehören die kryptografische Engine RSIP (Reprogrammable Secure Intellectual Property) für eine sichere Datenverarbeitung, unveränderlicher Speicher für den Schutz kritischer Daten und Schutzmechanismen gegen Manipulation.

Als Kommunikationsschnittstellen ist die MCU mit Ethernet für Netzwerkverbindungen, CAN FD (Controller Area Network Flexible Data Rate) für Automobil- und Industrieanwendungen und USB High-Speed/Full-Speed für allgemeine Verbindungen ausgestattet. Außerdem verfügt sie über eine Kamera-Schnittstelle und eine oktale serielle Peripherieschnittstelle (SPI) mit On-the-Fly-Entschlüsselung für externe Speicher.

Zu den analogen Schnittstellen gehören 12 Bit breite Analog/Digital-Wandler (ADCs) und Digital/Analog-Wandler (DACs), analoge Highspeed-Komparatoren und drei Sample-and-Hold-Schaltungen. Für die serielle Kommunikation unterstützt der RA8M1 mehrere Protokolle, darunter eine serielle Kommunikationsschnittstelle (SCI) mit SPI, einen UART (Universal Asynchronous Receiver/Transmitter) und I²C-Modi (Inter-Integrated Circuit). Die MCU bietet außerdem I3C (Improved Inter-Integrated Circuit) für verbesserte Datenübertragungsraten und Effizienz.

Für vollen Zugriff auf diese I/O-Fähigkeiten können BGA-Gehäuse (Ball Grid Array) wie das R7FA8M1AHECBD#UC0 mit 224 Kontakten verwendet werden. Diejenigen, die einen schlankeren Leiterplattendesign- und Bestückungsprozess anstreben, könnten ein LQFP-Gehäuse (Low-Profile-Quad-Flat) wie das R7FA8M1AHECFB#AA0 mit 144 Kontakten in Betracht ziehen.

Entwicklungsumgebungen für KI-Anwendungen

Wer mit der RA8M1-Serie experimentieren möchten, kann mit dem Evaluierungsboard EK-RA8M1 R7FA8M beginnen (Bild 4). Das Board verfügt über eine RJ45-RMII-Ethernet-Schnittstelle, eine USB-Highspeed-Host- und -Geräteschnittstelle und eine dreipolige CAN-FD-Steckleiste. Als Speicher verfügt es über 64 MByte oktalen SPI-Flash.

Der RA8M1 wird vom Flexible Software Package (FSP) von Renesas unterstützt, einem umfassenden Framework, das eine benutzerfreundliche, skalierbare und qualitativ hochwertige Softwarebasis für Embedded-Systemdesigns bietet.

Das Paket bietet Entwicklungstools wie die integrierte Entwicklungsumgebung (IDE) e² studio, die auf der beliebten Eclipse-IDE basiert. Darüber hinaus enthält es zwei bekannte, lizenzfreie Echtzeitbetriebssysteme: Azure RTOS und FreeRTOS.

Das Paket enthält schlanke, produktionsreife Treiber, die gängige Anwendungsfälle in eingebetteten Systemen unterstützen. In Kombination mit dem Evaluierungsboard ermöglichen diese Treiber einen schnellen Einstieg in das Experimentieren mit dem RA8M1-I/O.

Fazit

Der RA8M1 bietet eine neue Option für die Implementierung von KI- und ML-Workloads in Edge-IoT-Anwendungen, die Strom spart, die Performance erhöht, die Komplexität reduziert und die Markteinführungszeit verkürzt. (mk)

* Rolf Horn ist Applikationsingenieur bei DigiKey.

Artikelfiles und Artikellinks

Link: Zu DigiKey

(ID:49988065)