Rychlé nasazení výkonné a efektivní umělé inteligence a strojového učení pomocí MCU RA8M1 společnosti Renesas
Contributed By DigiKey's North American Editors
2024-03-20
Vzestup umělé inteligence („artificial intelligence“, AI), strojového učení („machine learning“, ML) a dalších výpočetně náročných pracovních zátěží na okraji sítě internetu věcí („Internet of Things“, IoT) klade na mikrokontroléry („microcontrollers“, MCU) další procesní zátěž. Zvládání těchto nových pracovních zátěží zvyšuje spotřebu energie, i když se od konstruktérů požaduje, aby spotřebu minimalizovali a urychlili dobu do uvedení na trh.
Konstruktéři potřebují výpočetní možnost, která zachová účinnost MCU a zároveň přidá vysoce výkonné funkce přizpůsobené speciálně pro případy použití s nízkou spotřebou. Tato možnost by také měla zachovat jednoduché modely nasazení spojené s tradičními MCU a zároveň přidat dostatečné funkce pro podporu sofistikovaných aplikací, které umožňují AI a ML, jako je hlasové ovládání a prediktivní údržba.
Tento článek pojednává o faktorech, které ovlivňují poptávku po AI a ML, a je v něm vysvětleno, proč jsou k efektivnímu poskytování těchto funkcí potřeba nové architektury procesorů. Dále je zde představena řada MCU RA8M1 od společnosti Renesas a ukázáno, jak ji lze využít k řešení těchto požadavků.
Požadavky edge AI a ML
Poptávka po AI a ML v edge IoT aplikacích roste, a to od automatizace budov a průmyslových zařízení až po domácí spotřebiče. Dokonce i relativně malé vestavěné systémy s nízkou spotřebou energie mají nyní za úkol provádět pracovní zátěže, jako je vyhledávání klíčových slov, ovládání hlasových příkazů a zpracování zvuku/obrazu. Mezi cílové aplikace patří senzorové huby, navigace a ovládání dronů, rozšířená realita („augmented reality“, AR), virtuální realita („virtual reality“, VR) a komunikační zařízení.
K minimalizaci spotřeby energie, režie a latence a zároveň k zajištění soukromí se často preferuje edge zpracování dat před jejich odesíláním do cloudu. To je pro konstruktéry náročné, protože edge zařízení jsou často omezena zdroji, zejména pokud jsou napájena z baterie.
Vylepšené MCU pro edge computing
Pracovní zátěže AI a ML obvykle zahrnují opakované provádění stejné matematické operace v rámci velkého souboru dat. Tyto pracovní zátěže lze zrychlit pomocí zpracování SIMD („single instruction, multiple data“, SIMD; jedné instrukce, více dat). Při zpracování SIMD se provádí několik matematických operací paralelně, a výsledkem je tak podstatně vyšší propustnost a lepší energetická účinnost než při konvenčním zpracování.
Vzhledem k tomu, že tradiční MCU funkci SIMD postrádají, potřebují při provádění úloh AI a ML pomoc. Jedním z řešení je zároveň s MCU použít digitální signálový procesor („digital signal processor“, DSP) nebo jiný SIMD akcelerátor. Tento víceprocesorový přístup však komplikuje návrh systému.
Další možností je přejít na výkonnější mikroprocesorovou jednotku („microprocessor unit“, MPU) vybavenou funkcemi SIMD. Tím lze dosáhnout potřebného výkonu v jednoprocesorové sestavě, ale MPU mají kompromisy ve spotřebě energie a sadách funkcí. Například ne všechny MPU jsou navrženy tak, aby poskytovaly deterministické výpočty s nízkou latencí, které jsou v aplikacích orientovaných na MCU vyžadovány.
Umožnění AI a ML v MCU
Společnost Renesas rozpoznala potřebu optimalizované sady MCU pro podporu pracovních zátěží AI a ML a představila řadu MCU RA8M1 (obrázek 1). Řada je založena na architektuře Arm® Cortex®-M85 s technologiemi Helium a TrustZone a může běžet na frekvenci 480 MHz s typickou spotřebou energie 225 µA/MHz.
Obrázek 1: MCU RA8M1 společnosti Renesas je založen na procesoru Arm Cortex-M85 a k urychlení zpracování AI a ML obsahuje technologii Helium. (Zdroj obrázku: společnost Renesas)
MCU RA8M1, navržený pro efektivní výkon a nízkou spotřebu energie, nabízí funkce jako determinismus, krátká doba přerušení a nejmodernější podpora správy napájení. Procesor dosahuje výkonnostní účinnosti 6,39 CoreMark/MHz.
Funkci Helium představuje technologie SIMD M-Profile Vector Extension (MVE, vektorové rozšíření s M-profilem), která výrazně urychluje zpracování signálu a ML. Přidává 150 skalárních a vektorových instrukcí a umožňuje zpracování 128bitových registrů (obrázek 2). Technologie je optimalizována pro mikrokontroléry s omezeným množstvím zdrojů a nižší spotřebou. Technologie Helium například namísto zavádění nových registrů SIMD opětovně používá registry jednotek s plovoucí desetinnou čárkou („floating-point unit“, FPU). To pomáhá snížit spotřebu energie procesoru a snížit složitost návrhu.
Obrázek 2: Technologie Helium pro vektorové zpracování opětovně používá banku registrů FPU. (Zdroj obrázku: společnost Arm)
Jak je uvedeno na obrázku 3, MCU RA8M1 Cortex-M85 obsahuje technologii TrustZone společnosti Arm. Technologie TrustZone poskytuje hardwarovou izolaci pro kriticky důležitý firmware, aktiva a soukromé informace. Procesor Cortex-M85 také přidává nové funkce zabezpečení a bezpečnosti, jako je rozšíření PACBTI („pointer authentication and branch target identification“, ověřování ukazatelů a identifikace cíle-větve). Tyto bezpečnostní funkce jsou zvláště cenné v kontextu umělé inteligence, kde zařízení může nakládat s osobními údaji.
Obrázek 3: Technologie TrustZone procesoru Arm Cortex-M85 poskytuje hardwarovou izolaci pro kriticky důležitý firmware, aktiva a soukromé informace. (Zdroj obrázku: společnost Arm)
Hardwarové funkce, které potřebuje mít MCU podporující AI
MCU by měl kombinovat efektivní výkon s robustní sadou funkcí pro podporu aplikací AI. MCU RA8M1 je dobře vybaven pro řízení motoru, programovatelné logické řízení („programmable logic control“, PLC), měření a další průmyslové a IoT aplikace.
Algoritmy AI vyžadují například hodně paměti. Systémová paměť mikrokontroléru RA8M1 obsahuje až 2 MB flash paměti a 1 MB paměti SRAM. Paměť SRAM obsahuje 128 kB paměti TCM („tightly coupled memory“, těsně vázaná paměť), která umožňuje rychlý přístup k paměti pro vysoce výkonné výpočty.
Pro zajištění spolehlivého provozu je 384 kB uživatelské paměti SRAM a celých 128 kB paměti TCM nakonfigurováno jako paměť ECC („error correction code“, kód pro opravdu chyb). Mezipaměť zpracování instrukcí a datová mezipaměť o velikosti 32 kB jsou také chráněny pamětí ECC.
Mikrokontrolér RA8M1 obsahuje několik bezpečnostních funkcí navíc k těm, které jsou součástí jádra Arm. Patří mezi ně kryptografický modul RSIP („Reprogrammable Secure Intellectual Property“, zabezpečení duševního vlastnictví proti přeprogramování) pro bezpečné zpracování dat, neměnné úložiště pro ochranu kriticky důležitých dat a mechanismy ochrany proti neoprávněné manipulaci.
Pro komunikační rozhraní je MCU vybaven ethernetem pro síťové připojení, rozhraním CAN FD („Controller Area Network Flexible Data Rate“, flexibilní datová rychlost řídicí sítě) pro automobilové a průmyslové aplikace a rozhraním USB High-Speed/Full-Speed pro obecné připojení. Zahrnuje také rozhraní pro kameru a osmičkové rozhraní SPI („Serial Peripheral Interface“, sériové periferní rozhraní) s dešifrováním za běhu pro externí paměť.
Analogová rozhraní zahrnují 12bitové analogově-digitální převodníky („analog-to-digital converter“, ADC) a digitálně-analogové převodníky („digital-to-analog converter“, DAC), vysokorychlostní analogové komparátory a tři obvody vzorkování a udržování. Pro sériovou komunikaci podporuje mikrokontrolér RA8M1 více protokolů, včetně rozhraní SCI („Serial Communication Interface“, sériové komunikační rozhraní) s SPI, UART („Universal Asynchronous Receiver/Transmitter“, univerzální asynchronní přijímač/vysílač) a režimů I²C („Inter-Integrated Circuit“, interintegrovaný obvod). Pro vyšší rychlost přenosu dat a efektivitu nabízí MCU také vylepšené rozhraní I3C („Improved Inter-Integrated Circuit“, vylepšení interintegrovaný obvod).
Vývojáři, kteří potřebují plný přístup k těmto funkcím vstupu/výstupu („input/output“, I/O), mohou použít pouzdro BGA („ball grid array“), jako je 224pinový model R7FA8M1AHECBD#UC0. Ti, kteří hledají efektivnější návrh a proces montáže desky plošných spojů (DPS), by mohli zvážit použití nízkoprofilového pouzdra LQFP („low-profile quad flat package“), jako je 144pinový model R7FA8M1AHECFB#AA0.
Vývojová prostředí pro aplikace AI
Konstruktéři, kteří chtějí s řadou RA8M1 experimentovat, mohou začít s vyhodnocovací deskou EK-RA8M1 R7FA8M (obrázek 4). Tato deska obsahuje ethernetové rozhraní RJ45 RMII, rozhraní USB High-Speed Host and Device a třípinovou hlavičku sběrnice CAN FD. Pokud jde o paměť, je vybavena 64 MB osmičkové flash paměti SPI.
Obrázek 4: Vyhodnocovací deska EK-RA8M1 má robustní podporu vstupu a výstupu pro výkon MCU RA8M1. (Zdroj obrázku: společnost Renesas)
Mikrokontrolér RA8M1 je podporován flexibilním softwarovým balíčkem („Flexible Software Package“, FSP) společnosti Renesas, komplexním rámcem navržený tak, aby poskytoval uživatelsky přívětivý, škálovatelný a vysoce kvalitní softwarový základ pro návrhy vestavěných systémů.
Balíček nabízí vývojové nástroje, včetně integrovaného vývojového prostředí („integrated development environment“, IDE) e² studio založeného na oblíbeném prostředí IDE Eclipse. Obsahuje také dva významné bezplatné operační systémy reálného času: Azure RTOS a FreeRTOS.
Balíček zahrnuje odlehčené ovladače připravené k produkci, které ve vestavěných systémech podporují běžné případy použití. V kombinaci s vyhodnocovací deskou poskytují tyto ovladače vývojářům rychlou cestu k experimentování se vstupy a výstupy mikrokontroléru RA8M1.
Závěr
Mikrokontrolér RA8M1 poskytuje vývojářům novou možnost implementace pracovních zátěží AI a ML v edge aplikacích IoT, což šetří energii, zvyšuje výkon, snižuje složitost a zkracuje dobu do uvedení na trh.

Disclaimer: The opinions, beliefs, and viewpoints expressed by the various authors and/or forum participants on this website do not necessarily reflect the opinions, beliefs, and viewpoints of DigiKey or official policies of DigiKey.