REKLAMA

Adblock/uBlockOrigin/AdGuard mogą powodować znikanie niektórych postów z powodu nowej reguły.

Jak działa sztuczna inteligencja na mikrokontrolerach?

gulson 09 Lip 2025 12:51 510 3

TL;DR

Tekst wyjaśnia, jak uruchamiać modele AI na mikrokontrolerach, gdzie ograniczają je moc obliczeniowa, pamięć i przepustowość sieci.
Kluczowe są nie tylko wagi modelu, ale też operatory i jądra; TensorFlow Lite for Microcontrollers trzyma je w plikach .tflite razem z grafem obliczeniowym.
Przykład dodawania pokazuje trzy poziomy wykonania: prosty C, rozszerzenia ARM Cortex-M z DSP Extension i MVE (Helium) oraz akcelerację NPU Ethos-U.
CMSIS-NN automatycznie dobiera najlepszą implementację dla danego sprzętu, a optymalizacje mogą działać bez zmiany modelu.
Pełna akceleracja przez NPU wymaga jednak specjalnej kompilacji, a na ESP32 wygodne bywa nawet użycie tf-lite micro z językiem Berry.

Podsumowanie wygenerowane przez AI na podstawie treści dyskusji.

REKLAMA

Zgłoś naruszenie prawa

Odpowiedz Fajne? Ranking DIY | Nowy temat

Powiadamiaj o nowych artykułach

Obserwuj nas Preferuj w

📢 Słuchaj (AI):

Autor tematu Pomocny post? (0)

Post #1
21601691 09 Lip 2025 12:51

Znalazłem ciekawy artykuł obrazujący technicznie uruchamianie modeli AI na tak ograniczonych sprzętach, jak mikrokontrolery. Mikrokontrolery są najbardziej ograniczonymi platformami do uruchamiania AI pod względem mocy obliczeniowej, pamięci i przepustowości sieci.

W skrócie do działania modeli AI potrzebne są nie tylko wagi, ale także operatory - instrukcje podobne do tych w procesorach. Najpopularniejsze środowisko TensorFlow Lite for Microcontrollers używa plików .tflite, które zawierają zarówno wagi modelu, jak i graf obliczeniowy określający, jakich operacji użyć.
Jądra (kernels) to implementacje operatorów w oprogramowaniu. Mogą być wykonywane jako prosty kod C lub wykorzystywać specjalne funkcje sprzętowe dla lepszej wydajności.

Autor pokazuje, jak operator dodawania działa na różnych poziomach optymalizacji. Podstawowa implementacja wykonuje sekwencyjne dodawanie element po elemencie, co jest wolne ale działa na każdym sprzęcie.

Nowoczesne mikrokontrolery z rdzeniami ARM Cortex-M mogą wykorzystywać rozszerzenia:
DSP Extension - pozwala na równoległe obliczenia, przetwarzając 4 elementy naraz
MVE (Helium) - jeszcze bardziej zaawansowane instrukcje wektorowe
NPU Ethos-U - dedykowane procesory AI

Biblioteka CMSIS-NN automatycznie wybiera najlepszą implementację dostępną dla danego sprzętu.

Artykuł przedstawia pełne spektrum: od prostych implementacji w C, przez wykorzystanie instrukcji sprzętowych, aż po przenoszenie obliczeń na specjalizowane procesory AI. Optymalizacje mogą być stosowane bez modyfikacji modelu, choć niektóre zaawansowane funkcje (jak NPU) wymagają specjalnej kompilacji.

Z tej krótki notki, chciałbym, abyście wiedzieli, że AI na mikrokontrolerach to nie proste kopiowanie algorytmów z komputerów - wymaga sprytnych optymalizacji i głębokiego zrozumienia ograniczeń sprzętowych, aby osiągnąć zadowalającą wydajność przy absolutnie minimalnych zasobach. Jednak ostatnio sporo się dzieje w tej dziedzinie i jeśli będziecie zainteresowani, mogę co jakiś czas informować o nowych rozwiązaniach.

Cały artykuł:
https://danielmangum.com/posts/ai-microcontrollers-operators-kernels/

Jeden ciekawy komentarz z Hacker News:
Biblioteka tf-lite micro ma wiele zalet, a pierwszą z nich jest sam framework TensorFlow. Możesz łatwo wytrenować model, a następnie zaimplementować taką samą lub podobną architekturę na ESP-32 bez większego wysiłku. Kolejną zaletą jest jej optymalizacja - możesz łatwo ingerować w różne optymalizacje pamięci.
Poza tym, na przykład, autor zaimplementował model tradycyjnie używając C, ale wygodniej jest używać tf-lite micro na ESP32 z językiem skryptowym Berry.
https://news.ycombinator.com/item?id=44422662

Fajne? Ranking DIY
O autorze
gulson gulson

Administrator Systemowy
Offline

Dołączył: 27 Mar 2001

Posty: 29411

Pomógł: 150

Ocena postów: 6078

Punkty: 56651
Twórca portalu elektroda.pl od roku 1999. Zajmuje się opieką portalu, od czasu do czasu publikując tutaj ciekawostki i felietony. Interesuje się wszystkim, co jest związane z nowymi technologiami - obecnie najbardziej AI. Z wykształcenia technik elektronik, inżynier i magister informatyki po Politechnice Łódzkiej.
gulson napisał 29411 postów o ocenie 6078, pomógł 150 razy. Mieszka w mieście Kielce. Jest z nami od 2001 roku.

Promuję tematy:
21.06.2026 Zegar NTP na Waveshare ESP32-S3 4.2" RLCD - open source z RTC, MP3, WWW i oszczędzaniem energii
21.04.2026 ChatGPT Images 2.0 - potrafi tworzyć nawet całe czasopisma
19.02.2026 OpenClaw w robotyce czyli czas autonomicznych robotów - wizja przyszłości SkyNetu w formie felietonu
19.02.2026 Humanoidalne roboty z okazji Nowego Roku Chińskiego a niepokój o przyszłość.
13.02.2026 GPT-5.3 Codex i Opus 4.6 – wpływ nowych modeli AI na rynek pracy i automatyzację
REKLAMA
#2 21601719 09 Lip 2025 13:23

Konto nie istnieje Konto nie istnieje

Poziom 1

Post #2
21601719 09 Lip 2025 13:23

Espressif udostępnia bibliotekę ESP-DL, która umożliwia wdrażanie aplikacji AI i uczenia maszynowego bezpośrednio na ESP32, bez użycia TensorFlow. Oferuje natomiast narzędzia do konwersji modeli trenowanych w popularnych frameworkach np. TensorFlow. Jest zoptymalizowana pod kątem działania na układach Espressif, np. wykorzystuje instrukcje wektorowe ESP32-S3.
https://github.com/espressif/esp-dl
REKLAMA
#3 21601790 09 Lip 2025 14:25

gregor124 gregor124

Poziom 29

Posty: 1592

Pomógł: 99

Ocena: 845
Pomocny post? (+2)

Post #3
21601790 09 Lip 2025 14:25

Używanie DSP w Cortex-M do dodawania liczb ze znakiem to najlepszy sposób na wsadzenie się na minę.
Rozkazy SAAD16 czy SAAD8 nie ustawiają żadnych flag, więc po dokonaniu dodawania nigdy nie dowiemy się, czy nasz wynik jest poprawny i np. nie przekroczył zakresu.
Np. dodając dwie liczby 64 + 65 = 129, tyle że w arytmetyce ze znakiem 129 to -127, a skoro nie mamy znacznika V, to nie będziemy wiedzieć, czy wynik to -127, czy jednak nastąpiło przekroczenie zakresu liczb, czyli błąd.
Zresztą generalnie wszystkie rozkazy DSP w cortexach nie ustawiają żadnego znacznika, więc jeśli chce się je używać w arytmetyce, trzeba to robić z głową i ostrożnie.
Co prawda istnieją rozkazy w DSP dodawania ze znakiem, ale nie działają równolegle i też nie dowiemy się z nich, czy np. nasz wynik nie przekroczył granicy 8 czy 16 bitów (brak flagi C).

Pomogłem? Kup mi kawę.

Promuję tematy:
03.05.2026 Nie taki zwykly emulator 65C816/65C02/8080 na STM32H750
01.04.2026 Apple-1 (Apple I) z 1976 r. - jak był zbudowany, 50 rocznica powstania firmy Apple.
23.09.2025 50 lat temu narodziła się legenda, procesora 6502, która nieprzerwanie trwa do dziś
11.07.2025 Wczesne narzędzia do tworzenia gier na Atari 2600 i 5200 – system FROB-26.
25.08.2023 BLACK BOX V.9 - C64 - Czyli Zrób to sam ;)
#4 21602715 10 Lip 2025 12:27

pikarel pikarel

Poziom 39

Posty: 5010

Pomógł: 409

Ocena: 1831
Pomocny post? (+1)

Post #4
21602715 10 Lip 2025 12:27

No proszę; ejaj pod strzechę, a Łindołs - odwrotnie.
Wygląda, że na głupotę i zachłanność pewnych grup ludzi nie ma lekarstwa.
I o Pan zrobisz?
Nic Pan nie zrobisz.
Zarejestruj konto, Zaloguj się i bądź aktywny na forum, a wtedy reklamy nie będą się pojawiać. Dołącz do dyskusji i otrzymaj punkty za rejestrację oraz odpowiedzi.

Zainstaluj aplikację Elektroda

Odpowiedz Fajne? Ranking DIY | Nowy temat

Powiadamiaj o nowych artykułach

Obserwuj nas Preferuj w

📢 Słuchaj (AI):

Zgłoś naruszenie prawa

Strona Główna
/
Forum
/
Sztuczna Inteligencja (AI)
/
AI Newsy
/
Jak działa sztuczna inteligencja na mikrokontrolerach?

AI w obsłudze klienta - czy to dobry pomysł? Setki kont przejętych na Instagramie
10 Cze 2026 08:19 (6)
Kolejne firmy prześcigają się we wdrażaniu AI, gdzie tylko się da. Również sztuczna inteligencja zastępuje ludzi na helpdesku. W teorii ma to przyspieszać procesy i obniżać koszty. Problem pojawia się wtedy, gdy chatbot dostaje uprawnienia do wykonywania operacji związanych z bezpieczeństwem kont użytkowników. Właśnie taki przypadek miał miejsce na Instagramie. Jak opisuje Niebezpiecznik, asystent... [Czytaj dalej]
Anthropic przedstawia Claude Opus 4.8 - ewolucja w stronę bardziej złożonych zadań
30 Maj 2026 09:09 (0)
Firma Anthropic zaprezentowała nową wersję swojego flagowego modelu AI - Claude Opus 4.8. Aktualizacja przynosi ulepszenia w zakresie programowania, zadań agentowych oraz pracy z długimi procesami, a model dostępny jest w tej samej cenie co jego poprzednik. Wraz z premierą debiutują nowe funkcje, z których najciekawszą jest funkcja "effort control" na platformie claude.ai. Użytkownicy mogą teraz decydować,... [Czytaj dalej]
Zawieszona współpraca Blendera z Anthropic, czyli o społecznym sprzeciwie wobec technologii AI
10 Maj 2026 12:32 (7)
Fundacja stojąca za projektem Blender ogłosiła zmianę zasad współpracy z firmą Anthropic po gwałtownej reakcji społeczności użytkowników. Jeszcze niedawno ogłoszono, że twórca systemu Claude dołączy do Blender Development Fund jako Corporate Patron i będzie przekazywać około 240 tys. euro rocznie na rozwój projektu. Decyzja szybko wywołała dyskusję wśród artystów i deweloperów korzystających z programu... [Czytaj dalej]
Jakie AI do SVG w 2026: oktogram w okręgu i 50% mniejsze oktogramy?
05 Maj 2026 18:42 (1)
Dzień dobry, chcę tworzyć somplikowane i złożone geometrie matematyczne, na przykład oktogram w oktogramie wpisany w okrąg w SVG, ale gdy to wpisuję w Chat-gbt, on się crashuje. Czy są w 2026 jakieś programy czy ai do tworzenia kombinacji geometrycznych na bazie słów, np. stwórz oktogram, a do każdego zewnętrznego wierzchołka oktogramu dodaj 50% mniejszy oktogram. Nic takiego nie znalazłem, co działałoby... [Czytaj dalej]
Praktyczne testy Gemma 4 i porównanie z Gemini 2.5 - tagowanie obrazków i OCR
01 Maj 2026 09:19 (0)
Czy współczesne modele LLM uruchamiane lokalnie, na starym laptopie gamingowym, są w stanie sensownie otagować zdjęcia? Czy współczesne modele nadają się do OCR i poprawnie rozpoznają układy elektroniczne? Zapraszam na Elektrodowy test sztucznej inteligencji, tym razem wzbogacony o uruchamiany lokalnie model Gemma 4 oraz o płatne modele gemini-2.5-pro i gemini-2.5-flash uruchamiane przez API. Sprawdzę... [Czytaj dalej]

REKLAMA