Co powstrzymuje rozwój obliczeń neuromorficznych, a konkretnie sieci neuronów impulsowych? Mike Davies, dyrektor laboratorium obliczeń neuromorficznych w firmie Intel, opowiedział EE Times, w jaki sposób ta technologia wykazuje ogromny potencjał redukcji zużycia energii i opóźnień w porównaniu z obecnymi sieciami neuronów głębokich, opartymi na uczeniu maszynowym. Oczywiście wymaga to też dedykowanych akceleratorów sprzętowych — więc nadal istnieją pewne wyzwania związane z reżimami szkoleniowymi i dojrzałością oprogramowania dla tego rodzaju obliczeń.
Neuromorficzny chip Intela, Loihi, jest obecnie produkowany w już drugiej generacji. W przeciwieństwie do niektórych innych typów akceleratorów sieci impulsowych przeznaczonych do zastosowań w ultraniskonapięciowych końcowych punktach, Loihi 2 jest dedykowany dla systemów o większej skali, takich jak centra danych. „Loihi 2 poprawił wiele interesujących rzeczy w zestawieniu z Loihi 1” — wskazuje Davies. „Zaczął zacierać granicę między czystym podejściem neuromorficznym a tradycyjną architekturą akceleratorów sztucznej inteligencji, co skłoniło nas do eksploracji nowego reżimu obiecujących algorytmów”. Najlepszy sposób niekoniecznie jest tym, który najbardziej zbliża się do biologii, powiedział Davies, o ile zrozumiemy, dlaczego pojawiają się pewne różnice. Na przykład jednym z wyborów architektonicznych Intela dla Loihi 2 było umożliwienie impulsów o różnej amplitudzie. „Nie rezygnujemy z pomysłu, że impuls to wartość binarna. Jednak okazało się, że wysłanie liczby całkowitej jest naprawdę tanie i łatwe do zrealizowania w cyfrowym CMOS” — powiedział. „Natura ma z tym trudniej — wciąż zdumiewające jest, co można zrobić z binarnymi impulsami. Aczkolwiek przez uzupełnienie czystego podejścia biologicznego, a następnie zastosowanie wstecznej propagacji, myślę, że doprowadzi to do naprawdę ciekawych sieci i nowych zdolności”.
Architektura drugiej generacji Loihi Intela obejmuje impulsy o różnych amplitudach i zdolność programowania odmiennych modeli neuronów.
Programowalność była kolejnym istotnym dodatkiem do Loihi 2. Podczas gdy neurony projektu zastosowanego w Loihi 1 były konfigurowalne, tak te w Loihi 2 mają pełny zestaw instrukcji umożliwiający nowy poziom programowalności. Obejmują one wspólne instrukcje arytmetyczne, porównawcze i sterowania przepływem programu. A także umożliwiają obsługę różnych modeli neuronów opartych na uczeniu głębokim i projektowaniu ludzkim, niekoniecznie ściśle związanych z biologią. „Zamiast postrzegać to tak, że neurobiolodzy obliczeniowi scharakteryzowali te klasy neuronów i jeśli je zaimplementujemy, będziemy w stanie obsłużyć te algorytmy zainspirowane biologią, to uznajemy, że od ery Loihi 1 wszystkie najlepsze przykłady naprawdę dążyły do skrajnej konfigurowalności tych modeli neuronów” — opowiedział przedstawiciel Intela.
Zespoły badawcze używają Loihi 2 do implementacji skomplikowanych modeli neuronów, takich jak rezonansowe i ogniowe, oscylujące. Jeden z najbardziej zaawansowanych wariantów wykorzystuje rezonator Hopfa. „To jeden z cudów natury — że biologiczna materia i chemikalia i białka mogą tworzyć te komórki, które rozwiązują niezwykle bogatą i złożoną dynamikę” — wskazał Davies. Zauważył on, że wiele innowacji zachodzi na styku inspiracji neurobiologicznej i rzeczywistych przypadków użycia (wariant rezonatora Hopfa może być używany do rozwiązywania problemów optymalizacyjnych związanych z normalizacją automatycznego wzrostu w przetwarzaniu wstępnym dźwięku, na przykład). „Naszym wyzwaniem jest dostarczenie odpowiedniej dokumentacji i zrozumienie wszystkich zastrzeżeń dotyczących uzyskania dobrych wyników” — podsumował.
Sieci jednokierunkowe
Prace badawcze w 2020 roku pokazały skromne zyski dla sieci impulsowych w porównaniu z tymi uczenia maszynowego opartego na głębokim uczeniu się jednokierunkowym. Jednak bardziej wyraźne korzyści były dostrzegalne w przypadku sieci neuronów rekurencyjnych. W międzyczasie te ostatnie wyszły trochę z mody. Podczas gdy niektóre z najbardziej popularnych przypadków użycia przesunęły się w kierunku sieci korzystających z transformatorów. „Mamy wrażenie, że płyniemy pod prąd w kwestii sieci rekurencyjnych” — powiedział Davies. „Mamy klasy sieci rekurencyjnych, które działają niesamowicie dobrze — nasze sieci optymalizacyjne są dalekie od modeli uczenia głębokiego — i łączymy je z problemami rzeczywistego świata”. Jednak przyznaje on, że Loihi będzie potrzebować rozwiązania dla sieci jednokierunkowych. Obecne prace skupiają się na przekształcaniu tychże w rekurencyjne, wykorzystując właściwości neuromorficzne. Chodzi tu o stanowe neurony i rzadkość ich połączeń. Jednak ma się to odbywać w sposób bardziej zaawansowany niż w przypadku wcześniejszej pracy z wykorzystaniem Loihi 1. „To teraz podejście, na którym się skupiamy. Chcemy zająć się popularnymi sieciami jednokierunkowymi, aby przedstawić API do mapowania tego rodzaju sieci” — informuje. „Liczby, które zaczynamy uzyskiwać, przynajmniej na mniejszą skalę, są ekscytujące, nie tylko pod względem energii, ale także opóźnień”. Energia może być kluczowa w aplikacjach kosmicznych, ale opóźnienia są krytyczne na przykład w systemach wizyjnych czy percepcji robotów.
Generatywne sieci pulsujące
Artykuł naukowy na temat wersji impulsowej modelu do generacji tekstu, SpikeGPT, niedawno wzbudził zainteresowanie w impulsowych sieciach neuronowych. Wynalazcy SpikeGPT stwierdzili, że model jest konkurencyjny w porównaniu z sieciami uczenia maszynowego, ale z 20-krotnie mniejszą liczbą operacji i odpowiadającą temu redukcją zużycia energii. Wersja z 216-milionami parametrów jest największym do tej pory modelem wytrenowanym za pomocą wstecznej propagacji w sieci neuronów impulsowych.
Czy to oznacza, że duże modele językowe (LLM) mają przyszłość w sieciach impulsowych? „Wyzwaniem jest to, że etap uwagi nie jest kompatybilny z większością architektur neuromorficznych... W sercu transformatorów jest mnożenie macierzy przez macierze, które jest trudne do zaimplementowania w architekturach neuromorficznych” — powiedział Davies (SpikeGPT omija to ograniczenie, wprowadzając dane punktowe sekwencyjnie).
Poza tym bardzo konkretnym wyzwaniem technicznym, transformatory są inherentnie niepodobne do mózgu, jak mówi Davies. Prezentują cały wejściowy zestaw danych jako ogromny wektor dla sieci jednokierunkowej. Wydaje się to podejściem siłowym w porównaniu z bardziej: „mózgowym”, takim jak struktury rekurencyjne, które mogłyby otworzyć fascynujące ścieżki badawcze. „To będzie naprawdę ekscytujący kierunek poruszania się do przodu w tej dziedzinie. I chociaż jeszcze nie jesteśmy na końcu tej drogi, to będziemy potrzebować iteracji krzemowej, aby ją wesprzeć. Naprawdę ekscytujące jest to, że techniki, które znamy, działające dobrze w zakresie redukcji zużycia energii i zmniejszenia opóźnień, myślę, że w końcu będziemy mogli je zastosować do dużych modeli językowych” — dodał. Wskazał jednocześnie, że mimo że skalowanie sieci impulsowych do rozmiarów LLM będzie wyzwaniem, technologia może oferować pewne korzyści związane ze zużyciem energii czy redukcją opóźnienia — nawet w przypadku mniejszej skali implementacji.
Wyzwania związane z treningiem sieci
Szkolenie sieci impulsowych było tematem badań od dłuższego czasu. Nie są one kompatybilne z algorytmem używanym do trenowania sieci uczenia maszynowego — wsteczną propagacją — bez matematycznych przybliżeń, które mogą prowadzić do mniej dokładnych wyników. Jednym z dużych wyzwań jest zastosowanie wstecznej propagacji do impulsów w bardziej uogólniony sposób. To znaczy tak, aby: „nie był to tylko błyskotliwy doktorant poświęcający całą swoją pracę doktorską jednemu przykładowi, który może scharakteryzować i pokazać wartość” — podsumował Davies. Alternatywny reżim szkoleniowy opracowany dla impulsowych sieci neuronowych — plastyczność zależna od czasu impulsów (STDP) — ma różne właściwości. W tym właśnie plastyczność (zdolność do nauki na podstawie przykładów po wdrożeniu przez dostosowanie wag na żywo). „Mamy wiele przykładów STDP, które działały na Loihi 1 i z pewnością są takie, które stosują tego rodzaju reguły uczenia z dobrym efektem. Jednak ponownie, wpadają w kategorię ręcznie wykonanego, gdzie istnieje pewien stopień błyskotliwości badacza, który wymyślił rozwiązanie”. Dodał jednocześnie, że: „to jest bardzo mały algorytm uczenia, to nie jest jeszcze koniec”.
Davies wskazuje na niedawne prace nad tzw. metauczeniem (nauczenie się, jak się uczyć — lub zmiana algorytmu treningowego na podstawie danych) jako przykład nowych podejść do szkolenia, które mogą przynieść korzyści. Jednym z pomysłów jest wykorzystanie wstecznej propagacji opartej na uczeniu zewnętrznym w połączeniu z STDP w pętli wewnętrznej. „Jesteśmy bardzo podekscytowani tego rodzaju sposobem rozpatrywania rzeczy, który łączy najlepsze z obu światów” — mówi Davies. „Możemy używać znanego algorytmu sieci neuronowej [wstecznej propagacji] offline, ale uwzględniamy zakres plastyczności, który można zastosować online”.
Intel niedawno wydał pakiet oprogramowania do szybkiego uczenia opartego na prototypach w chipie. Chodzi tu o moduł, który można połączyć z sieciami uczenia maszynowego, aby przeprowadzić efektywne szkolenie ostatniej warstwy (wyciąganie cech z zestawu danych. A następnie korzystanie z lokalnych zasad uczenia zainspirowanych neurologią do nauki tych cech online w sposób pół-nadzorowany, przy jednoczesnym, istotnym, niezapominaniu tego, co zostało wcześniej przyswojone).
„Jednym z bolesnych aspektów całego tego obszaru badań jest to, że nawet jeśli wydaje się, że dokonano postępu na skalę globalną, zajmuje to bardzo dużo czasu, aby doprowadzić do wynalazków fundamentalnych” — powiedział Davies, zauważając, że wsteczna propagacja istnieje od wielu dziesięcioleci.
Osiem układów Loihi 2 Intela (cztery z przodu, cztery z tyłu) zainstalowane w systemie Kapoho Point.
Wyzwania związane z oprogramowaniem
Ramowy system oprogramowania Intela dla Loihi, Lava, został wydany w 2020 roku jako projekt open source. „Oprogramowanie zdecydowanie stanowi wyzwanie” — mówi Davies. „Oprogramowanie jest trudne, zwłaszcza gdy podnosimy poprzeczkę, aby robić wszystko w otwartym środowisku, gdzie każda wersja będzie widoczna. Zdecydowanie spowalnia to postęp w porównaniu z naszym oprogramowaniem pierwszej generacji, które było czymś, co stworzyliśmy, aby uzyskać podstawową programowalność. Więc nasze tempo postępu było trochę wolniejsze, niż miałem nadzieję dwa lata temu. Niestety stało się to ograniczeniem — gotowość oprogramowania opóźniała rezultaty”.
Brak tego elementu oznacza mniej publikacji korzystających z Loihi 2 niż w przypadku Loihi 1 na tym samym etapie. Jednak jest to bezpośredni wynik postawienia wyższej poprzeczki dla oprogramowania, powiedział Davies. „Chcemy upewnić się, że to, co ludzie rozwijają tym razem, nie jest jednorazowe. Nie jest napisane tylko na papierze, a potem zapomniane. A przyczynia się do powstawania zbioru kodu, który ludzie mogą używać, dostosowywać i rozwijać” — powiedział. „W aspekcie badawczym to jest ciężka praca”.
Davies jest jednak podekscytowany pracą nad ramowym systemem oprogramowania zaprojektowanym od podstaw dla sprzętu neuromorficznego. Z czasem możemy oczekiwać lepszej integracji ze standardowymi platformami, takimi jak Intel OneAPI. Chociaż dokładny stopień integracji wciąż jest niejasny, ze względu na różnice między nimi.
Przypadki użycia
Podczas gdy wiele sieci impulsowych to nadal projekty badawcze, Intel współpracuje z coraz większą liczbą grup przemysłowych i rozważa kolejne potencjalne zastosowania. „Nie ma dla mnie wątpliwości, że podążamy ścieżką komercjalizacji i są rezultaty. Mówimy tu o trzech rzędach wielkości poprawy w produkcie opóźnienia energetycznego [współczynnik łączący pobór energii i opóźnienia algorytmu] — powinien być sposób, aby przekształcić to w wartość dla końcowych przypadków użycia” — powiedział Davies.
Kwestie optymalizacyjne okazały się obiecującym obszarem badań. Intel poświęcił dużo czasu na przechodzenie od mankamentów typu łamigłówki sudoku do budowy metodologii, która może być wykorzystywana do rozwiązywania klas przeszkód, takich jak problemy programowania liniowego całkowitoliczbowego, programowania kwadratowego, kwadratowe nieograniczone binarne optymalizacje (Qubo). Może być także stosowana do wielu bardziej realistycznych ujęć, takich jak harmonogramowanie logistyki i modele sterowania predykcyjnego dla robotyki. „Sporo z tych matematycznie trudnych, kosztownych problemów optymalizacyjnych można sformułować w tym paradygmacie sieci, które możemy rozwiązać i uruchamiać na Loihi 2” — podsumował Davies.
Mike Davies, dyrektor Intel Neuromorphic Computing Labs, prezentuje demo optymalizacji satelitarnej opartej na Loihi 2 podczas Intel Innovation z Sally Ward-Foxton z EE Times.
Najwięcej zainteresowania pojawiło się dotychczas ze strony przemysłu kosmicznego i lotniczego, który jest wrażliwy na rozmiar, wagę i pobieraną moc systemów, a także tam, gdzie komunikacja z serwerami na ziemi może być kosztowna lub niemożliwa. Davies ma nadzieję, że weryfikacja technologii w tych pierwszych zastosowaniach przyczyni się ostatecznie do jej rozprzestrzenienia się na rynki o większym wolumenie.
Podczas prezentacji Loihi w Intel Innovation, firma Intel wykorzystała rekurencyjną sieć neuronową do rozwiązania problemu harmonogramowania satelitów — koordynacji ich konstelacji w celu zaplanowania kamer nad punktami zainteresowania — w nietypowy sposób, używając układów Loihi 2.
Davies zaznacza, że Loihi 2 jest wciąż w fazie badawczej. Dodaje jednak, że następne generacje układów scalonych (na przykład te, które powstaną w ciągu najbliższych pięciu lat) mogą być zaprojektowane z myślą o bardziej konkretnych zastosowaniach komercyjnych. Można to uprościć nawet do zmiany interfejsów lub dostosowania rozmiaru całości do obsługi aplikacji o dużym wolumenie.
Źródło: https://www.eetimes.com/what-is-holding-back-neuromorphic-computing/
Neuromorficzny chip Intela, Loihi, jest obecnie produkowany w już drugiej generacji. W przeciwieństwie do niektórych innych typów akceleratorów sieci impulsowych przeznaczonych do zastosowań w ultraniskonapięciowych końcowych punktach, Loihi 2 jest dedykowany dla systemów o większej skali, takich jak centra danych. „Loihi 2 poprawił wiele interesujących rzeczy w zestawieniu z Loihi 1” — wskazuje Davies. „Zaczął zacierać granicę między czystym podejściem neuromorficznym a tradycyjną architekturą akceleratorów sztucznej inteligencji, co skłoniło nas do eksploracji nowego reżimu obiecujących algorytmów”. Najlepszy sposób niekoniecznie jest tym, który najbardziej zbliża się do biologii, powiedział Davies, o ile zrozumiemy, dlaczego pojawiają się pewne różnice. Na przykład jednym z wyborów architektonicznych Intela dla Loihi 2 było umożliwienie impulsów o różnej amplitudzie. „Nie rezygnujemy z pomysłu, że impuls to wartość binarna. Jednak okazało się, że wysłanie liczby całkowitej jest naprawdę tanie i łatwe do zrealizowania w cyfrowym CMOS” — powiedział. „Natura ma z tym trudniej — wciąż zdumiewające jest, co można zrobić z binarnymi impulsami. Aczkolwiek przez uzupełnienie czystego podejścia biologicznego, a następnie zastosowanie wstecznej propagacji, myślę, że doprowadzi to do naprawdę ciekawych sieci i nowych zdolności”.
Architektura drugiej generacji Loihi Intela obejmuje impulsy o różnych amplitudach i zdolność programowania odmiennych modeli neuronów.
Programowalność była kolejnym istotnym dodatkiem do Loihi 2. Podczas gdy neurony projektu zastosowanego w Loihi 1 były konfigurowalne, tak te w Loihi 2 mają pełny zestaw instrukcji umożliwiający nowy poziom programowalności. Obejmują one wspólne instrukcje arytmetyczne, porównawcze i sterowania przepływem programu. A także umożliwiają obsługę różnych modeli neuronów opartych na uczeniu głębokim i projektowaniu ludzkim, niekoniecznie ściśle związanych z biologią. „Zamiast postrzegać to tak, że neurobiolodzy obliczeniowi scharakteryzowali te klasy neuronów i jeśli je zaimplementujemy, będziemy w stanie obsłużyć te algorytmy zainspirowane biologią, to uznajemy, że od ery Loihi 1 wszystkie najlepsze przykłady naprawdę dążyły do skrajnej konfigurowalności tych modeli neuronów” — opowiedział przedstawiciel Intela.
Zespoły badawcze używają Loihi 2 do implementacji skomplikowanych modeli neuronów, takich jak rezonansowe i ogniowe, oscylujące. Jeden z najbardziej zaawansowanych wariantów wykorzystuje rezonator Hopfa. „To jeden z cudów natury — że biologiczna materia i chemikalia i białka mogą tworzyć te komórki, które rozwiązują niezwykle bogatą i złożoną dynamikę” — wskazał Davies. Zauważył on, że wiele innowacji zachodzi na styku inspiracji neurobiologicznej i rzeczywistych przypadków użycia (wariant rezonatora Hopfa może być używany do rozwiązywania problemów optymalizacyjnych związanych z normalizacją automatycznego wzrostu w przetwarzaniu wstępnym dźwięku, na przykład). „Naszym wyzwaniem jest dostarczenie odpowiedniej dokumentacji i zrozumienie wszystkich zastrzeżeń dotyczących uzyskania dobrych wyników” — podsumował.
Sieci jednokierunkowe
Prace badawcze w 2020 roku pokazały skromne zyski dla sieci impulsowych w porównaniu z tymi uczenia maszynowego opartego na głębokim uczeniu się jednokierunkowym. Jednak bardziej wyraźne korzyści były dostrzegalne w przypadku sieci neuronów rekurencyjnych. W międzyczasie te ostatnie wyszły trochę z mody. Podczas gdy niektóre z najbardziej popularnych przypadków użycia przesunęły się w kierunku sieci korzystających z transformatorów. „Mamy wrażenie, że płyniemy pod prąd w kwestii sieci rekurencyjnych” — powiedział Davies. „Mamy klasy sieci rekurencyjnych, które działają niesamowicie dobrze — nasze sieci optymalizacyjne są dalekie od modeli uczenia głębokiego — i łączymy je z problemami rzeczywistego świata”. Jednak przyznaje on, że Loihi będzie potrzebować rozwiązania dla sieci jednokierunkowych. Obecne prace skupiają się na przekształcaniu tychże w rekurencyjne, wykorzystując właściwości neuromorficzne. Chodzi tu o stanowe neurony i rzadkość ich połączeń. Jednak ma się to odbywać w sposób bardziej zaawansowany niż w przypadku wcześniejszej pracy z wykorzystaniem Loihi 1. „To teraz podejście, na którym się skupiamy. Chcemy zająć się popularnymi sieciami jednokierunkowymi, aby przedstawić API do mapowania tego rodzaju sieci” — informuje. „Liczby, które zaczynamy uzyskiwać, przynajmniej na mniejszą skalę, są ekscytujące, nie tylko pod względem energii, ale także opóźnień”. Energia może być kluczowa w aplikacjach kosmicznych, ale opóźnienia są krytyczne na przykład w systemach wizyjnych czy percepcji robotów.
Generatywne sieci pulsujące
Artykuł naukowy na temat wersji impulsowej modelu do generacji tekstu, SpikeGPT, niedawno wzbudził zainteresowanie w impulsowych sieciach neuronowych. Wynalazcy SpikeGPT stwierdzili, że model jest konkurencyjny w porównaniu z sieciami uczenia maszynowego, ale z 20-krotnie mniejszą liczbą operacji i odpowiadającą temu redukcją zużycia energii. Wersja z 216-milionami parametrów jest największym do tej pory modelem wytrenowanym za pomocą wstecznej propagacji w sieci neuronów impulsowych.
Czy to oznacza, że duże modele językowe (LLM) mają przyszłość w sieciach impulsowych? „Wyzwaniem jest to, że etap uwagi nie jest kompatybilny z większością architektur neuromorficznych... W sercu transformatorów jest mnożenie macierzy przez macierze, które jest trudne do zaimplementowania w architekturach neuromorficznych” — powiedział Davies (SpikeGPT omija to ograniczenie, wprowadzając dane punktowe sekwencyjnie).
Poza tym bardzo konkretnym wyzwaniem technicznym, transformatory są inherentnie niepodobne do mózgu, jak mówi Davies. Prezentują cały wejściowy zestaw danych jako ogromny wektor dla sieci jednokierunkowej. Wydaje się to podejściem siłowym w porównaniu z bardziej: „mózgowym”, takim jak struktury rekurencyjne, które mogłyby otworzyć fascynujące ścieżki badawcze. „To będzie naprawdę ekscytujący kierunek poruszania się do przodu w tej dziedzinie. I chociaż jeszcze nie jesteśmy na końcu tej drogi, to będziemy potrzebować iteracji krzemowej, aby ją wesprzeć. Naprawdę ekscytujące jest to, że techniki, które znamy, działające dobrze w zakresie redukcji zużycia energii i zmniejszenia opóźnień, myślę, że w końcu będziemy mogli je zastosować do dużych modeli językowych” — dodał. Wskazał jednocześnie, że mimo że skalowanie sieci impulsowych do rozmiarów LLM będzie wyzwaniem, technologia może oferować pewne korzyści związane ze zużyciem energii czy redukcją opóźnienia — nawet w przypadku mniejszej skali implementacji.
Wyzwania związane z treningiem sieci
Szkolenie sieci impulsowych było tematem badań od dłuższego czasu. Nie są one kompatybilne z algorytmem używanym do trenowania sieci uczenia maszynowego — wsteczną propagacją — bez matematycznych przybliżeń, które mogą prowadzić do mniej dokładnych wyników. Jednym z dużych wyzwań jest zastosowanie wstecznej propagacji do impulsów w bardziej uogólniony sposób. To znaczy tak, aby: „nie był to tylko błyskotliwy doktorant poświęcający całą swoją pracę doktorską jednemu przykładowi, który może scharakteryzować i pokazać wartość” — podsumował Davies. Alternatywny reżim szkoleniowy opracowany dla impulsowych sieci neuronowych — plastyczność zależna od czasu impulsów (STDP) — ma różne właściwości. W tym właśnie plastyczność (zdolność do nauki na podstawie przykładów po wdrożeniu przez dostosowanie wag na żywo). „Mamy wiele przykładów STDP, które działały na Loihi 1 i z pewnością są takie, które stosują tego rodzaju reguły uczenia z dobrym efektem. Jednak ponownie, wpadają w kategorię ręcznie wykonanego, gdzie istnieje pewien stopień błyskotliwości badacza, który wymyślił rozwiązanie”. Dodał jednocześnie, że: „to jest bardzo mały algorytm uczenia, to nie jest jeszcze koniec”.
Davies wskazuje na niedawne prace nad tzw. metauczeniem (nauczenie się, jak się uczyć — lub zmiana algorytmu treningowego na podstawie danych) jako przykład nowych podejść do szkolenia, które mogą przynieść korzyści. Jednym z pomysłów jest wykorzystanie wstecznej propagacji opartej na uczeniu zewnętrznym w połączeniu z STDP w pętli wewnętrznej. „Jesteśmy bardzo podekscytowani tego rodzaju sposobem rozpatrywania rzeczy, który łączy najlepsze z obu światów” — mówi Davies. „Możemy używać znanego algorytmu sieci neuronowej [wstecznej propagacji] offline, ale uwzględniamy zakres plastyczności, który można zastosować online”.
Intel niedawno wydał pakiet oprogramowania do szybkiego uczenia opartego na prototypach w chipie. Chodzi tu o moduł, który można połączyć z sieciami uczenia maszynowego, aby przeprowadzić efektywne szkolenie ostatniej warstwy (wyciąganie cech z zestawu danych. A następnie korzystanie z lokalnych zasad uczenia zainspirowanych neurologią do nauki tych cech online w sposób pół-nadzorowany, przy jednoczesnym, istotnym, niezapominaniu tego, co zostało wcześniej przyswojone).
„Jednym z bolesnych aspektów całego tego obszaru badań jest to, że nawet jeśli wydaje się, że dokonano postępu na skalę globalną, zajmuje to bardzo dużo czasu, aby doprowadzić do wynalazków fundamentalnych” — powiedział Davies, zauważając, że wsteczna propagacja istnieje od wielu dziesięcioleci.
Osiem układów Loihi 2 Intela (cztery z przodu, cztery z tyłu) zainstalowane w systemie Kapoho Point.
Wyzwania związane z oprogramowaniem
Ramowy system oprogramowania Intela dla Loihi, Lava, został wydany w 2020 roku jako projekt open source. „Oprogramowanie zdecydowanie stanowi wyzwanie” — mówi Davies. „Oprogramowanie jest trudne, zwłaszcza gdy podnosimy poprzeczkę, aby robić wszystko w otwartym środowisku, gdzie każda wersja będzie widoczna. Zdecydowanie spowalnia to postęp w porównaniu z naszym oprogramowaniem pierwszej generacji, które było czymś, co stworzyliśmy, aby uzyskać podstawową programowalność. Więc nasze tempo postępu było trochę wolniejsze, niż miałem nadzieję dwa lata temu. Niestety stało się to ograniczeniem — gotowość oprogramowania opóźniała rezultaty”.
Brak tego elementu oznacza mniej publikacji korzystających z Loihi 2 niż w przypadku Loihi 1 na tym samym etapie. Jednak jest to bezpośredni wynik postawienia wyższej poprzeczki dla oprogramowania, powiedział Davies. „Chcemy upewnić się, że to, co ludzie rozwijają tym razem, nie jest jednorazowe. Nie jest napisane tylko na papierze, a potem zapomniane. A przyczynia się do powstawania zbioru kodu, który ludzie mogą używać, dostosowywać i rozwijać” — powiedział. „W aspekcie badawczym to jest ciężka praca”.
Davies jest jednak podekscytowany pracą nad ramowym systemem oprogramowania zaprojektowanym od podstaw dla sprzętu neuromorficznego. Z czasem możemy oczekiwać lepszej integracji ze standardowymi platformami, takimi jak Intel OneAPI. Chociaż dokładny stopień integracji wciąż jest niejasny, ze względu na różnice między nimi.
Przypadki użycia
Podczas gdy wiele sieci impulsowych to nadal projekty badawcze, Intel współpracuje z coraz większą liczbą grup przemysłowych i rozważa kolejne potencjalne zastosowania. „Nie ma dla mnie wątpliwości, że podążamy ścieżką komercjalizacji i są rezultaty. Mówimy tu o trzech rzędach wielkości poprawy w produkcie opóźnienia energetycznego [współczynnik łączący pobór energii i opóźnienia algorytmu] — powinien być sposób, aby przekształcić to w wartość dla końcowych przypadków użycia” — powiedział Davies.
Kwestie optymalizacyjne okazały się obiecującym obszarem badań. Intel poświęcił dużo czasu na przechodzenie od mankamentów typu łamigłówki sudoku do budowy metodologii, która może być wykorzystywana do rozwiązywania klas przeszkód, takich jak problemy programowania liniowego całkowitoliczbowego, programowania kwadratowego, kwadratowe nieograniczone binarne optymalizacje (Qubo). Może być także stosowana do wielu bardziej realistycznych ujęć, takich jak harmonogramowanie logistyki i modele sterowania predykcyjnego dla robotyki. „Sporo z tych matematycznie trudnych, kosztownych problemów optymalizacyjnych można sformułować w tym paradygmacie sieci, które możemy rozwiązać i uruchamiać na Loihi 2” — podsumował Davies.
Mike Davies, dyrektor Intel Neuromorphic Computing Labs, prezentuje demo optymalizacji satelitarnej opartej na Loihi 2 podczas Intel Innovation z Sally Ward-Foxton z EE Times.
Najwięcej zainteresowania pojawiło się dotychczas ze strony przemysłu kosmicznego i lotniczego, który jest wrażliwy na rozmiar, wagę i pobieraną moc systemów, a także tam, gdzie komunikacja z serwerami na ziemi może być kosztowna lub niemożliwa. Davies ma nadzieję, że weryfikacja technologii w tych pierwszych zastosowaniach przyczyni się ostatecznie do jej rozprzestrzenienia się na rynki o większym wolumenie.
Podczas prezentacji Loihi w Intel Innovation, firma Intel wykorzystała rekurencyjną sieć neuronową do rozwiązania problemu harmonogramowania satelitów — koordynacji ich konstelacji w celu zaplanowania kamer nad punktami zainteresowania — w nietypowy sposób, używając układów Loihi 2.
Davies zaznacza, że Loihi 2 jest wciąż w fazie badawczej. Dodaje jednak, że następne generacje układów scalonych (na przykład te, które powstaną w ciągu najbliższych pięciu lat) mogą być zaprojektowane z myślą o bardziej konkretnych zastosowaniach komercyjnych. Można to uprościć nawet do zmiany interfejsów lub dostosowania rozmiaru całości do obsługi aplikacji o dużym wolumenie.
Źródło: https://www.eetimes.com/what-is-holding-back-neuromorphic-computing/
Fajne? Ranking DIY