Elektroda.pl
Elektroda.pl
X
Elektroda.pl
Proszę, dodaj wyjątek dla www.elektroda.pl do Adblock.
Dzięki temu, że oglądasz reklamy, wspierasz portal i użytkowników.

Akcelerator Mythic AI dla najbardziej wymagających aplikacji

ghost666 22 Lis 2020 17:12 297 0
  • Akcelerator Mythic AI dla najbardziej wymagających aplikacji
    Firma Mythic wprowadził właśnie na rynek swój pierwszy produkt - akcelerator AI dla wymagających zastosowań na krawędzi. Moduł ten osiąga 35 TOPS, a dzięki analogowej architekturze obliczeniowej zapewnia niskie zużycie energii i niski koszt, a także małe opóźnienia i deterministyczne zachowanie.

    Moduł M1108 wykorzystuje analogową technikę obliczeń w pamięci Mythic, opartą na 40-nm komórkach pamięci Flash. Jest skierowany do zastosowań brzegowych, takich jak kamery bezpieczeństwa z zasilaniem PoE, które muszą obsługiwać zaawansowane modele sztucznej inteligencji w ramach niewielkiego budżetu mocy. Inną prawdopodobną aplikacją są systemy do analizy wideo, które wymagają przyspieszenia wielu modeli AI na materiałach o wysokiej rozdzielczości.

    Układ akceleratora AI firmy Mythic jest w stanie osiągnąć 35 TOPS. Lider rynku w tej dziedzinie, Xavier AGX firmy Nvidia, osiąga jedynie 32 TOPS.

    Typowy pobór mocy M1108 wynosi zaledwie 4 W (w porównaniu do 10..30 W Xaviera AGX), rozwiązanie Mythic jest mniejsze, ponieważ nie jest wymagana zewnętrzna pamięć DRAM, a Mythic oczekuje, że M1108 będzie dobrze porównywany pod względem ceny, ponieważ jego struktura półprzewodnikowa produkowana jest w technologii 40 nm i nie wymaga zaawansowanego węzła procesowego. Mythic twierdzi, że M1108 będzie działać z prędkością 870 fps z ResNet-50 (rozmiar partii 1) i 60 fps na Yolo v3-608 × 608 (kanał wideo w rozmiarze 1).

    Ramy czasowe

    Przemawiając podczas festiwalu CogX w czerwcu 2019 roku, dyrektor generalny Mythic, Mike Henry powiedział, że firma planuje wypuścić próbki pod koniec tego roku. To oznacza, że premiera M1108 ma prawie rok opóźnienia. dyrektor spółki przypisuje to problemom z software.

    "Postanowiliśmy wstrzymać się z oficjalnym wprowadzeniem na rynek, dopóki nie będziemy mogli pokazać wysoce konkurencyjnych wyników testów porównawczych" powiedział Henry. "Zbudowanie całego ekosystemu oprogramowania za pomocą elastycznego kompilatora (...) i uruchomienie wszystkiego było ogromnym wysiłkiem. Popisywaliśmy się prostszymi aplikacjami, takimi jak wykrywanie słów kluczowych, dość wcześnie, ale naprawdę duże, potężne sieci osiągające setki klatek na sekundę i opóźnienie poniżej 10 ms, to ogromna ilość pracy nad oprogramowaniem".

    Akcelerator Mythic AI dla najbardziej wymagających aplikacji


    W tym czasie rynek chipów akceleratora AI stał się coraz bardziej konkurencyjny. Czy opóźnienie kosztowało utratę klientów? Henry mówi, że nie. Porównawcze testy każą w to wierzyć - Wiele konkurencyjnych chipów AI bardziej przypomina produkty klasy serwerowej o zapotrzebowaniu na moc na poziomie 10..15 W lub urządzenia o bardzo niskiej mocy obliczeniowej. W ten sposób trudniejszy segment „high-end edge” jest stosunkowo pozbawiony konkurencji.

    Obliczenia analogowe

    Akcelerator Mythic wykorzystuje 108 modułów obliczeniowych, które opierają się na analogowych technikach przetwarzania w pamięci. Na każdym module analogowy silnik obliczeniowy (ACE) znajduje się obok cyfrowego silnika wektorowego SIMD, 32-bitowego procesora RISC-V, routera Network On Chip (NoC) i lokalnej pamięci SRAM. Silnik obsługuje odpowiedniki operacji INT4, INT8 i INT16, a jego całkowita pojemność wynosi 113 milionów wag, co wystarcza do jednoczesnego uruchomienia kilku oddzielnych, złożonych sieci neuronowych. Ponieważ obliczenia są wykonywane w pamięci Flash, zewnętrzna pamięć DRAM nie jest wymagana.

    Akcelerator Mythic AI dla najbardziej wymagających aplikacji


    Tim Vehling, wiceprezes firmy Mythic, wskazał, że chip wykorzystuje „prawdziwą” technikę obliczania w pamięci. "Przechowujemy i obliczamy wszystko na tej samej jednostce pamięci, na tym samym tranzystorze Flash" powiedział Vehling. "Niektóre inne architektury analogowe mogą wykonywać obliczenia analogowe, ale nadal używają pamięci cyfrowej do przechowywania parametrów. Więc nadal wykonują jakiś rodzaj operacji pobierania danych. Nie uzyskają nigdy tej samej gęstości i szybkości jak prawdziwe obliczenia w pamięci”.

    Plany rozwoju

    Nazwa M1108 (pierwsza generacja, układ 108) wskazuje na plan tworzenia kolejnych generacji i różne konfiguracje płytek. Kolejne układy mają być produkowane w tej samej technologii 40 nm. Mniejsze i większe układy są technicznie możliwe, ale przedstawiciel firmy odmówił potwierdzenia, co jest w planach firmy. Powiedział jednak, że wieloprocesorowe karty PCIe zdecydowanie będą rozwijane. Obecnie dostępne są już próbki M1108 w postaci kart M.2 i PCIe.

    Źródło: https://www.eetimes.com/mythic-ai-accelerator-targets-high-end-edge-with-35-tops/

    Fajne! Ranking DIY
    O autorze
    ghost666
    Tłumacz Redaktor
    Offline 
    Fizyk z wykształcenia. Po zrobieniu doktoratu i dwóch latach pracy na uczelni, przeszedł do sektora prywatnego, gdzie zajmuje się projektowaniem urządzeń elektronicznych i programowaniem. Od 2003 roku na forum Elektroda.pl, od 2008 roku członek zespołu redakcyjnego.
    ghost666 napisał 10081 postów o ocenie 8344, pomógł 157 razy. Mieszka w mieście Warszawa. Jest z nami od 2003 roku.
  • CSICSI