Elektroda.pl
Elektroda.pl
X
PCBway
Proszę, dodaj wyjątek dla www.elektroda.pl do Adblock.
Dzięki temu, że oglądasz reklamy, wspierasz portal i użytkowników.

Nowy akcelerator z układem programowalnym FPGA dla komputerów PC

ghost666 28 Lis 2019 11:08 612 3
  • Nowy akcelerator z układem programowalnym FPGA dla komputerów PC
    Aplikacje obliczeniowe o dużej przepustowości i różnorodne obciążenia obliczeniowe są motorem wprowadzania układów programowalnych (FPGA) do komputerów PC w postaci kart – programowalnych akceleratorów itp.

    Spółka Achronix Semiconductor i BittWare (marka firmy Molex), zaprezentowały właśnie nową klasę kart akceleratora FPGA do przetwarzania danych w chmurze i na jej obrzeżach. Została zaprojektowana do obsługi bardzo zróżnicowanych obciążeń. Firmy oferują kartę również jako wstępnie zintegrowaną i w pełni przetestowaną platformę serwerową FPGA. Dzięki temu możliwe jest szybkie i łatwe jej wykorzystanie w ramach istniejącej infrastruktury serwerowej.

    Karta akceleratora VectorPath S7t-VG6, wykorzystuje układ FPGA Asterix Speedster7t AC7t1500 wykonany w technologii 7 nanometrów Jest to układ zaprojektowane z wykorzystaniem najlepszych w branży interfejsów, dostępny jest na karcie akceleracyjnej do komputera PC wyposażonej w interfejs PCI Express (PCIe) do układu FPGA.

    Zaprezentowana wcześniej w tym roku rodzina Speedster7t FPGA ma dwuwymiarową sieć neuronową na chipie (NoC) o przepustowości ponad 20 Tb/s (przy przenoszenia danych). 2D NoC łagodzi wąskie gardła danych dzięki 256-bitowym, jednokierunkowym magistralom w każdym kierunku, co daje w sumie 512 Gb/ dla każdego wiersza i kolumny NoC. Podstawowym interfejsem NoC są standardowe kanały AXI. Układy FPGA są również wyposażone w procesory uczenia maszynowego, które są zoptymalizowane pod kątem intensywnego zastosowania przy algorytmach sztucznej inteligencji. Test porównawczy ResNet-50 daje rezultat 8600 obrazów na sekundę. Achronix twierdzi, że układ oferuje wydajność obliczeniową trzy do czterech razy większą w porównaniu z procesorami graficznymi. Firma zauważa ponadto, że 2D NoC eliminuje wyzwania, przed którymi stoją firmy zajmujące się tworzeniem bloków IP, umożliwiając proste ich połączenie poprzez AXI oraz obsługę połączeń dla szybkich interfejsów i pamięci.

    W przypadku aplikacji obliczeniowych idea wzrostu wykładniczo ilości danych sprawdza się od dziesięcioleci powiedział Steve Mensor, wiceprezes ds. sprzedaży i marketingu w Achronix. Jak wskazuje potwierdzają to przykłady przetwarzania danych z sieci, czujników czy też systemy rozpoznawania głosu lub obrazów i inne obciążenia AI. Dodatkowo, jak zauważają przedstawiciele firmy, w zależności od obciążenia, układy FPGA mogą działać od 10 do nawet 100 razy szybciej niż tradycyjne procesory i to przy niższym poborze mocy.

    „Zmiana na rynku to nie tylko wzrost ilości danych, ale także samego obciążenia” kontynuuje Mensor. „Największe wyzwania, przed którymi stoją systemy hiperskalowalne i dostawcy usług w chmurze, to dostarczanie energii i chłodzenie komputerów, a ostatecznie także koszty. Jeśli wymyślą oni sposoby na zwiększenie wydajności dla dowolnej realizowanej funkcji, to rozwiąże to oba te wyzwania”.

    „Niektórzy klienci korzystający z hiperskali, tacy jak Microsoft czy Amazon, odnoszą sukcesy w technologii FPGA, a przez ponad 5 lat Nvidia odnosiła sukcesy w procesorach GPU i środowiskach programistycznych CUDA” powiedział Craig Petrie, wiceprezes ds. Marketingu w BittWare. „Te głośne sukcesy zmieniły branżę”, mówi, „to, co zaprezentował Microsoft, to przyspieszenie wyszukiwarki Bing przy użyciu układów FPGA firmy Altera oraz użycie procesorów Intel Stratix 10 FPGA, nabytych od Altera, do trwałej aplikacji akceleratora sieci neuronowej, Project Brainwave”. Petrie wskazuje także, że niedawno Amazon wdrożył układy FPGA od Xilinxa na platformie chmurowej AWS, a w ostatnim roku dostawcy serwerów, tacy jak Dell, HPE i Fujitsu, oferują karty PCI FPGA jako opcje przyspieszenia dla popularnych platform serwerowych. Doprowadziło to do dużych zmian w adaptacji technologii FPGA w zakresie akceleracji AI, a także zmiany sposobu, w jaki FPGA są używane przy różnych obciążeniach.

    Firmy działające w hiperskali, takie jak Microsoft i Amazon, dysponują zasobami jak i talentem pracowników do robienia projektów na niskim poziomie, z mikroprocesorami i układami programowalnym. Mogą one zainwestować znaczny wysiłek i energię w opracowanie kart akceleracyjnych i przejść cały proces od integracji po kwalifikację, produkcję i testowanie w dużych ilościach, wyjaśnił Petrie. Mniejsze spółki, nawet z sektora hiperskalowego, jak i klienci korporacyjni nie mają takich zasobów i potrzebują gotowej opcji.

    Petrie zauważył również, że tego rodzaju klienci chcą kupować układy FPGA na poziomie karty, podobnie jak w przypadku zakupu układów GPU. W niektórych przypadkach chcą kupować układy FPGA nawet na poziomie serwera, stąd zmiana w Dell, HPE czy Fujitsu, które oferują teraz karty PCI z FPGA jako opcje.

    Opracowany produkt zajmuje kluczowymi aspektami, takimi jak efektywność energetyczna, możliwość przeprogramowania platform dla nowego sprzętu, niezależnie od tego, czy znajduje się on na granicy lub w części infrastruktury chmurowej, a także wyzwaniami związanymi z czasem wprowadzenia na rynek nowych usług.

    Petrie wskazuje, że układy FPGA dla wybranych obciążeń zapewniają poziomy wydajności i opłacalności porównywalne z układami ASIC. Dla klientów, którzy chcą zmieniać przeznaczenie platform końcowych do różnych zastosowań, możliwość zmiany firmware układu FPGA jest niezwykle ważne. „Z pewnością szybsze jest przeprogramowanie układu programowalnego niż na przykład opracowanie nowego układu ASIC”.

    Co jest na karcie akceleratora

    Karta akceleratora VectorPath S7t-VG6, zaprojektowana jest do prototypowania, ale może być produkowana na dużą skalę. Pozwala projektantom przetwarzać ogromne ilości danych, co nie jest możliwe w przypadku poprzednich generacji układów FPGA. Dzięki dodaniu do karty funkcji typowych dla kart i zestawów deweloperskich system uzyskuje nowy poziom elastyczności.

    Nowy akcelerator z układem programowalnym FPGA dla komputerów PC
    Karta akceleratora VectorPath zawiera jeden 400-gigabitowy port Ethernet i dwa 100-gigabitowe porty Ethernet. Kartę wyposażono w osiem banków pamięci GDDR6 o łącznej przepustowości do 4 Tb/s, co sprawia, że nadaje się do aplikacji w akceleracji danych o dużej przepustowości. Karta dostarczana jest w formacie o pełnej wysokości i długości ¾ (tego samego rozmiaru, co typowe GPU); producent oferuje również trzy opcje chłodzenia: pasywną, aktywną i możliwość chłodzenia cieczą.

    Kluczowe parametry:

    * Interfejsy 400 GbE QSFP-DD i 100 GbE QSFP56
    * Osiem banków pamięci GDDR6 zapewniających łączną przepustowość 4 Tb/s
    * Jeden bank DDR4 działający z częstotliwością 2666 MHz z ECC
    * Zgodność i certyfikacja PCIe
    * Dwuwymiarowa sieć neuronowa na chipie (NoC) z łączem do 20 Tb/s w FPGA
    * 692K 6-wejściowych modułów LUT w FPGA
    * 40K Int8 MAC, które dostarczają ponad 80 TOPS
    * OCuLink - czteroliniowe złącze PCIe Gen 4 do podłączania kart rozszerzeń

    Spośród wszystkich funkcji i elementów w module, które warto bliżej omówić, szczególnie istotne są dwa aspekty: zintegrowana pamięć GDDR6 i zgodność z interfejsem PCIe potwierdzona odpowiednią klasyfikacją karty.

    Petrie wskazuje, że układy FPGA z wbudowanymi pamięciami HBM i HBM2 są na rynku premium, ale Achronix zastosował w FPGA zmodyfikowane bloki IP dla pamięci GDDR6. „Możemy używać niedrogich, gotowych, układów GDDR6, zwykle wykorzystywanych w GPU; na kartach FPGA zapewniają taką samą przepustowość jak HPM2, ale w niższej cenie” uzasadnia wybór rodzaju pamięci na karcie.

    Karta będzie dostarczana z pełną kompatybilnością z PCIe Gen 3 x16 (16 linii PCIe), które jest obecnie używana na rynku, ale interfejs jest również przyszłościowy i ma możliwość dodania bloków IP zapewniających kompatybilność z PCIe Gen 4 i Gen 5.

    Inne kluczowe cechy karty Speedster7t to pakiet bloków IP dla MAC i FEC dla szeregu standardowych protokołów i różnych szybkości interfejsów sieciowych, a także dla elastycznych interfejsów gigabitowych, co zapewnić ma kompatybilność z różnymi systemami I/O. W pakiecie znajdziemy wsparcie dla interfejsów takich jak 1x200 GbE (w postaci 2x100 GbE lub 4x10/25/40/50 GbE) oraz 1x400 GbE (jako 2x200 GbE, 4x100 GbE lub 8x10/25/40/50 GbE). Petrie wskazuje, że interfejs 400 GbE jest unikalnym w skali całego rynku interfejsem, jeśli chodzi o karty akceleratorów FPGA.

    Karta oferuje również opcje synchronizacji zegara dla aplikacji o krytycznym czasie. Firma BittWare dodała wejścia zegara na panelu przednim co pozwala zsynchronizować wiele kart razem lub użyć zewnętrznego zegara, aby zsynchronizować dane, wraz z układami redukującymi jitter zegara.

    Port rozszerzeń zintegrowany w module to także istotna sprawa – oferuje on szybki interfejs szeregowy o niskim opóźnieniu i zapewnia deterministyczne skalowanie i możliwość dodania dodatkowych portów sieciowych, wymaganych w gęstszych aplikacjach. W porcie rozszerzeń można również umieścić inne karty, na przykład wspierające niestandardowe protokoły szeregowe wymagane do podłączenia macierzy pamięci Flash NVMe.

    Dużo wysiłku zaangażowane firmy włożyły także w odpowiednie oprogramowanie i narzędzia Jak mówi Petrie, posiadanie najlepszego sprzętu jest oczywistym celem, ale posiadanie najlepszego sprzętu bez możliwości programowania i kontrolowania go jest bezużyteczne. Oprócz narzędzi programistycznych Achronix ACE dla Speedster 7t, BittWare oferuje również własny zestaw narzędzi, który zawiera oprogramowanie układowe i oprogramowanie dla kontrolera zarządzającego i monitorującego moduł. Raportuje on parametry karty, takie jak zużycie energii, jej temperatura, pobierany prąd, poziomy napięć zasilania etc. Współpracuje on z modułem bezpieczeństwa, który reaguje na problemy takie jak np. awaria chłodzenia.

    Kontroler zarządzania płytką i zestaw narzędzi programistycznych BittWare obejmuje również interfejs API, sterowniki PCIe, oprogramowanie do testów automatycznych i diagnostyki, a także przykładowe projekty. Obsługuje on systemy operacyjne Linux i Windows.

    „Diagnostyka jest ważny, ponieważ daje klientom podstawę do pracy” wskazuje Petrie. „Klienci mogą uruchomić test, aby sprawdzić, czy karta zachowuje się zgodnie z oczekiwanymi parametrami. To także podstawa gwarancji i wsparcia technicznego. Jeśli mają oni jakiekolwiek problemy, mogą przeprowadzić autotest diagnostyczny w celu uzyskania kompleksowego raportu opisującego wszystkie wyniki i parametry na samej karcie” tłumaczy przedstawiciel producenta.

    Karta akceleratora zapewnia firmom elastyczność dzięki dwóm opcjom zakupu. Oprócz samodzielnej karty można ją kupić wstępnie zintegrowaną jako gotowe serwery Dell lub HPE TeraBox od BittWare. Wstępnie zintegrowane serwery z modułem FPGA są objęte gwarancją i wsparciem Dell i HPE. Sama karta akceleratora VectorPath S7t-VG6 kosztować ma 7500 dolarów; będzie ona dostępna w drugim kwartale 2020 roku.

    Źródło: https://www.eetimes.com/document.asp?doc_id=1335253

    Fajne! Ranking DIY
    O autorze
    ghost666
    Tłumacz Redaktor
    Offline 
    Fizyk z wykształcenia. Po zrobieniu doktoratu i dwóch latach pracy na uczelni, przeszedł do sektora prywatnego, gdzie zajmuje się projektowaniem urządzeń elektronicznych i programowaniem. Od 2003 roku na forum Elektroda.pl, od 2008 roku członek zespołu redakcyjnego.
    ghost666 napisał 9436 postów o ocenie 7364, pomógł 157 razy. Mieszka w mieście Warszawa. Jest z nami od 2003 roku.
  • PCBway
  • #2
    chudybyk
    Poziom 29  
    Jestem ciekaw, kiedy pojawią się pierwsze gry wymagające takiego akceleratora. Taki Voodoo 3Dfx na sterydach. ;-)
  • PCBway
  • #3
    ghost666
    Tłumacz Redaktor
    chudybyk napisał:
    Jestem ciekaw, kiedy pojawią się pierwsze gry wymagające takiego akceleratora. Taki Voodoo 3Dfx na sterydach. ;-)


    Prawdopodobnie wtedy, gdy pojawią się gry wymagające dwóch fizycznych procesorów ;) czyli nigdy - to sprzęt do zupełnie czego innego.
  • #4
    chudybyk
    Poziom 29  
    ghost666 napisał:
    Prawdopodobnie wtedy, gdy pojawią się gry wymagające dwóch fizycznych procesorów ;) czyli nigdy - to sprzęt do zupełnie czego innego.

    Być może tak, być może nie. Karty graficzne są do wyświetlania obrazu a niektórzy kopią nimi bitcoiny. Architektura kart graficznych bardziej przypomina FPGA niż zwykły procesor, nawet wielordzeniowy. A sieci neuronowe mogą być kolejnym przełomem w rozrywce.
    Poza tym większość nowych gier doskonale wykorzystuje wiele procesorów.