Najnowszy ranking pięciuset najszybszych komputerów świata - TOP500 - zdominowany został przez Chińczyków, którzy pokonali Amerykanów - dotychczasowych liderów - w ilości komputerów na liście. Dodatkowo dwie najszybsze maszyny na świecie znajdują się właśnie w Państwie Środka. Jednakże amerykański przemysł - firmy takie jak IBM, Intel czy Advanced Micro Devices (AMD) planują wzmóc starania, by pozwolić Stanom Zjednoczonym wrócić na szczyt listy TOP500.
Plany tych firm są bardzo nowatorskie. Nie chcą one celować tylko w algorytm wykorzystywany do testowania komputerów z list TOP500, opierających się na benchmarku Linpack z rozproszoną pamięcią (Hight Performance Linpack). Bardziej zależy im jednak na konkurowaniu (i wygraniu) z Chińczykami w sektorze tak zwanego przetwarzania eksaskalowego.
Chiny nie tylko zajęły pierwsze i drugie miejsce na tegorocznej liście TOP500, jaka ogłoszona została w listopadzie tego roku. Komputerom z tego kraju udało się także zdobyć najwięcej pozycji na liście TOP500. Lista ta prowadzona jest od czerwca 1993 roku.
Zgodnie z tym, co podają opiekunowie TOP500, to rekordowo niski udział Amerykanów na liście - jedynie 143 komputery z rankingu są z USA. Jeszcze miesiąc temu było to 169 sztuk. Spadek liczby komputerów wynika głównie z starania się Chińczyków - w kraju tym powstaje coraz więcej superszybkich maszyn. W tym miesiącu to 202 komputery - kolejny rekord, po równie udanym 160 w zeszłym miesiącu. Widoczny jest ogromny wzrost liczby superkomputerów w Chinach. Już teraz maszyny z tego kraju stanową 35,4% listy pięciuset najpotężniejszych komputerów na świecie. Dla USA odsetek ten wynosi jedyne 29,6%.
"Krajobraz w świecie najmocniejszych komputerów ewoluuje z ogromną prędkością. Niektórzy mówią o przejściu przez punkt przegięcia tej trajektorii" - mówi Dave Turek, wicedyrektor działu IBMa odpowiedzialnego za superkomputery i architekturę OpenPOWER - "Jeśli teraz nagle zdamy sobie sprawę, że potrzeby tego sektora mogą być spełnione z wykorzystaniem otwartych narzędzi, to nie ma co się dziwić działaniom IBMa w ramach fundacji OpenPOWER, której członkami są także firmy takie jak Google, Mellanox czyu Nvidia. Fundacja ta skupia się na tworzeniu nowej generacji procesorów o architekturze POWER".
IBM rozwija obecnie krzemową implementację procesora Power9 (na zdjęciu). W pojedynczym układzie znaleźć się ma do 24 rdzeni - 8 miliardów tranzystorów wykonanych w technologii FinFET w technologii 14 nm CMOS. W układzie zintegrowane jest 120 megabajtów pamięci cache trzeciego poziomu. Procesory te wspierają do ośmiu wątków naraz. Połączenie z pamięcią charakteryzuje się pasmem do 230 GB na sekundę. Architektura układu będzie niebawem prezentowana w laboratoriach Lawrenca Livermora jak i w Oak Ridge. Procesor ten ma posiadać dodatkowo zintegrowane rdzenie GPU Nvidia Volta - nawet kilka tysięcy sztuk. Dzięki temu będzie mógł bez problemu pokonać chińskie CPU Sunway.
Firma IBM zamierza, przede wszystkim, wykorzystać swoje skoncentrowane na danych podejście do przetwarzania w tej skali. Firma uważa, że jeśli chodzi o architekturę superkomputerów, najważniejsze jest wbudowanie procesorów tam, gdzie są najbardziej potrzebne, czyli tam, gdzie znajdują się dane. Jak mówi Turek, podejście to pozwala na przyspieszenie przetwarzania danych od 5 do 10 razy w najbardziej wymagających aplikacjach - analityce, modelowaniu, wizualizacji, symulacji czy systemach sztucznej inteligencji, zwłaszcza głębokiego uczenia maszynowego.
Żeby spełnić wymagania systemów sztucznej inteligencji, IBM przeprojektował architekturę swojego układu Power9, zmieniając sposób przepływu danych w układzie tak, aby wykorzystać ogromną ilość zintegrowanych rdzeni GPU czy Nervana. Dzięki przeskalowaniu algorytmów TensorFlow i Caffe na 256 układów GPU Nvida Tesla, możliwe było zmniejszenie czasu obliczeń z 16 dni do 7 godzin. Firma planuje dalej korzystać z tej strategii - do 2021 roku możliwe ma być przeskalowanie tych algorytmów na nawet 100 razy więcej rdzeni GPU, rozproszonych na ponad 50 tysiącach maszyn. Doprowadzić ma to do poziomu przetwarzania eksaskalowego - możliwości realizacji miliarda miliardów operacji na sekundę.
"Power9 jest wypełniony po brzegi najnowszymi technologiami dostosowanymi do rozwoju systemów sztucznej inteligencji" - mówi Brad McCredie z IBMa. Jest on wicedyrektorem działu systemów kognitywnych w tej spółce - "Wykorzystując nowe układy Power9, przechodzimy do nowej ery, gdzie większość obciążenia - także przetwarzanie na potrzebę AI - przejmują układy takie jak GPU czy FPGA".
Nowa, komercyjna platforma
MrCredi twierdzi, że układy Power9 niebawem stworzą podstawę komercyjnych platform z bardzo szerokim pasmem połączenia z układami GPU poprzez interfejs OpenCAPI. Interkonekt ten ma także pozwolić ma na koherentne połączenie układów programowalnych do superkomputerów. Sprawi to, że dotychczasowo wykorzystywane algorytmy - takie jak Linpack - staną się mało miarodajne, jeśli chodzi o testowanie superkomputerów. Są one dedykowane do pomiaru wydajności maszyn mających zaledwie miliony procesorów. Wykorzystanie FPGA połączonych poprzez OpenCAPI może istotnie zmienić tą liczbę. Zamiast tego proponowane są różne algorytmy kognitywne, które będą miały charakteryzować prędkość komputerów wykorzystując do tego algorytmy uczenia maszynowego. Jak uważa firma IBM, dopiero wtedy Power9 pokaże swoją potęgę. Tworzona architektura Power9 doskonale wypadnie, jeśli do testowania wykorzysta się algorytmy rozproszonego głębokiego uczenia maszynowego (DDL).
Intel ma podobne zdanie jak wyżej. Jeśli chodzi o architekturę, jak mówi Trish Damkroger, zwiększanie liczby procesorów w układach Xeon Phi to za mało. Damkroeger jest wicedyrektorem w dziale Intela zajmującym się systemami dla Data Center. Firma porzuca proponowaną wcześniej platformę Knights Hill na rzecz "nowej platformy o nowej mikroarchitekturze, zoptymalizowanej pod kątem przetwarzania eksaskalowego" - opowiada Damkroeger - "Jeśli połączymy to z naszym szerokim portfolio rozwiązań HPC, od samych jednostek przetwarzających poprzez magazyny danych, systemy I/O oraz oprogramowanie i zaktualizowany plan rozwoju, to bez problemu spowodujemy rewolucję w zakresie przetwarzania w eksaskali".
Intel obecnie skupia się na rozszerzeniu swojej architektury SSF - Skalowalnych Systemowych Frameworków oraz połączeniu jej z opracowywanymi przez siebie nowymi akceleratorami, które są stanowczo wydajniejsze niż stosowane obecnie macierze CPU. Intel także dywersyfikuje rozwiązania, jakie implementuje w układach - pojawiają się tam bloki takie jak układy FPGA czy superszybkie interfejsy do pamięci 3D. Dzięki oferowaniu rozwiązań dedykowanych dla sektorów takich jak Big Data, uczenie maszynowe czy AI, firma ma zamiar zrewolucjonizować krajobraz rankingu TOP500, który póki co zorientowany jest na równolegle pracujące CPU testowane algorytmem Linpack.
Jak planuje Intel, ich eksperymentalna maszyna, jaka powstać ma w Narodowym laboratorium Coral w Argonne, ma być pierwszym systemem eksaskalowym. System ten powstaje we współpracy z Livermore Labs i centrami badawczymi w Oak Ridge oraz Argonne.
Podobnie jak Intel, jego największy konkurent - firma AMD - także planuje szereg rewolucji w segmencie przetwarzania eksaskalowego. Najnowszy procesor tego producenta - Epyc - wykorzystuje nowy rodzaj interkonektów Infinity oraz procesory GPU Radeon Instinct. Procesor Epyc posiada nowy, zoptymalizowany system przetwarzania liczb zmiennoprzecinkowych. Intel z kolei skupił się na optymalizacji przetwarzania wektorów.
AMD nie będzie budowało komputera samodzielnie. Do współpracy stworzony został zespół, do którego zaproszono firmy, takie jak Hewlett Packard Enterprise, Supermicro, Penguin Computing, Tyan, ASUS, Gigabyte Technology, BOXX, EchoStreams oraz and Dell, który zamierza dodać procesory Epyc jako jedną z opcji do swoich serwerów PowerEdge.
AMD współpracuje także z Inventec nad superkomputerem pod kryptonimem "Project 47". Ma w nim zostać zintegrowane cztery razy tyle jednostek GPU Radeon Instinct co procesorów Epuc. Ma zostać dostarczony w pierwszym kwartale przyszłego roku. I żeby tradycji stało się zadość - rozwiązanie AMD będzie tańsze niż systemy Intela czy IBMa.
Źródło: https://www.eetimes.com/document.asp?doc_id=1332663&
Plany tych firm są bardzo nowatorskie. Nie chcą one celować tylko w algorytm wykorzystywany do testowania komputerów z list TOP500, opierających się na benchmarku Linpack z rozproszoną pamięcią (Hight Performance Linpack). Bardziej zależy im jednak na konkurowaniu (i wygraniu) z Chińczykami w sektorze tak zwanego przetwarzania eksaskalowego.
Chiny nie tylko zajęły pierwsze i drugie miejsce na tegorocznej liście TOP500, jaka ogłoszona została w listopadzie tego roku. Komputerom z tego kraju udało się także zdobyć najwięcej pozycji na liście TOP500. Lista ta prowadzona jest od czerwca 1993 roku.
Zgodnie z tym, co podają opiekunowie TOP500, to rekordowo niski udział Amerykanów na liście - jedynie 143 komputery z rankingu są z USA. Jeszcze miesiąc temu było to 169 sztuk. Spadek liczby komputerów wynika głównie z starania się Chińczyków - w kraju tym powstaje coraz więcej superszybkich maszyn. W tym miesiącu to 202 komputery - kolejny rekord, po równie udanym 160 w zeszłym miesiącu. Widoczny jest ogromny wzrost liczby superkomputerów w Chinach. Już teraz maszyny z tego kraju stanową 35,4% listy pięciuset najpotężniejszych komputerów na świecie. Dla USA odsetek ten wynosi jedyne 29,6%.
"Krajobraz w świecie najmocniejszych komputerów ewoluuje z ogromną prędkością. Niektórzy mówią o przejściu przez punkt przegięcia tej trajektorii" - mówi Dave Turek, wicedyrektor działu IBMa odpowiedzialnego za superkomputery i architekturę OpenPOWER - "Jeśli teraz nagle zdamy sobie sprawę, że potrzeby tego sektora mogą być spełnione z wykorzystaniem otwartych narzędzi, to nie ma co się dziwić działaniom IBMa w ramach fundacji OpenPOWER, której członkami są także firmy takie jak Google, Mellanox czyu Nvidia. Fundacja ta skupia się na tworzeniu nowej generacji procesorów o architekturze POWER".
IBM rozwija obecnie krzemową implementację procesora Power9 (na zdjęciu). W pojedynczym układzie znaleźć się ma do 24 rdzeni - 8 miliardów tranzystorów wykonanych w technologii FinFET w technologii 14 nm CMOS. W układzie zintegrowane jest 120 megabajtów pamięci cache trzeciego poziomu. Procesory te wspierają do ośmiu wątków naraz. Połączenie z pamięcią charakteryzuje się pasmem do 230 GB na sekundę. Architektura układu będzie niebawem prezentowana w laboratoriach Lawrenca Livermora jak i w Oak Ridge. Procesor ten ma posiadać dodatkowo zintegrowane rdzenie GPU Nvidia Volta - nawet kilka tysięcy sztuk. Dzięki temu będzie mógł bez problemu pokonać chińskie CPU Sunway.
Firma IBM zamierza, przede wszystkim, wykorzystać swoje skoncentrowane na danych podejście do przetwarzania w tej skali. Firma uważa, że jeśli chodzi o architekturę superkomputerów, najważniejsze jest wbudowanie procesorów tam, gdzie są najbardziej potrzebne, czyli tam, gdzie znajdują się dane. Jak mówi Turek, podejście to pozwala na przyspieszenie przetwarzania danych od 5 do 10 razy w najbardziej wymagających aplikacjach - analityce, modelowaniu, wizualizacji, symulacji czy systemach sztucznej inteligencji, zwłaszcza głębokiego uczenia maszynowego.
Żeby spełnić wymagania systemów sztucznej inteligencji, IBM przeprojektował architekturę swojego układu Power9, zmieniając sposób przepływu danych w układzie tak, aby wykorzystać ogromną ilość zintegrowanych rdzeni GPU czy Nervana. Dzięki przeskalowaniu algorytmów TensorFlow i Caffe na 256 układów GPU Nvida Tesla, możliwe było zmniejszenie czasu obliczeń z 16 dni do 7 godzin. Firma planuje dalej korzystać z tej strategii - do 2021 roku możliwe ma być przeskalowanie tych algorytmów na nawet 100 razy więcej rdzeni GPU, rozproszonych na ponad 50 tysiącach maszyn. Doprowadzić ma to do poziomu przetwarzania eksaskalowego - możliwości realizacji miliarda miliardów operacji na sekundę.
"Power9 jest wypełniony po brzegi najnowszymi technologiami dostosowanymi do rozwoju systemów sztucznej inteligencji" - mówi Brad McCredie z IBMa. Jest on wicedyrektorem działu systemów kognitywnych w tej spółce - "Wykorzystując nowe układy Power9, przechodzimy do nowej ery, gdzie większość obciążenia - także przetwarzanie na potrzebę AI - przejmują układy takie jak GPU czy FPGA".
Nowa, komercyjna platforma
MrCredi twierdzi, że układy Power9 niebawem stworzą podstawę komercyjnych platform z bardzo szerokim pasmem połączenia z układami GPU poprzez interfejs OpenCAPI. Interkonekt ten ma także pozwolić ma na koherentne połączenie układów programowalnych do superkomputerów. Sprawi to, że dotychczasowo wykorzystywane algorytmy - takie jak Linpack - staną się mało miarodajne, jeśli chodzi o testowanie superkomputerów. Są one dedykowane do pomiaru wydajności maszyn mających zaledwie miliony procesorów. Wykorzystanie FPGA połączonych poprzez OpenCAPI może istotnie zmienić tą liczbę. Zamiast tego proponowane są różne algorytmy kognitywne, które będą miały charakteryzować prędkość komputerów wykorzystując do tego algorytmy uczenia maszynowego. Jak uważa firma IBM, dopiero wtedy Power9 pokaże swoją potęgę. Tworzona architektura Power9 doskonale wypadnie, jeśli do testowania wykorzysta się algorytmy rozproszonego głębokiego uczenia maszynowego (DDL).
Intel ma podobne zdanie jak wyżej. Jeśli chodzi o architekturę, jak mówi Trish Damkroger, zwiększanie liczby procesorów w układach Xeon Phi to za mało. Damkroeger jest wicedyrektorem w dziale Intela zajmującym się systemami dla Data Center. Firma porzuca proponowaną wcześniej platformę Knights Hill na rzecz "nowej platformy o nowej mikroarchitekturze, zoptymalizowanej pod kątem przetwarzania eksaskalowego" - opowiada Damkroeger - "Jeśli połączymy to z naszym szerokim portfolio rozwiązań HPC, od samych jednostek przetwarzających poprzez magazyny danych, systemy I/O oraz oprogramowanie i zaktualizowany plan rozwoju, to bez problemu spowodujemy rewolucję w zakresie przetwarzania w eksaskali".
Intel obecnie skupia się na rozszerzeniu swojej architektury SSF - Skalowalnych Systemowych Frameworków oraz połączeniu jej z opracowywanymi przez siebie nowymi akceleratorami, które są stanowczo wydajniejsze niż stosowane obecnie macierze CPU. Intel także dywersyfikuje rozwiązania, jakie implementuje w układach - pojawiają się tam bloki takie jak układy FPGA czy superszybkie interfejsy do pamięci 3D. Dzięki oferowaniu rozwiązań dedykowanych dla sektorów takich jak Big Data, uczenie maszynowe czy AI, firma ma zamiar zrewolucjonizować krajobraz rankingu TOP500, który póki co zorientowany jest na równolegle pracujące CPU testowane algorytmem Linpack.
Jak planuje Intel, ich eksperymentalna maszyna, jaka powstać ma w Narodowym laboratorium Coral w Argonne, ma być pierwszym systemem eksaskalowym. System ten powstaje we współpracy z Livermore Labs i centrami badawczymi w Oak Ridge oraz Argonne.
Podobnie jak Intel, jego największy konkurent - firma AMD - także planuje szereg rewolucji w segmencie przetwarzania eksaskalowego. Najnowszy procesor tego producenta - Epyc - wykorzystuje nowy rodzaj interkonektów Infinity oraz procesory GPU Radeon Instinct. Procesor Epyc posiada nowy, zoptymalizowany system przetwarzania liczb zmiennoprzecinkowych. Intel z kolei skupił się na optymalizacji przetwarzania wektorów.
AMD nie będzie budowało komputera samodzielnie. Do współpracy stworzony został zespół, do którego zaproszono firmy, takie jak Hewlett Packard Enterprise, Supermicro, Penguin Computing, Tyan, ASUS, Gigabyte Technology, BOXX, EchoStreams oraz and Dell, który zamierza dodać procesory Epyc jako jedną z opcji do swoich serwerów PowerEdge.
AMD współpracuje także z Inventec nad superkomputerem pod kryptonimem "Project 47". Ma w nim zostać zintegrowane cztery razy tyle jednostek GPU Radeon Instinct co procesorów Epuc. Ma zostać dostarczony w pierwszym kwartale przyszłego roku. I żeby tradycji stało się zadość - rozwiązanie AMD będzie tańsze niż systemy Intela czy IBMa.
Źródło: https://www.eetimes.com/document.asp?doc_id=1332663&
Fajne? Ranking DIY