REKLAMA

Adblock/uBlockOrigin/AdGuard mogą powodować znikanie niektórych postów z powodu nowej reguły.

Nowe modele AI fundamentem krzemowych celów firmy SambaNova

ghost666 10 Lis 2022 03:05 525 1

REKLAMA

Zgłoś naruszenie prawa

Odpowiedz Fajne? Ranking DIY | Nowy temat

Powiadamiaj o nowych artykułach

Obserwuj nas

Autor tematu Pomocny post? (0)

Post #1
20277231 10 Lis 2022 03:05

Podczas AI Hardware Summit w Santa Clara w Kalifornii dyrektorzy firmy SambaNova Systems przedstawili nowy układ i rozmawiali o dążeniu do obsługi jednostek podstawowych, czyli modeli dużego języka, które można dostosować do wielu zadań. Do kontroli kolejnej odsłony systemów SambaNova do montażu w szafie serwerowej przeznaczona ma być druga generacja zoptymalizowanego pod kątem przepływu danych modułu RDU, opracowanego przez markę. Cardinal SN30 RDU ma większą matrycę obliczeniową, z 86 miliardami tranzystorów na chiplecie, produkowanym w tym samym 7-nanometrowym węźle procesowym TSMC. Ilość pamięci na chipie podwoiła się do 640 MB. Rezultatem jest procesor osiągający 688 TFLOPS dla zmiennych BF16, dostosowany do obsługi dużych modeli. Obudowa zawiera dwa chiplety obliczeniowe i 1 TB bezpośrednio dołączanej pamięci DDR (ale nie HBM). Efektem jest nawet sześciokrotny wzrost wydajności względem systemów pierwszej generacji.

Urządzenie będzie znajdować się w nowej serii serwerów SambaNova DataScale wykorzystywanych na potrzeby szkolenia systemów AI, do wnioskowania i dostrajania układów uczenia maszynowego, dostarczanych jako systemy gotowe do montażu w szafie rack. Na targach Kunle Olukotun, CTO i współzałożyciel firmy SambaNova zaprezentował zabójczą aplikację dla systemów nowej generacji: tzw. modele fundamentowe. „Wchodzimy w nową erę sztucznej inteligencji, którą umożliwiają modele podstawowe” — powiedział. Termin: „modele fundamentowe” został ukuty w Stanford Center for Research on Foundation Models. Odnosi się do specjalnego typu dużego modelu języka. Jeśli podstawowy jest trenowany na wystarczająco zróżnicowanych danych w zadowalająco dużych ilościach, można go dostosować do wykonywania wielu zadań opartych na języku, być może obejmujących ujęcia tak różnorodne, jak odpowiadanie na pytania, podsumowywanie czy analiza sentymentu. „To całkowicie wysadza tradycyjną, zorientowaną na wytyczne, jednostkę uczenia maszynowego używaną do tej pory, w której każde ujęcie miało określony model, przeszkolony w tym celu” — oznajmił Olukotun. „Dzięki modelom podstawowym możesz wziąć pojedynczy i przystosować go do konkretnej instrukcji, [pozwalając] zastąpić tysiące indywidualnych, specyficznych dla zadania, jedną jednostką. Oznacza to, że zarządzanie jest łatwiejsze i możesz sprawniej przekształcić swoje możliwości sztucznej inteligencji dopasowane do nowych ujęć, które się pojawią”.

Technika zwana uczeniem kontekstowym oznacza,
że modele podstawowe mogą być używane do obsługi różnych zagadnień
za pomocą tej samej jednostki.

Skala modeli fundamentowych, które na ogół przekraczają 10 miliardów parametrów, stanowi wyzwanie dla firm chcących z nich korzystać. „Bardzo trudno jest faktycznie zagregować zasoby sprzętowe i prawidłowo skonfigurować oprogramowanie oraz zdobyć wiedzę na temat uczenia maszynowego, aby właściwie wyszkolić, a następnie wdrożyć [tak duży model — przyp. red.] i utrzymać, przeprowadzić szkolenie i wnioskować oraz stale zarządzać tymi jednostkami” — wskazał Rodrigo Liang, współzałożyciel i dyrektor generalny SambaNova.

Przy dzisiejszej technologii, uczenie modeli fundamentowych od podstaw może zająć miesiące. Jednak firma SambaNova zamierza skrócić ten proces, dostarczając wstępnie wytrenowane jednostki wraz ze swoim sprzętem. Ten umożliwia dostrajanie tych modeli na ich własnych prywatnych danych w celu zwiększenia dokładności realizacji konkretnego zadania, do którego klient będzie wykorzystywał te jednostki. Ogólnie mówiąc, SambaNova posiada dwie oferty. Pierwszą z nich jest infrastruktura DataScale — szafy serwerowe zaopatrzone w urządzenia SambaNova oraz kompletny stos oprogramowania. Jest to odpowiednie dla organizacji zorientowanych na model, w tym rynków kapitałowych, farmacji i klientów HPC. Drugi to pakiet Dataflow-as-a-Service — te same szafy serwerowe i oprogramowanie, ale także dodatkowo przeszkolone modele podstawowe, które klienci mogą dostosowywać i wdrażać na tym sprzęcie. Jest to oferta dla firm zorientowanych na dane, które nie chcą tracić czasu i wysiłku na budowanie i utrzymywanie własnych modeli czy zaplecza on-premise. SambaNova utrzymuje te jednostki w imieniu klienta, ale po dopracowaniu całość jest unikalna dla tego ujęcia.

Systemy SambaNova są już zainstalowane w Lawrence Livermore National Laboratory (LLNL), a laboratorium ogłosiło, że przejdzie na następną generację układów. „Z niecierpliwością czekamy na wdrożenie większego, wielorackowego mechanizmu nowej generacji DataScale SambaNova” — powiedział Bronis de Supinski, CTO w Livermore Computing w LLNL. „Integracja tego rozwiązania z tradycyjnymi klastrami w całym naszym centrum umożliwi technologii głębsze oddziaływanie programistyczne. Przewidujemy wzrost wydajności od 2 do 6 razy, ponieważ nowy system DataScale obiecuje znacznie poprawić ogólną szybkość, efektywność i produktywność”. Argonne National Labs również wdraża mechanizm multirackowy oparty na systemie SambaNova nowej generacji na stanowisku testowym AI ALCF, gdzie można go wypróbować pod kątem różnych zastosowań.

Źródło: https://www.eetimes.com/sambanovas-new-silicon-targets-foundation-models/

Fajne? Ranking DIY
O autorze
ghost666 ghost666

Tłumacz Redaktor
Offline

Dołączył: 10 Cze 2003

Posty: 11961

Pomógł: 157

Ocena postów: 10261

Punkty: 139496
Fizyk z wykształcenia. Po zrobieniu doktoratu i dwóch latach pracy na uczelni, przeszedł do sektora prywatnego, gdzie zajmuje się projektowaniem urządzeń elektronicznych i programowaniem. Od 2003 roku na forum Elektroda.pl, od 2008 roku członek zespołu redakcyjnego.
https://twitter.com/Moonstreet_Labs
ghost666 napisał 11961 postów o ocenie 10261, pomógł 157 razy. Mieszka w mieście Warszawa. Jest z nami od 2003 roku.

Promuję tematy:
05.08.2024 Jakie strategie przyciągania talentów do branży półprzewodnikowej są skuteczne w 2024 roku?
02.08.2024 Microchip prezentuje nowe układy PIC64 dla aplikacji wbudowanych i kosmicznych
30.07.2024 Tenstorrent Quiet Box: Nowa stacja robocza AI dla deweloperów
27.07.2024 Impulsowa depozycja laserowa (PLD) w masowej produkcji półprzewodników
25.07.2024 Te podstępne diody i ich wpływ na działanie układów analogowych
REKLAMA
#2 20277867 10 Lis 2022 15:47

czareqpl czareqpl

Poziom 33

Posty: 1955

Pomógł: 196

Ocena: 579
Pomocny post? (0)

Post #2
20277867 10 Lis 2022 15:47

Jak za 4 lata przyjdzie ktoś, kto to wszystko przepisze z Ruby/Pythona na Asembler dla tego TPU, to wtedy zobaczą co to jest szybko wykonywany kod

Promuję tematy:
16.11.2017 Urządzenie do pomiaru sprawności przetwornic DC/DC oraz pomiaru warunków
01.09.2017 Inżynierski dobór filtrowania w torach zasilania
29.08.2017 Moduł Ethernet do instalacji inteligentnego budynku ATMega32 &ENC28J60
29.08.2017 Telefon własnej roboty oparty na STM32, FT811 oraz Raspberry Pi
Zarejestruj konto, Zaloguj się i bądź aktywny na forum, a wtedy reklamy nie będą się pojawiać. Dołącz do dyskusji i otrzymaj punkty za rejestrację oraz odpowiedzi.

Zainstaluj aplikację Elektroda

Odpowiedz Fajne? Ranking DIY | Nowy temat

Powiadamiaj o nowych artykułach

Obserwuj nas

Zgłoś naruszenie prawa

Strona Główna
/
Forum
/
Artykuły
/
Newsy
/
Nowe modele AI fundamentem krzemowych celów firmy SambaNova

Wnętrze wielkiego telewizora UE55MU6452U, analiza, dekodowanie i symulacja flash za środka
05 Maj 2026 11:02 (5)
Zastanawialiście się kiedyś, co siedzi w pamięci Flash ze współczesnego telewizora? Zapraszam na krótką prezentację wnętrza telewizora Samsung UE55MU6452U 55” 4K UHD Smart TV połączoną z inżynierią wsteczną i emulacją firmware kontrolera T-Con. Pokażę tutaj, jak zbudowany jest taki telewizor, jak zrealizowane jest jego podświetlenie i jakie elementy można odzyskać ze środka. Na koniec spróbuję też... [Czytaj dalej]
Mostek, kondensator, moc bierna.
03 Maj 2026 21:11 (15)
W związku z tym tematem Eksperyment - rejestracja THD napięcia sieciowego zbudowałem układ składający się z mostka, kondensatora 220uF, żarówki 150W i bocznika do pomiaru prądu. Watomierz wtykany do gniazdka, pokazał napięcie 237V, prąd 1.74Arms, moc pozorną 414VA, moc czynną 234W i Power Faktor 0.57. Niestety nie mierzy mocy biernej. Wykres na oscyloskopie wyglądał tak. Żółty napięcie, niebieski prąd.... [Czytaj dalej]
Usprawnienie odbiornika Unitra Diora Śnieżka R-206
03 Maj 2026 13:41 (22)
Geneza pomysłu Pewnego dnia uratowałem ze śmietnika radioodbiornik Unitra Śnieżka R 206. O dziwo, po podłączeniu do sieci od razu zagrał, a dodatkowo okazał się być przestrojony! Choć nie mam wielkiego sentymentu do Unitry, ten klasyk spodobał się mojej narzeczonej, więc został w salonie na stałe. Mieszkam w Krakowie, gdzie stacje są rozmieszczone dość gęsto. Moje ulubione stacje nadają blisko siebie... [Czytaj dalej]
Dwa malutkie UPS dla routera, kamery lub Raspberry Pi - test pojemności
02 Maj 2026 10:53 (3)
Dziś testuję dwa małe urządzenia zdolne do tymczasowego podtrzymania zasilania odbiornika 5 lub 12 V w obliczu niespodziewanego zaniku energii. Pierwsze z nich to charakterystyczne czarne pudełeczko wpinane w przewód USB, operujące siłą rzeczy tylko na napięciu 5 V. Drugie jest nieco większe, rozmiarem przypomina sam router, pracuje na napięciu 12 V i ma wyjścia 5, 9 i 12 V. Zacznijmy od pierwszego... [Czytaj dalej]
Jedna ładowarka dla wszystkich. Od 28 kwietnia USB-C obowiązkowe także w laptopach w UE
30 Kwi 2026 15:41 (66)
28 kwietnia 2026 r. zaczyna obowiązywać kolejny etap unijnych przepisów dotyczących wspólnej ładowarki do urządzeń elektronicznych. Wynika to z dyrektywy Dyrektywa (UE) 2022/2380, która zmienia regulacje dotyczące urządzeń radiowych sprzedawanych w Unii Europejskiej. Od tej daty wszystkie nowe laptopy wprowadzane na rynek UE muszą obsługiwać ładowanie przez port USB-C. W praktyce oznacza to, że producenci... [Czytaj dalej]

REKLAMA