REKLAMA

Adblock/uBlockOrigin/AdGuard mogą powodować znikanie niektórych postów z powodu nowej reguły.

Nowe potężne otwarte AI - DeepSeek-V4 (preview) - 1.6T parametrów i 1M tokenów kontekstu

p.kaczmarek2 24 Kwi 2026 17:30 309 2

TL;DR

DeepSeek opublikował preview DeepSeek‑V4 z dwoma modelami: DeepSeek‑V4‑Pro i DeepSeek‑V4‑Flash.
DeepSeek‑V4‑Pro używa architektury Mixture of Experts i celuje w rozumowanie, analizę oraz programowanie, a Flash ma być szybszą i tańszą wersją produkcyjną.
V4‑Pro ma 1.6 biliona parametrów całkowitych, około 49 miliardów aktywnych i kontekst do 1 miliona tokenów.
W benchmarkach V4‑Pro‑Max zbliża się do Claude‑Opus‑4.6‑Max, GPT‑5.4‑xHigh i Gemini‑3.1‑Pro‑High, a jako jedyny z tej grupy udostępnia wagi do pobrania.
Modele są dostępne przez API DeepSeek, poprzednie chat i reasoner mają zostać wycofane 24 lipca 2026, a część komentujących wciąż kwestionuje praktyczność 1M tokenów.

Wygenerowane przez model językowy.

REKLAMA

Zgłoś naruszenie prawa

Odpowiedz Fajne? Ranking DIY | Nowy temat

Powiadamiaj o nowych artykułach

Obserwuj nas

📢 Słuchaj (AI):

Autor tematu Pomocny post? (0)

Post #1
21890075 24 Kwi 2026 17:30

DeepSeek opublikował wersję preview nowej generacji modelu językowego AI DeepSeek‑V4. Premiera odbyła się 24 kwietnia 2026 razem z raportem technicznym i wagami modelu udostępnionymi na Hugging Face. Nowa seria zawiera dwa modele: DeepSeek-V4-Pro ma architekturę Mixture of Experts z 1.6 biliona parametrów całkowitych oraz około 49 miliardów parametrów aktywnych podczas inferencji. Model obsługuje kontekst do 1 miliona tokenów i jest przeznaczony głównie do zadań rozumowania, analizy oraz programowania. Drugi model to DeepSeek-V4-Flash. Posiada 284 miliardy parametrów całkowitych i około 13 miliardów aktywnych. Został zaprojektowany jako tańsza i szybsza wersja do zastosowań produkcyjnych oraz agentów AI. Modele są dostępne przez API DeepSeek, a poprzednie modele chat i reasoner mają zostać wycofane 24 lipca 2026. DeepSeek-V4-Pro-Max osiąga w benchmarkach rezultaty zbliżone doClaude-Opus-4.6-Max, GPT-5.4-xHigh i Gemini-3.1-Pro-High, ale jako jedyny z tych modeli udostępnia do pobrania wagi.

Źródła:
https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf
https://api-docs.deepseek.com/news/news260424
https://huggingface.co/collections/deepseek-ai/deepseek-v4

Co myślą o tym użytkownicy?
Podsumowanie komentarzy z HackerNews:
- odbiór premiery DeepSeek‑V4 jest dość pozytywny. Komentujący uważają, że to jeden z najmocniejszych modeli z otwartymi wagami i kolejny krok w zmniejszaniu przewagi modeli zamkniętych.
- benchmarki wyglądają dobrze, ale część osób uważa, że model nadal jest trochę za topowymi systemami jak Claude Opus czy Gemini w trudniejszych zadaniach reasoning.
- dużo pozytywnych opinii dotyczy programowania. Według wielu komentarzy model wypada bardzo dobrze w coding tasks i może być bardzo użyteczny dla narzędzi developerskich.
- największe zainteresowanie budzi kontekst 1M tokenów. Część użytkowników zastanawia się, na ile jest to praktyczne w realnych zastosowaniach.
- pojawia się sporo dyskusji o sprzęcie i niezależności technologicznej. Niektórzy komentują, że modele DeepSeek są częścią budowy chińskiego stacku AI niezależnego od Nvidii.
- kilku użytkowników zauważa trend upowszechniania modeli LLM. Różnice jakości zaczynają być mniejsze, więc przewagę mogą dawać raczej narzędzia, workflow i integracje niż sam model.

Czy DeepSeek 4 znajdzie swoje miejsce pośród zamkniętych modeli? Zapraszam do dyskusji.

Fajne? Ranking DIY
Pomogłem? Kup mi kawę.
O autorze
p.kaczmarek2 p.kaczmarek2

Moderator Smart Home
Offline

Dołączył: 26 Gru 2014

Posty: 14421

Pomógł: 650

Ocena postów: 12379

Punkty: 141328
Inżynier programista z wieloletnim doświadczeniem embedded i full stack developer.
Specjalizuje się w: embedded, Full-Stack Developer
p.kaczmarek2 napisał 14421 postów o ocenie 12379, pomógł 650 razy. Jest z nami od 2014 roku.

Promuję tematy:
09.05.2026 Wnętrze polskiego retro zasilacza Polwat PWS-100 RM 24V/4A - czy przetrwał lata pracy?
08.05.2026 Jak bardzo nagrzewa się lampa sufitowa 24 W Tuya? Test, wnętrze oraz zmiana firmware
07.05.2026 Ile jest radia w radiu? Zestaw do samodzielnego montażu FM 87-108 MHz RDA5807S
05.05.2026 Wnętrze wielkiego telewizora UE55MU6452U, analiza, dekodowanie i symulacja flash za środka
03.05.2026 Jaki bezgłośny sterownik oświetlenia na Zigbee? Dwukanałowy LZWSM16-2 bez przewodu neutralnego
REKLAMA
#2 21890415 25 Kwi 2026 07:46

gulson gulson

Administrator Systemowy

Posty: 29240

Pomógł: 148

Ocena: 5985
Pomocny post? (0)

Post #2
21890415 25 Kwi 2026 07:46

Pierwsza wersja Deepseek wywołała spadki na giełdzie amerykańskiej. Ta przeszła bez większego echa. Jest zadowolenie, że otwarte, chińskie modele nie zagrożą w żaden sposób amerykańskim. To by spowodowało, że miliardy na inwestycje nigdy by się nie zwróciły.
W testach Deepseek rzeczywiście jest za modelami Opus czy GPT 5.5, ale też dużo nie odbiega.

Zabawa trwa.

Promuję tematy:
21.04.2026 ChatGPT Images 2.0 - potrafi tworzyć nawet całe czasopisma
19.02.2026 OpenClaw w robotyce czyli czas autonomicznych robotów - wizja przyszłości SkyNetu w formie felietonu
19.02.2026 Humanoidalne roboty z okazji Nowego Roku Chińskiego a niepokój o przyszłość.
13.02.2026 GPT-5.3 Codex i Opus 4.6 – wpływ nowych modeli AI na rynek pracy i automatyzację
03.02.2026 Gdzie rynek pracy IT naprawdę potrzebuje ludzi w 2026 roku? Analiza ofert pracy z Hacker News
#3 21890421 25 Kwi 2026 08:05

p.kaczmarek2 p.kaczmarek2

Moderator Smart Home

Posty: 14421

Pomógł: 650

Ocena: 12379
Autor tematu Pomocny post? (0)

Post #3
21890421 25 Kwi 2026 08:05

W ciągu ostatnic 37 dni, wydano 12 modeli AI:

Tworzę pierwsze na świecie oprogramowanie open source przeznaczone dla platform BK7231, XR809, BL602, W600, W800, LN882H, ECR, TRS, RTL, jak również ESP8266 i ESP32 używanych w różnych urządzeniach IoT, pozwalające uwolnić je od serwerów producenta, od śledzenia, dowolnie modyfikować i sparować z Home Assistant.
Dodatkowo publikuję różnorodne materiały, często tutoriale i praktyczne demonstracje.
Jeśli podoba Ci się moja twórczość i w czymś Ci pomogłem, to rozważ wsparcie mnie tutaj: https://www.paypal.com/paypalme/openshwprojects
Mój Github: https://github.com/openshwprojects
Mój tutorial PIC18F SDCC: https://www.elektroda.pl/rtvforum/topic3635522.html
Pracuję na stacji hot air SUGON 8630 Pro od Katemedia

Pomogłem? Kup mi kawę.

Promuję tematy:
09.05.2026 Wnętrze polskiego retro zasilacza Polwat PWS-100 RM 24V/4A - czy przetrwał lata pracy?
08.05.2026 Jak bardzo nagrzewa się lampa sufitowa 24 W Tuya? Test, wnętrze oraz zmiana firmware
07.05.2026 Ile jest radia w radiu? Zestaw do samodzielnego montażu FM 87-108 MHz RDA5807S
05.05.2026 Wnętrze wielkiego telewizora UE55MU6452U, analiza, dekodowanie i symulacja flash za środka
03.05.2026 Jaki bezgłośny sterownik oświetlenia na Zigbee? Dwukanałowy LZWSM16-2 bez przewodu neutralnego
Zarejestruj konto, Zaloguj się i bądź aktywny na forum, a wtedy reklamy nie będą się pojawiać. Dołącz do dyskusji i otrzymaj punkty za rejestrację oraz odpowiedzi.

Zainstaluj aplikację Elektroda

Odpowiedz Fajne? Ranking DIY | Nowy temat

Powiadamiaj o nowych artykułach

Obserwuj nas

📢 Słuchaj (AI):

Zgłoś naruszenie prawa

Jakie AI do SVG w 2026: oktogram w okręgu i 50% mniejsze oktogramy?
05 Maj 2026 18:42 (1)
Dzień dobry, chcę tworzyć somplikowane i złożone geometrie matematyczne, na przykład oktogram w oktogramie wpisany w okrąg w SVG, ale gdy to wpisuję w Chat-gbt, on się crashuje. Czy są w 2026 jakieś programy czy ai do tworzenia kombinacji geometrycznych na bazie słów, np. stwórz oktogram, a do każdego zewnętrznego wierzchołka oktogramu dodaj 50% mniejszy oktogram. Nic takiego nie znalazłem, co działałoby... [Czytaj dalej]
Praktyczne testy Gemma 4 i porównanie z Gemini 2.5 - tagowanie obrazków i OCR
01 Maj 2026 09:19 (0)
Czy współczesne modele LLM uruchamiane lokalnie, na starym laptopie gamingowym, są w stanie sensownie otagować zdjęcia? Czy współczesne modele nadają się do OCR i poprawnie rozpoznają układy elektroniczne? Zapraszam na Elektrodowy test sztucznej inteligencji, tym razem wzbogacony o uruchamiany lokalnie model Gemma 4 oraz o płatne modele gemini-2.5-pro i gemini-2.5-flash uruchamiane przez API. Sprawdzę... [Czytaj dalej]
Czy nowy GPT-Image 2 wygeneruje schemat układu elektronicznego? Porównanie z Nano Banana 2
24 Kwi 2026 11:32 (12)
Zapraszam na praktyczny test nowego generatora obrazów od OpenAI. W tym temacie sprawdzę działanie GPT-Image 2 na różnych zadaniach powiązanych z elektroniką, będzie rysowanie schematów, opisywanie urządzeń, a również edycja zdjęć i grafik. Dodatkowo całość porównam z Nano Banana 2. Czy nowy model rzeczywiście jest lepszy? Sprawdźmy! Duża część promptów i zadań z tego tematu była już testowana z modelami... [Czytaj dalej]
ChatGPT Images 2.0 - potrafi tworzyć nawet całe czasopisma
21 Kwi 2026 22:08 (21)
Nowy model do generowania obrazów jest wyjątkowo dokładny. Przede wszystkim skupiono się na odzworowaniu typograficznym, bardzo dobrze radzi sobie z wykresami, tekstem (również w języku polskim) oraz zachowaniem jednolitości. Poniżej efekt, pora na pierwsze wydanie czasopisma elektroda.pl? :) Okładka powstała po prostu robiąc screenshot strony głównej elektroda.pl i wklejając treści artykułów (kopiuj... [Czytaj dalej]
Anthropic przedstawia Claude Opus 4.7 - nowy model jeszcze lepszy do programowania
18 Kwi 2026 09:01 (8)
Firma Anthropic zaprezentowała nową wersję swojego flagowego modelu AI – Claude Opus 4.7. Aktualizacja koncentruje się przede wszystkim na poprawie zdolności programistycznych, pracy agentowej oraz rozwiązywania złożonych problemów technicznych. Model ma oferować wyraźny wzrost jakości kodu i skuteczności przy zadaniach inżynieryjnych względem poprzedniej wersji 4.6. Według pierwszych testów model... [Czytaj dalej]

REKLAMA