REKLAMA

Adblock/uBlockOrigin/AdGuard mogą powodować znikanie niektórych postów z powodu nowej reguły.

Jak uruchomić najnowsze modele Gemma3 za pomocą Ollama WebUI? Naprawa wewnętrznego błędu serwera 500

p.kaczmarek2 21 Mar 2025 10:31 4875 0

TL;DR

Rozwiązuje błąd 500 przy uruchamianiu multimodalnych modeli Gemma 3 w Ollama WebUI na Dockerze.
Przyczyną jest przestarzały rdzeń Ollama 0.6.1 w pakiecie Docker, który nie obsługuje najnowszych modeli Gemma 3.
Obejście polega na pobraniu Ollama 0.6.2 z wydań GitHub, zatrzymaniu Dockera i uruchomieniu lokalnie `ollama.exe serve`.
Po przełączeniu trzeba ponownie pobrać modele; wariant 1B nie działa z obrazami, więc lepiej zacząć od 4B, a 27B testowo działa na 7-letnim notebooku.
W testach 27B poprawnie odczytywał godzinę i wykrył uszkodzenie żarówki, choć nadal dawał mylące odpowiedzi; autor ocenia go lepiej niż LLaVA.

Wygenerowane przez model językowy.

REKLAMA

Treść została przetłumaczona

Zobacz oryginalną wersję tematu

Zgłoś naruszenie prawa

Odpowiedz Fajne? Ranking DIY | Nowy temat

Powiadamiaj o nowych artykułach

Obserwuj nas

📢 Słuchaj (AI):

» | Autor tematu Pomocny post? (+1)

Post #1
21488942 21 Mar 2025 10:31

Próbujesz uruchomić najnowsze multimodalne modele AI Gemma3 , ale ciągle otrzymujesz błąd 500 w Ollama WebUI?
Oto rozwiązanie, ale najpierw kilka słów o Gemma 3. Gemma 3 to kolekcja lekkich, otwartych modeli zbudowanych w oparciu o te same badania i technologię, które napędzają modele Gemini 2.0. Modele Gemma 3 są zaprojektowane do szybkiego działania bezpośrednio na urządzeniach i są dostępne w różnych rozmiarach (1B, 4B, 12B i 27B), co pozwala wybrać najlepszy model dla konkretnego sprzętu i potrzeb wydajnościowych.

Modele te są bardzo łatwe do pobrania z biblioteki Ollama i uruchomienia, ale pakiet Ollama Docker Package jest dostarczany z przestarzałą wersją Ollama 0.6.1, więc nie można ich uruchomić bezpośrednio, przynajmniej do czasu aktualizacji pakietu Docker. Pokażę tutaj proste obejście.

Error 500 issue .
Zakładam więc, że masz już taką konfigurację Dockera:

Ollama core i Ollama Web interface są uruchomione w dockerze.
Jeśli nie, możesz pobrać Ollama WebUI tutaj .
Prawdopodobnie pobrałeś już Gemma3 w interfejsie użytkownika Ollama Web UI, ale gdy spróbujesz go uruchomić, otrzymasz:
Kod: text Rozwiń Zaznacz wszystko Kopiuj do schowka
500: Ollama: 500, message='Internal Server Error', url='http://host.docker.internal:11434/api/chat'
.
Tak jak na zrzucie ekranu.
.

Przyczyna problemu
Jest to spowodowane tym, że Docker używa przestarzałego rdzenia Ollama, a mianowicie wersji 0.6.1, przynajmniej w moim przypadku. Można to sprawdzić uruchamiając:
Kod: text Rozwiń Zaznacz wszystko Kopiuj do schowka
C:\Users\user>docker run --rm ghcr.io/open-webui/open-webui:ollama ollama --version Warning: could not connect to a running Ollama instance Warning: client version is 0.6.1
.
Próbowałem ją zaktualizować, ale nie znalazłem sposobu. Na szczęście jest obejście...

Najprostsze rozwiązanie .
Pobierz Ollamę bezpośrednio z zakładki Wydania:
https://github.com/ollama/ollama/releases/tag/v0.6.2
Wybierz pakiet dla swojego systemu operacyjnego, w moim przypadku był to ollama-windows-amd64.zip.

Najpierw zamknij ollamę w Dockerze:
.
Wyodrębnij go i uruchom, jak w:
Kod: text Rozwiń Zaznacz wszystko Kopiuj do schowka
ollama.exe serve

Teraz, o ile ustawienia portów są zgodne, interfejs Ollama WebUI z dockera powinien być w stanie dotrzeć do nowego rdzenia ollama. Możesz również sprawdzić jego wersję:
Kod: text Rozwiń Zaznacz wszystko Kopiuj do schowka
W:\TOOLS\ollama-windows-amd64>ollama.exe --version Warning: could not connect to a running Ollama instance Warning: client version is 0.6.2

Więc teraz używasz nowszej Ollamy. .
Oznacza to, że będziesz musiał ponownie pobrać modele AI. Do tej pory pobrałem tylko najmniejszą Gemmę.

Można też pobrać większy model:
.

Sprawdźmy czy działa

Teraz słowo ostrzeżenia - najmniejszy model 1b nie działa z obrazami, więc sugeruję zacząć od 4b.

Pierwsze testy Gemmy 3 .
Nadszedł czas na małe testy Gemmy 3. Pobawiłem się z i zdecydowałem się zaprezentować model 27b, ponieważ wydaje się on bardziej niezawodny niż mniejsze. Jednak nadal mogę go uruchomić na moim 7-letnim notebooku do gier ROG.

Fajnie, że potrafi poprawnie odczytać godzinę.

Nieźle, zauważył nawet lekkie uszkodzenie żarówki.
Spróbujmy czegoś trudniejszego.

No cóż, niestety nadal popełnia błędy i może dawać mylące wyniki, ale i tak jest lepiej niż LLaVA którą testowałem w przeszłości....

Podsumowanie .
Okazuje się, że uruchomienie nowych modeli Gemma 3 lokalnie jest bardzo proste. Jedynym problemem jaki napotkałem była przestarzała wersja Ollamy w Dockerze, ale miejmy nadzieję, że pakiet Docker również zostanie wkrótce zaktualizowany, więc nie napotkasz tego problemu w przyszłości.
Jeśli chodzi o samą Gemmę 3, to wydaje się ona bardzo obiecująca, zwłaszcza jej większe wersje. Na pierwszy rzut oka wydają się lepsze niż LLaVa, ale teraz zamierzam przeprowadzić więcej testów.
Zostawię je na inny temat.
Czy próbowałeś również uruchomić Gemma 3, a jeśli tak, to jakie są Twoje doświadczenia?
Jeśli jesteś bardziej zainteresowany Gemmą 3, możesz też po prostu zamieścić tutaj obraz lub podpowiedź, a ja przetestuję z nią Gemmę.

Fajne? Ranking DIY
Pomogłem? Kup mi kawę.
O autorze
p.kaczmarek2 p.kaczmarek2

Moderator Smart Home
Offline

Dołączył: 26 Gru 2014

Posty: 14403

Pomógł: 650

Ocena postów: 12335

Punkty: 140937
Inżynier programista z wieloletnim doświadczeniem embedded i full stack developer.
Specjalizuje się w: embedded, Full-Stack Developer
p.kaczmarek2 napisał 14403 postów o ocenie 12335, pomógł 650 razy. Jest z nami od 2014 roku.

Promuję tematy:
03.05.2026 Jaki bezgłośny sterownik oświetlenia na Zigbee? Dwukanałowy LZWSM16-2 bez przewodu neutralnego
02.05.2026 Dwa malutkie UPS dla routera, kamery lub Raspberry Pi - test pojemności
01.05.2026 Praktyczne testy Gemma 4 i porównanie z Gemini 2.5 - tagowanie obrazków i OCR
30.04.2026 Jedna ładowarka dla wszystkich. Od 28 kwietnia USB-C obowiązkowe także w laptopach w UE
REKLAMA
Zarejestruj konto, Zaloguj się i bądź aktywny na forum, a wtedy reklamy nie będą się pojawiać. Dołącz do dyskusji i otrzymaj punkty za rejestrację oraz odpowiedzi.

Zainstaluj aplikację Elektroda

Odpowiedz Fajne? Ranking DIY | Nowy temat

Powiadamiaj o nowych artykułach

Obserwuj nas

📢 Słuchaj (AI):

Zgłoś naruszenie prawa

Praktyczne testy Gemma 4 i porównanie z Gemini 2.5 - tagowanie obrazków i OCR
01 Maj 2026 09:19 (0)
Czy współczesne modele LLM uruchamiane lokalnie, na starym laptopie gamingowym, są w stanie sensownie otagować zdjęcia? Czy współczesne modele nadają się do OCR i poprawnie rozpoznają układy elektroniczne? Zapraszam na Elektrodowy test sztucznej inteligencji, tym razem wzbogacony o uruchamiany lokalnie model Gemma 4 oraz o płatne modele gemini-2.5-pro i gemini-2.5-flash uruchamiane przez API. Sprawdzę... [Czytaj dalej]
Nowe potężne otwarte AI - DeepSeek-V4 (preview) - 1.6T parametrów i 1M tokenów kontekstu
24 Kwi 2026 17:30 (2)
DeepSeek opublikował wersję preview nowej generacji modelu językowego AI DeepSeek‑V4. Premiera odbyła się 24 kwietnia 2026 razem z raportem technicznym i wagami modelu udostępnionymi na Hugging Face. Nowa seria zawiera dwa modele: DeepSeek-V4-Pro ma architekturę Mixture of Experts z 1.6 biliona parametrów całkowitych oraz około 49 miliardów parametrów aktywnych podczas inferencji. Model obsługuje... [Czytaj dalej]
Czy nowy GPT-Image 2 wygeneruje schemat układu elektronicznego? Porównanie z Nano Banana 2
24 Kwi 2026 11:32 (12)
Zapraszam na praktyczny test nowego generatora obrazów od OpenAI. W tym temacie sprawdzę działanie GPT-Image 2 na różnych zadaniach powiązanych z elektroniką, będzie rysowanie schematów, opisywanie urządzeń, a również edycja zdjęć i grafik. Dodatkowo całość porównam z Nano Banana 2. Czy nowy model rzeczywiście jest lepszy? Sprawdźmy! Duża część promptów i zadań z tego tematu była już testowana z modelami... [Czytaj dalej]
ChatGPT Images 2.0 - potrafi tworzyć nawet całe czasopisma
21 Kwi 2026 22:08 (21)
Nowy model do generowania obrazów jest wyjątkowo dokładny. Przede wszystkim skupiono się na odzworowaniu typograficznym, bardzo dobrze radzi sobie z wykresami, tekstem (również w języku polskim) oraz zachowaniem jednolitości. Poniżej efekt, pora na pierwsze wydanie czasopisma elektroda.pl? :) Okładka powstała po prostu robiąc screenshot strony głównej elektroda.pl i wklejając treści artykułów (kopiuj... [Czytaj dalej]
Anthropic przedstawia Claude Opus 4.7 - nowy model jeszcze lepszy do programowania
18 Kwi 2026 09:01 (8)
Firma Anthropic zaprezentowała nową wersję swojego flagowego modelu AI – Claude Opus 4.7. Aktualizacja koncentruje się przede wszystkim na poprawie zdolności programistycznych, pracy agentowej oraz rozwiązywania złożonych problemów technicznych. Model ma oferować wyraźny wzrost jakości kodu i skuteczności przy zadaniach inżynieryjnych względem poprzedniej wersji 4.6. Według pierwszych testów model... [Czytaj dalej]

REKLAMA