REKLAMA

Adblock/uBlockOrigin/AdGuard mogą powodować znikanie niektórych postów z powodu nowej reguły.

Aktualizacja Gemini 2.5 Pro Preview - najlepszy model do programowania?

gulson 06 Maj 2025 22:14 681 7

TL;DR

Gemini 2.5 Pro otrzymał aktualizację 05-06 bez przełączania modelu, z wyraźnym naciskiem na generowanie interfejsów i programowanie front-endowe.
Model zajmuje 1. miejsce w WebDev Arena i napędza Cursor, a Google współpracuje przy nim z Cognition oraz Replit.
Użytkownicy Hacker News chwalą mniejszą skłonność do wymyślania fałszywych API i dobre wyszukiwanie błędów, ale narzekają na komentarze i niechciane refaktoryzacje.
Wersja 05-06 ma gorsze wyniki w 10 z 12 benchmarków względem 03-25, poza zadaniami kodowania, co sugeruje optymalizację kosztem innych umiejętności.
Aplikacja Gemini Advanced zbiera krytykę za niestabilność, problemy z przewijaniem i kopiowaniem kodu, więc część osób woli używać Google AI Studio.

REKLAMA

Zgłoś naruszenie prawa

Odpowiedz Fajne? Ranking DIY | Nowy temat

Powiadamiaj o nowych artykułach

Obserwuj nas

📢 Słuchaj (AI):

Autor tematu Pomocny post? (+1)

Post #1
21541507 06 Maj 2025 22:14

Pojawiła się aktualizacja Gemini 2.5 Pro, jest już wprowadzona do istniejącego modelu i nie trzeba nic przełączać - poprzednia wersja (03-25) teraz kieruje do najnowszej wersji (05-06). Można spodziewać się znaczących ulepszeń w zakresie tworzenia interfejsów użytkownika i programowania front-endowego, a także poprawy w podstawowych zadaniach programistycznych, takich jak przekształcanie i edycja kodu oraz tworzenie zaawansowanych przepływów pracy dla agentów AI. Do tej pory w Front-end (np. wygląd stron internetowych) królował Claude Sonnet 3.7.

Gemini 2.5 Pro zajmuje obecnie pierwsze miejsce w rankingu WebDev Arena, który mierzy preferencje użytkowników dotyczące zdolności modelu do budowania estetycznych i funkcjonalnych aplikacji internetowych. Wykorzystując tę wiodącą funkcjonalność, Gemini 2.5 Pro napędza innowacyjnego agenta kodowania Cursor i wspiera współpracę Google z firmami takimi jak Cognition i Replit.

Źródło:
https://developers.googleblog.com/en/gemini-2-5-pro-io-improved-coding-performance/

Co myślą o tym użytkownicy Hacker News, podsumowanie komentarzy z strony: https://news.ycombinator.com/item?id=43906018
1. Wielu użytkowników zauważa, że Gemini 2.5 Pro jest znacznie mniej podatny na wymyślanie nieistniejących API niż inne modele, co czyni go bardziej przydatnym w codziennym programowaniu.
2. Niektórzy wyrażają obawy dotyczące zdolności modeli AI do projektowania i tworzenia dobrych abstrakcji i architektury kodu - to wciąż obszar, w którym ludzie mają przewagę.
3. Model generuje zbyt wiele komentarzy w kodzie, co jest powszechną skargą - użytkownicy próbują różnych metod, by ograniczyć tę tendencję, ale często bez powodzenia.
4. Pomimo ulepszeń, Gemini nadal wykonuje niepotrzebne refaktoryzacje kodu, zmieniając więcej niż o co został poproszony, co frustruje programistów.
5. Wersja 05-06 (najnowsza) ma gorsze wyniki w 10 z 12 benchmarków w porównaniu do wersji 03-25, z wyjątkiem zadań związanych z kodowaniem, co sugeruje optymalizację dla programowania kosztem innych umiejętności.
6. Interfejs użytkownika Gemini jest krytykowany jako niestabilny, z problemami z przewijaniem i trudnościami w kopiowaniu kodu, szczególnie na urządzeniach mobilnych lub przy słabym połączeniu.
7. W zakresie tworzenia stron internetowych i interfejsów użytkownika model osiąga dobre wyniki, choć niektórzy wolą Claude 3.7 Sonnet ze względu na lepsze "wyczucie estetyczne".
8. Użytkownicy doceniają możliwość przekształcania wideo w kod - funkcja ta może zrewolucjonizować tworzenie interaktywnych aplikacji edukacyjnych.
9. Niektórzy korzystają z alternatywnych usług jak OpenRouter czy DeepInfra do zarządzania fakturowaniem i dostępem do modelu, narzekając na brak przejrzystego monitorowania kosztów bezpośrednio od Google.
10. W testach dotyczących wyszukiwania błędów w kodzie Gemini radzi sobie bardzo dobrze, oszczędzając czas programistów nawet w przypadku nieznanych im komponentów.
11. Wielu uważa, że model jest zbyt defensywny w kodowaniu, generując zbyt wiele obsługi błędów i ogólnych bloków try-except w Pythonie.
12. Porównując z GPT-4o, niektórzy wskazują, że Gemini jest bardziej gadatliwy, ale oferuje lepsze wyniki w długich kontekstach i złożonych zadaniach.
13. Użytkownicy zgłaszają problemy z błędami w aplikacji Gemini Advanced, takimi jak nieprawidłowe formatowanie, mieszanie wiadomości czy niespodziewane przekazywanie surowych wyników wyszukiwania.[youtube][/youtube]
14. Niektórzy polecają korzystanie z modelu poprzez Google AI Studio zamiast aplikacji Gemini ze względu na stabilność.
15. Model jest chwalony za pracę z narzędziami agenckimi jak Cursor, Cline czy Aider, choć wyniki zależą od konkretnego przypadku użycia.
16. Istnieje różnica zdań co do wartości Gemini w porównaniu do Grok lub Claude - niektórzy zdecydowanie preferują jeden model nad drugim dla tych samych zadań.
17. Programiści korzystający z mniejszych organizacji mają trudności z uzyskaniem zgody na używanie tych narzędzi ze względów bezpieczeństwa, podczas gdy większe firmy często je blokują lub ograniczają do rozwiązań Microsoft.

Ciekawy jest komentarz:
Wersja 05-06 (najnowsza) ma gorsze wyniki w 10 z 12 benchmarków w porównaniu do wersji 03-25, z wyjątkiem zadań związanych z kodowaniem, co sugeruje optymalizację dla programowania kosztem innych umiejętności.

Czyżby przy okazji uszkodzono "wagi" dla innych rzeczy nie związanych z programowaniem?

Przykład zakodowania całej strony internetowej w formie slajdów z filmu youtube:

Fajne? Ranking DIY
O autorze
gulson gulson

Administrator Systemowy
Offline

Dołączył: 27 Mar 2001

Posty: 29393

Pomógł: 148

Ocena postów: 6068

Punkty: 56701
Twórca portalu elektroda.pl od roku 1999. Zajmuje się opieką portalu, od czasu do czasu publikując tutaj ciekawostki i felietony. Interesuje się wszystkim, co jest związane z nowymi technologiami - obecnie najbardziej AI. Z wykształcenia technik elektronik, inżynier i magister informatyki po Politechnice Łódzkiej.
gulson napisał 29393 postów o ocenie 6068, pomógł 148 razy. Mieszka w mieście Kielce. Jest z nami od 2001 roku.

Promuję tematy:
21.06.2026 Zegar NTP na Waveshare ESP32-S3 4.2" RLCD - open source z RTC, MP3, WWW i oszczędzaniem energii
21.04.2026 ChatGPT Images 2.0 - potrafi tworzyć nawet całe czasopisma
19.02.2026 OpenClaw w robotyce czyli czas autonomicznych robotów - wizja przyszłości SkyNetu w formie felietonu
19.02.2026 Humanoidalne roboty z okazji Nowego Roku Chińskiego a niepokój o przyszłość.
13.02.2026 GPT-5.3 Codex i Opus 4.6 – wpływ nowych modeli AI na rynek pracy i automatyzację
REKLAMA
#2 21541531 06 Maj 2025 22:33

Konto nie istnieje Konto nie istnieje

Poziom 1

Post #2
21541531 06 Maj 2025 22:33

gulson napisał:
Wersja 05-06 (najnowsza) ma gorsze wyniki w 10 z 12 benchmarków w porównaniu do wersji 03-25, z wyjątkiem zadań związanych z kodowaniem, co sugeruje optymalizację dla programowania kosztem innych umiejętności.

Nie mam nic na przeciwko
REKLAMA
#3 21545690 11 Maj 2025 09:49

DJ_KLIMA DJ_KLIMA

Poziom 25

Posty: 661

Pomógł: 67

Ocena: 220
Pomocny post? (0)

Post #3
21545690 11 Maj 2025 09:49

Generalnie, jak testuję to i tamto, to czasami mam wrażenie, że pierwsze wypusty działały lepiej, i jak oskalpują bez zbędnej otoczki, np. tłumaczenia kodu czy innych pierdów, nie będę za tym tęsknił. Niech generuje po prostu kod z komentarzami, to będzie spoko.
REKLAMA
#4 21545739 11 Maj 2025 10:36

gulson gulson

Administrator Systemowy

Posty: 29393

Pomógł: 148

Ocena: 6068
Autor tematu Pomocny post? (0)

Post #4
21545739 11 Maj 2025 10:36

Z tego co czytam, użytkownicy nie są zbyt zadowoleni, nawet miejscami w kodowaniu jest gorszy. Niektórym pozmieniał cały przepływ pracy.
A raczej nie maj wrócić do poprzedniej wersji.

Promuję tematy:
21.06.2026 Zegar NTP na Waveshare ESP32-S3 4.2" RLCD - open source z RTC, MP3, WWW i oszczędzaniem energii
21.04.2026 ChatGPT Images 2.0 - potrafi tworzyć nawet całe czasopisma
19.02.2026 OpenClaw w robotyce czyli czas autonomicznych robotów - wizja przyszłości SkyNetu w formie felietonu
19.02.2026 Humanoidalne roboty z okazji Nowego Roku Chińskiego a niepokój o przyszłość.
13.02.2026 GPT-5.3 Codex i Opus 4.6 – wpływ nowych modeli AI na rynek pracy i automatyzację
#5 21545764 11 Maj 2025 11:09

Konto nie istnieje Konto nie istnieje

Poziom 1

Post #5
21545764 11 Maj 2025 11:09

Mam całkowicie odmienną opinię nt. nowszej wersji Gemini 2.5 Pro. Fakt, że używam jej głównie w C++23 i nie w charakterze vibe-coding Zawsze też można spróbować Google AI Studio z 05-06 i tam sobie poustawiać "temperaturę" czy Top_P.

Jest jeszcze Firebase Studio od Google (https://studio.firebase.google.com/). Oaza dla miłośników vibe-coding w Pythonie, Javie, .NET etc.
REKLAMA
#6 21546996 12 Maj 2025 13:28

mipix mipix

Poziom 38

Posty: 4067

Pomógł: 495

Ocena: 1475
Pomocny post? (0)

Post #6
21546996 12 Maj 2025 13:28

Moja wersja 2.5 Pro Preview nie radzi sobie z liczeniem ciasteczek.

Promuję tematy:
30.03.2024 Krups EA8901 Evidence - woda w kotle, para w środku, sucha kawa w ociekaczu
17.02.2024 Mikroskop elektroniczny DM9 Pro - krótki test
16.01.2024 Akumulator AA Li-Ion ładowany z USB-C
14.10.2023 Regeneracja i przeróbka akumulatora do odkurzacza Xiaomi G10
02.09.2019 Skoda Octavia II - Parktronic nie działa po nocy - Moduł PDC (1Z0919283B)
#7 21547047 12 Maj 2025 14:08

gulson gulson

Administrator Systemowy

Posty: 29393

Pomógł: 148

Ocena: 6068
Autor tematu Pomocny post? (0)

Post #7
21547047 12 Maj 2025 14:08

W przypadku takich zadań bardzo łatwo o halucynacje. Spróbuj podejść z innej strony, zapytaj niech policzy wiersze i kolumny.
Wydaje mi się, że tutaj nie ma rozumowania, jak sobie poradzić z tym wizualnym zadaniem.

Promuję tematy:
21.06.2026 Zegar NTP na Waveshare ESP32-S3 4.2" RLCD - open source z RTC, MP3, WWW i oszczędzaniem energii
21.04.2026 ChatGPT Images 2.0 - potrafi tworzyć nawet całe czasopisma
19.02.2026 OpenClaw w robotyce czyli czas autonomicznych robotów - wizja przyszłości SkyNetu w formie felietonu
19.02.2026 Humanoidalne roboty z okazji Nowego Roku Chińskiego a niepokój o przyszłość.
13.02.2026 GPT-5.3 Codex i Opus 4.6 – wpływ nowych modeli AI na rynek pracy i automatyzację
#8 21547417 12 Maj 2025 20:11

mipix mipix

Poziom 38

Posty: 4067

Pomógł: 495

Ocena: 1475
Pomocny post? (0)

Post #8
21547417 12 Maj 2025 20:11

Nie przyjmuje sugestii, źle liczy wiersze i kolumny nawet jak się go naprowadza. Na zrzucie ekranu też tak wychodzi. Nie musi mieć filmu.

Promuję tematy:
30.03.2024 Krups EA8901 Evidence - woda w kotle, para w środku, sucha kawa w ociekaczu
17.02.2024 Mikroskop elektroniczny DM9 Pro - krótki test
16.01.2024 Akumulator AA Li-Ion ładowany z USB-C
14.10.2023 Regeneracja i przeróbka akumulatora do odkurzacza Xiaomi G10
02.09.2019 Skoda Octavia II - Parktronic nie działa po nocy - Moduł PDC (1Z0919283B)
Zarejestruj konto, Zaloguj się i bądź aktywny na forum, a wtedy reklamy nie będą się pojawiać. Dołącz do dyskusji i otrzymaj punkty za rejestrację oraz odpowiedzi.

Zainstaluj aplikację Elektroda

Odpowiedz Fajne? Ranking DIY | Nowy temat

Powiadamiaj o nowych artykułach

Obserwuj nas

📢 Słuchaj (AI):

Zgłoś naruszenie prawa

Podsumowanie tematu

✨ Aktualizacja Gemini 2.5 Pro Preview została wprowadzona do istniejącego modelu bez konieczności przełączania wersji, oferując ulepszenia w tworzeniu interfejsów użytkownika, programowaniu front-end oraz podstawowych zadaniach programistycznych, takich jak edycja kodu i zaawansowane przepływy pracy AI. Model ten zajmuje pierwsze miejsce w rankingu WebDev Arena za zdolność do budowania estetycznych i funkcjonalnych aplikacji internetowych. Gemini 2.5 Pro napędza agenta kodowania Cursor i wspiera współpracę Google z firmami Cognition i Replit. W dyskusji pojawiły się jednak opinie o pogorszeniu jakości kodowania w porównaniu do wcześniejszych wersji, problemy z liczeniem elementów wizualnych (np. ciasteczek, wierszy i kolumn) oraz brak skutecznego przyjmowania sugestii. Alternatywnie polecano Google AI Studio i Firebase Studio jako narzędzia wspierające programowanie w różnych językach, w tym Python, Java i .NET.

AI w obsłudze klienta - czy to dobry pomysł? Setki kont przejętych na Instagramie
10 Cze 2026 08:19 (6)
Kolejne firmy prześcigają się we wdrażaniu AI, gdzie tylko się da. Również sztuczna inteligencja zastępuje ludzi na helpdesku. W teorii ma to przyspieszać procesy i obniżać koszty. Problem pojawia się wtedy, gdy chatbot dostaje uprawnienia do wykonywania operacji związanych z bezpieczeństwem kont użytkowników. Właśnie taki przypadek miał miejsce na Instagramie. Jak opisuje Niebezpiecznik, asystent... [Czytaj dalej]
Anthropic przedstawia Claude Opus 4.8 - ewolucja w stronę bardziej złożonych zadań
30 Maj 2026 09:09 (0)
Firma Anthropic zaprezentowała nową wersję swojego flagowego modelu AI - Claude Opus 4.8. Aktualizacja przynosi ulepszenia w zakresie programowania, zadań agentowych oraz pracy z długimi procesami, a model dostępny jest w tej samej cenie co jego poprzednik. Wraz z premierą debiutują nowe funkcje, z których najciekawszą jest funkcja "effort control" na platformie claude.ai. Użytkownicy mogą teraz decydować,... [Czytaj dalej]
Zawieszona współpraca Blendera z Anthropic, czyli o społecznym sprzeciwie wobec technologii AI
10 Maj 2026 12:32 (7)
Fundacja stojąca za projektem Blender ogłosiła zmianę zasad współpracy z firmą Anthropic po gwałtownej reakcji społeczności użytkowników. Jeszcze niedawno ogłoszono, że twórca systemu Claude dołączy do Blender Development Fund jako Corporate Patron i będzie przekazywać około 240 tys. euro rocznie na rozwój projektu. Decyzja szybko wywołała dyskusję wśród artystów i deweloperów korzystających z programu... [Czytaj dalej]
Jakie AI do SVG w 2026: oktogram w okręgu i 50% mniejsze oktogramy?
05 Maj 2026 18:42 (1)
Dzień dobry, chcę tworzyć somplikowane i złożone geometrie matematyczne, na przykład oktogram w oktogramie wpisany w okrąg w SVG, ale gdy to wpisuję w Chat-gbt, on się crashuje. Czy są w 2026 jakieś programy czy ai do tworzenia kombinacji geometrycznych na bazie słów, np. stwórz oktogram, a do każdego zewnętrznego wierzchołka oktogramu dodaj 50% mniejszy oktogram. Nic takiego nie znalazłem, co działałoby... [Czytaj dalej]
Praktyczne testy Gemma 4 i porównanie z Gemini 2.5 - tagowanie obrazków i OCR
01 Maj 2026 09:19 (0)
Czy współczesne modele LLM uruchamiane lokalnie, na starym laptopie gamingowym, są w stanie sensownie otagować zdjęcia? Czy współczesne modele nadają się do OCR i poprawnie rozpoznają układy elektroniczne? Zapraszam na Elektrodowy test sztucznej inteligencji, tym razem wzbogacony o uruchamiany lokalnie model Gemma 4 oraz o płatne modele gemini-2.5-pro i gemini-2.5-flash uruchamiane przez API. Sprawdzę... [Czytaj dalej]

REKLAMA