Pojawiła się aktualizacja Gemini 2.5 Pro, jest już wprowadzona do istniejącego modelu i nie trzeba nic przełączać - poprzednia wersja (03-25) teraz kieruje do najnowszej wersji (05-06). Można spodziewać się znaczących ulepszeń w zakresie tworzenia interfejsów użytkownika i programowania front-endowego, a także poprawy w podstawowych zadaniach programistycznych, takich jak przekształcanie i edycja kodu oraz tworzenie zaawansowanych przepływów pracy dla agentów AI. Do tej pory w Front-end (np. wygląd stron internetowych) królował Claude Sonnet 3.7.
Gemini 2.5 Pro zajmuje obecnie pierwsze miejsce w rankingu WebDev Arena, który mierzy preferencje użytkowników dotyczące zdolności modelu do budowania estetycznych i funkcjonalnych aplikacji internetowych. Wykorzystując tę wiodącą funkcjonalność, Gemini 2.5 Pro napędza innowacyjnego agenta kodowania Cursor i wspiera współpracę Google z firmami takimi jak Cognition i Replit.
Źródło:
https://developers.googleblog.com/en/gemini-2-5-pro-io-improved-coding-performance/
Co myślą o tym użytkownicy Hacker News, podsumowanie komentarzy z strony: https://news.ycombinator.com/item?id=43906018
1. Wielu użytkowników zauważa, że Gemini 2.5 Pro jest znacznie mniej podatny na wymyślanie nieistniejących API niż inne modele, co czyni go bardziej przydatnym w codziennym programowaniu.
2. Niektórzy wyrażają obawy dotyczące zdolności modeli AI do projektowania i tworzenia dobrych abstrakcji i architektury kodu - to wciąż obszar, w którym ludzie mają przewagę.
3. Model generuje zbyt wiele komentarzy w kodzie, co jest powszechną skargą - użytkownicy próbują różnych metod, by ograniczyć tę tendencję, ale często bez powodzenia.
4. Pomimo ulepszeń, Gemini nadal wykonuje niepotrzebne refaktoryzacje kodu, zmieniając więcej niż o co został poproszony, co frustruje programistów.
5. Wersja 05-06 (najnowsza) ma gorsze wyniki w 10 z 12 benchmarków w porównaniu do wersji 03-25, z wyjątkiem zadań związanych z kodowaniem, co sugeruje optymalizację dla programowania kosztem innych umiejętności.
6. Interfejs użytkownika Gemini jest krytykowany jako niestabilny, z problemami z przewijaniem i trudnościami w kopiowaniu kodu, szczególnie na urządzeniach mobilnych lub przy słabym połączeniu.
7. W zakresie tworzenia stron internetowych i interfejsów użytkownika model osiąga dobre wyniki, choć niektórzy wolą Claude 3.7 Sonnet ze względu na lepsze "wyczucie estetyczne".
8. Użytkownicy doceniają możliwość przekształcania wideo w kod - funkcja ta może zrewolucjonizować tworzenie interaktywnych aplikacji edukacyjnych.
9. Niektórzy korzystają z alternatywnych usług jak OpenRouter czy DeepInfra do zarządzania fakturowaniem i dostępem do modelu, narzekając na brak przejrzystego monitorowania kosztów bezpośrednio od Google.
10. W testach dotyczących wyszukiwania błędów w kodzie Gemini radzi sobie bardzo dobrze, oszczędzając czas programistów nawet w przypadku nieznanych im komponentów.
11. Wielu uważa, że model jest zbyt defensywny w kodowaniu, generując zbyt wiele obsługi błędów i ogólnych bloków try-except w Pythonie.
12. Porównując z GPT-4o, niektórzy wskazują, że Gemini jest bardziej gadatliwy, ale oferuje lepsze wyniki w długich kontekstach i złożonych zadaniach.
13. Użytkownicy zgłaszają problemy z błędami w aplikacji Gemini Advanced, takimi jak nieprawidłowe formatowanie, mieszanie wiadomości czy niespodziewane przekazywanie surowych wyników wyszukiwania.[youtube][/youtube]
14. Niektórzy polecają korzystanie z modelu poprzez Google AI Studio zamiast aplikacji Gemini ze względu na stabilność.
15. Model jest chwalony za pracę z narzędziami agenckimi jak Cursor, Cline czy Aider, choć wyniki zależą od konkretnego przypadku użycia.
16. Istnieje różnica zdań co do wartości Gemini w porównaniu do Grok lub Claude - niektórzy zdecydowanie preferują jeden model nad drugim dla tych samych zadań.
17. Programiści korzystający z mniejszych organizacji mają trudności z uzyskaniem zgody na używanie tych narzędzi ze względów bezpieczeństwa, podczas gdy większe firmy często je blokują lub ograniczają do rozwiązań Microsoft.
Ciekawy jest komentarz:
Wersja 05-06 (najnowsza) ma gorsze wyniki w 10 z 12 benchmarków w porównaniu do wersji 03-25, z wyjątkiem zadań związanych z kodowaniem, co sugeruje optymalizację dla programowania kosztem innych umiejętności.
Czyżby przy okazji uszkodzono "wagi" dla innych rzeczy nie związanych z programowaniem?
Przykład zakodowania całej strony internetowej w formie slajdów z filmu youtube:
Gemini 2.5 Pro zajmuje obecnie pierwsze miejsce w rankingu WebDev Arena, który mierzy preferencje użytkowników dotyczące zdolności modelu do budowania estetycznych i funkcjonalnych aplikacji internetowych. Wykorzystując tę wiodącą funkcjonalność, Gemini 2.5 Pro napędza innowacyjnego agenta kodowania Cursor i wspiera współpracę Google z firmami takimi jak Cognition i Replit.
Źródło:
https://developers.googleblog.com/en/gemini-2-5-pro-io-improved-coding-performance/
Co myślą o tym użytkownicy Hacker News, podsumowanie komentarzy z strony: https://news.ycombinator.com/item?id=43906018
1. Wielu użytkowników zauważa, że Gemini 2.5 Pro jest znacznie mniej podatny na wymyślanie nieistniejących API niż inne modele, co czyni go bardziej przydatnym w codziennym programowaniu.
2. Niektórzy wyrażają obawy dotyczące zdolności modeli AI do projektowania i tworzenia dobrych abstrakcji i architektury kodu - to wciąż obszar, w którym ludzie mają przewagę.
3. Model generuje zbyt wiele komentarzy w kodzie, co jest powszechną skargą - użytkownicy próbują różnych metod, by ograniczyć tę tendencję, ale często bez powodzenia.
4. Pomimo ulepszeń, Gemini nadal wykonuje niepotrzebne refaktoryzacje kodu, zmieniając więcej niż o co został poproszony, co frustruje programistów.
5. Wersja 05-06 (najnowsza) ma gorsze wyniki w 10 z 12 benchmarków w porównaniu do wersji 03-25, z wyjątkiem zadań związanych z kodowaniem, co sugeruje optymalizację dla programowania kosztem innych umiejętności.
6. Interfejs użytkownika Gemini jest krytykowany jako niestabilny, z problemami z przewijaniem i trudnościami w kopiowaniu kodu, szczególnie na urządzeniach mobilnych lub przy słabym połączeniu.
7. W zakresie tworzenia stron internetowych i interfejsów użytkownika model osiąga dobre wyniki, choć niektórzy wolą Claude 3.7 Sonnet ze względu na lepsze "wyczucie estetyczne".
8. Użytkownicy doceniają możliwość przekształcania wideo w kod - funkcja ta może zrewolucjonizować tworzenie interaktywnych aplikacji edukacyjnych.
9. Niektórzy korzystają z alternatywnych usług jak OpenRouter czy DeepInfra do zarządzania fakturowaniem i dostępem do modelu, narzekając na brak przejrzystego monitorowania kosztów bezpośrednio od Google.
10. W testach dotyczących wyszukiwania błędów w kodzie Gemini radzi sobie bardzo dobrze, oszczędzając czas programistów nawet w przypadku nieznanych im komponentów.
11. Wielu uważa, że model jest zbyt defensywny w kodowaniu, generując zbyt wiele obsługi błędów i ogólnych bloków try-except w Pythonie.
12. Porównując z GPT-4o, niektórzy wskazują, że Gemini jest bardziej gadatliwy, ale oferuje lepsze wyniki w długich kontekstach i złożonych zadaniach.
13. Użytkownicy zgłaszają problemy z błędami w aplikacji Gemini Advanced, takimi jak nieprawidłowe formatowanie, mieszanie wiadomości czy niespodziewane przekazywanie surowych wyników wyszukiwania.[youtube][/youtube]
14. Niektórzy polecają korzystanie z modelu poprzez Google AI Studio zamiast aplikacji Gemini ze względu na stabilność.
15. Model jest chwalony za pracę z narzędziami agenckimi jak Cursor, Cline czy Aider, choć wyniki zależą od konkretnego przypadku użycia.
16. Istnieje różnica zdań co do wartości Gemini w porównaniu do Grok lub Claude - niektórzy zdecydowanie preferują jeden model nad drugim dla tych samych zadań.
17. Programiści korzystający z mniejszych organizacji mają trudności z uzyskaniem zgody na używanie tych narzędzi ze względów bezpieczeństwa, podczas gdy większe firmy często je blokują lub ograniczają do rozwiązań Microsoft.
Ciekawy jest komentarz:
Wersja 05-06 (najnowsza) ma gorsze wyniki w 10 z 12 benchmarków w porównaniu do wersji 03-25, z wyjątkiem zadań związanych z kodowaniem, co sugeruje optymalizację dla programowania kosztem innych umiejętności.
Czyżby przy okazji uszkodzono "wagi" dla innych rzeczy nie związanych z programowaniem?
Przykład zakodowania całej strony internetowej w formie slajdów z filmu youtube:
Fajne? Ranking DIY