Firma Anthropic zaprezentowała nową wersję swojego flagowego modelu AI - Claude Opus 4.8. Aktualizacja przynosi ulepszenia w zakresie programowania, zadań agentowych oraz pracy z długimi procesami, a model dostępny jest w tej samej cenie co jego poprzednik. Wraz z premierą debiutują nowe funkcje, z których najciekawszą jest funkcja "effort control" na platformie claude.ai. Użytkownicy mogą teraz decydować, jak dużo zasobów model ma poświęcić na odpowiedź – wyższe ustawienia gwarantują głębsze przemyślenia, a niższe pozwalają na szybszą pracę i oszczędzanie limitów. Narzędzie Claude Code zyskało funkcję "dynamicznych przepływów pracy" (dynamic workflows), pozwalającą modelowi zarządzać setkami równoległych subagentów podczas gigantycznych zadań, takich jak migracje setek tysięcy linii kodu. Znacznie poprawiono również prawdomówność i rzetelność modelu. Opus 4.8 rzadziej wyciąga pochopne wnioski i jest aż czterokrotnie skuteczniejszy w wyłapywaniu błędów we własnym kodzie, otwarcie sygnalizując wątpliwości. Twórcy udostępnili także "fast mode" dla Opus 4.8, który działa 2,5 raza szybciej i jest teraz trzykrotnie tańszy niż w poprzednich modelach.
W komunikacie pojawiła się również kluczowa zapowiedź dotycząca nowej, potężniejszej klasy modeli. Anthropic ogłosiło, że model Claude Mythos Preview, charakteryzujący się jeszcze wyższą inteligencją niż Opus, jest już w ograniczonych testach w zastosowaniach cyberbezpieczeństwa. Po dopracowaniu zabezpieczeń, modele z rodziny Mythos mają trafić do wszystkich klientów w nadchodzących tygodniach.
Źródło: https://www.anthropic.com/news/claude-opus-4-8
Jak Opus 4.8 i ogólny rozwój AI oceniany jest przez społeczność?
Podsumowanie trendów na bazie: https://news.ycombinator.com/item?id=48311647
- zmęczenie przyrostowymi aktualizacjami - wielu użytkowników zauważa, że kolejne wersje (4.6, 4.7, 4.8) oferują poprawki coraz trudniejsze do dostrzeżenia w codziennym użytkowaniu, co rodzi znużenie brakiem dawnego "efektu wow".
- rosnąca siła mniejszych modeli - toczy się dyskusja o tym, że mniejsze modele (rzędu 60-90B parametrów) stają się niezwykle "gęste w możliwości" dzięki technikom takim jak samo-destylacja (self-distillation). Coraz skuteczniej gonią one gigantyczne modele typu frontier pod względem użyteczności w typowych zastosowaniach.
- biznesowa gra gigantów AI - pojawiają się silne głosy, że czołowe laboratoria mają interes w utrzymywaniu mitu, że do dobrej sztucznej inteligencji niezbędne są astronomicznie drogie klastry obliczeniowe. Ma to na celu utrzymanie wysokich cen i budowanie fosy ochronnej przed tańszą, lokalną konkurencją open-source.
- wartość wysokiego poziomu "inteligencji" - chociaż dla zwykłych zadań wystarczają mniejsze modele, społeczność dostrzega stałą, wysoce dochodową niszę (np. farmacja, zaawansowana inżynieria) dla modeli o maksymalnych możliwych zdolnościach, gdzie nawet niewielki procent przewagi uzasadnia ogromne koszty.
Czy korzystacie z najnowszych modeli Anthropic? Testowaliście już funkcję "effort control" w 4.8, czy bardziej czekacie na publiczną premierę Mythos?
W komunikacie pojawiła się również kluczowa zapowiedź dotycząca nowej, potężniejszej klasy modeli. Anthropic ogłosiło, że model Claude Mythos Preview, charakteryzujący się jeszcze wyższą inteligencją niż Opus, jest już w ograniczonych testach w zastosowaniach cyberbezpieczeństwa. Po dopracowaniu zabezpieczeń, modele z rodziny Mythos mają trafić do wszystkich klientów w nadchodzących tygodniach.
Źródło: https://www.anthropic.com/news/claude-opus-4-8
Jak Opus 4.8 i ogólny rozwój AI oceniany jest przez społeczność?
Podsumowanie trendów na bazie: https://news.ycombinator.com/item?id=48311647
- zmęczenie przyrostowymi aktualizacjami - wielu użytkowników zauważa, że kolejne wersje (4.6, 4.7, 4.8) oferują poprawki coraz trudniejsze do dostrzeżenia w codziennym użytkowaniu, co rodzi znużenie brakiem dawnego "efektu wow".
- rosnąca siła mniejszych modeli - toczy się dyskusja o tym, że mniejsze modele (rzędu 60-90B parametrów) stają się niezwykle "gęste w możliwości" dzięki technikom takim jak samo-destylacja (self-distillation). Coraz skuteczniej gonią one gigantyczne modele typu frontier pod względem użyteczności w typowych zastosowaniach.
- biznesowa gra gigantów AI - pojawiają się silne głosy, że czołowe laboratoria mają interes w utrzymywaniu mitu, że do dobrej sztucznej inteligencji niezbędne są astronomicznie drogie klastry obliczeniowe. Ma to na celu utrzymanie wysokich cen i budowanie fosy ochronnej przed tańszą, lokalną konkurencją open-source.
- wartość wysokiego poziomu "inteligencji" - chociaż dla zwykłych zadań wystarczają mniejsze modele, społeczność dostrzega stałą, wysoce dochodową niszę (np. farmacja, zaawansowana inżynieria) dla modeli o maksymalnych możliwych zdolnościach, gdzie nawet niewielki procent przewagi uzasadnia ogromne koszty.
Czy korzystacie z najnowszych modeli Anthropic? Testowaliście już funkcję "effort control" w 4.8, czy bardziej czekacie na publiczną premierę Mythos?
Fajne? Ranking DIY Pomogłem? Kup mi kawę.