REKLAMA

Adblock/uBlockOrigin/AdGuard mogą powodować znikanie niektórych postów z powodu nowej reguły.

Gemini Robotics - czyli sztuczna inteligencja trafia bezpośrednio do robotów

gulson 24 Cze 2025 21:09 282 1

TL;DR

Google pokazało Gemini Robotics On-Device, lokalny model VLA dla robotów dwuramiennych, który ma działać bez chmury i szybko adaptować się do nowych zadań.
Do pakietu dołączono Gemini Robotics SDK, które pozwala testować model w symulatorze MuJoCo i dostrajać go do środowisk oraz zadań programisty.
Model można dopasować do nowych zastosowań przy użyciu zaledwie 50-100 demonstracji.
Na Hacker News pojawia się entuzjazm wobec VLA jako możliwego „momentu ChatGPT dla robotyki”, ale też obawy o niezawodność humanoidalnych robotów.

Wygenerowane przez model językowy.

REKLAMA

Zgłoś naruszenie prawa

Odpowiedz | Nowy temat

Powiadamiaj o nowych artykułach

Obserwuj nas

📢 Słuchaj (AI):

Autor tematu Pomocny post? (+1)

Post #1
21588527 24 Cze 2025 21:09

Wszyscy znamy modele językowe Gemini, w wersjach Pro, Flash czy Lite. Dzisiaj firma Google przedstawiła wersję Gemini o nazwie Robotics, która może działać bezpośrednio na urządzeniach robotycznych. Nowy model charakteryzuje się ogólnym zastosowaniem i szybką adaptacją do różnych zadań.

Gemini Robotics On-Device - najbardziej zaawansowany model VLA zoptymalizowany do pracy bezpośrednio na urządzeniach bez konieczności łączenia się do chmury.
Twórcy udostępnili również Gemini Robotics SDK (zestaw narzędzi programistycznych), który pomaga programistom łatwo testować Gemini Robotics On-Device w ich zadaniach i środowiskach, sprawdzać model w symulatorze fizyki MuJoCo oraz szybko adaptować go do nowych zastosowań przy użyciu zaledwie 50-100 demonstracji.

Gemini Robotics On-Device to podstawowy model robotyczny dla robotów dwuramiennych, zaprojektowany tak, aby wymagał minimalnych zasobów obliczeniowych. Bazuje na możliwościach uogólniania zadań i zręczności modelu Gemini Robotics i charakteryzuje się następującymi cechami:
- Został zaprojektowany do szybkich eksperymentów z precyzyjną manipulacją
- Można go dostosować do nowych zadań poprzez dostrajanie w celu poprawy wydajności
- Jest zoptymalizowany do lokalnej pracy z szybkim przetwarzaniem danych

Chociaż wiele zadań będzie działać od razu po instalacji, programiści mogą również dostosować model, aby osiągnąć lepszą wydajność dla swoich aplikacji. Model szybko adaptuje się do nowych zadań przy użyciu zaledwie 50-100 demonstracji, co pokazuje, jak dobrze ten lokalny model może uogólnić swoją podstawową wiedzę na nowe zadania.

To, jak, budujemy Terminatora?
Źródło:
https://deepmind.google/discover/blog/gemini-...on-device-brings-ai-to-local-robotic-devices/

Co myślą o tym użytkownicy hacker news?
https://news.ycombinator.com/item?id=44366409
- Użytkownicy wyrażają optymizm wobec robotyki humanoidalnej, ale martwią się o niezawodność urządzeń. Jeden z komentujących zwraca uwagę na to, jak cudowne są biologiczne kończyny - potrafią stale wchodzić w interakcje ze światem, zużywać się naturalnie, ale jednocześnie samodzielnie się regenerować.
- Komentujący są podekscytowani lub nieco przestraszeni możliwościami, jakie niesie bliska przyszłość. Jeden z użytkowników zauważa, że początkowo zakładał, iż roboty będą bardzo wyspecjalizowane (jak roboty sprzątające), ale teraz wydaje się, że będą bardzo uniwersalne.
- Szczególnie ekscytujący jest moment, gdy dwa roboty będą mogły naprawiać się nawzajem.
- Jeden z użytkowników, który przez ostatnie miesiące badał VLA (Vision-Language-Action), jest przekonany, że będą one przełomowe - mogą być "momentem ChatGPT dla robotyki". Wyjaśnia, że multimodalne LLM-y już mają wbudowane rozumienie obrazów i tekstu, więc VLA to po prostu zwykłe MMLLM-y dostrojone do wydawania konkretnych sekwencji instrukcji dla robotów.
- Użytkownik ten widzi potencjał zastosowania tej metody w różnych dziedzinach - od inteligentnych kosiarek po pojazdy autonomiczne, a nawet do odśnieżania podjazdu podczas, kiedy właściciel smacznie śpi.
O autorze
gulson gulson

Administrator Systemowy
Offline

Dołączył: 27 Mar 2001

Posty: 29349

Pomógł: 148

Ocena postów: 6026

Punkty: 56823
Twórca portalu elektroda.pl od roku 1999. Zajmuje się opieką portalu, od czasu do czasu publikując tutaj ciekawostki i felietony. Interesuje się wszystkim, co jest związane z nowymi technologiami. Z wykształcenia technik elektronik, inżynier i magister informatyki po Politechnice Łódzkiej.
gulson napisał 29349 postów o ocenie 6026, pomógł 148 razy. Mieszka w mieście Kielce. Jest z nami od 2001 roku.

Promuję tematy:
21.04.2026 ChatGPT Images 2.0 - potrafi tworzyć nawet całe czasopisma
19.02.2026 OpenClaw w robotyce czyli czas autonomicznych robotów - wizja przyszłości SkyNetu w formie felietonu
19.02.2026 Humanoidalne roboty z okazji Nowego Roku Chińskiego a niepokój o przyszłość.
13.02.2026 GPT-5.3 Codex i Opus 4.6 – wpływ nowych modeli AI na rynek pracy i automatyzację
03.02.2026 Gdzie rynek pracy IT naprawdę potrzebuje ludzi w 2026 roku? Analiza ofert pracy z Hacker News
REKLAMA
#2 21588938 25 Cze 2025 11:15

Konto nie istnieje Konto nie istnieje

Poziom 1

Post #2
21588938 25 Cze 2025 11:15

Przykładowe platformy sprzętowe dla Gemini Robotics:
• dla prostszych robotów/prototypów: Raspberry Pi 4/5 z akceleratorem Google Coral USB.
• dla zaawansowanych robotów mobilnych/ramion: NVIDIA Jetson Orin Nano/NX/AGX, Intel NUC z dedykowaną kartą graficzną/akceleratorem.
Do tego dochodzi stabilny system zasilania akumulatorowego, najlepiej z zaawansowanym zarządzaniem energią, aby optymalizować zużycie i czas pracy oraz efektywny system chłodzenia, szczególnie w małych, zamkniętych obudowach robotów. Tania rozrywka to nie będzie.

Linux jest praktycznie jedynym sensownym systemem operacyjnym dla Gemini Robotics
Zarejestruj konto, Zaloguj się i bądź aktywny na forum, a wtedy reklamy nie będą się pojawiać. Dołącz do dyskusji i otrzymaj punkty za rejestrację oraz odpowiedzi.

Zainstaluj aplikację Elektroda

Odpowiedz | Nowy temat

Powiadamiaj o nowych artykułach

Obserwuj nas

📢 Słuchaj (AI):

Zgłoś naruszenie prawa

AI w obsłudze klienta - czy to dobry pomysł? Setki kont przejętych na Instagramie
10 Cze 2026 08:19 (2)
Kolejne firmy prześcigają się we wdrażaniu AI, gdzie tylko się da. Również sztuczna inteligencja zastępuje ludzi na helpdesku. W teorii ma to przyspieszać procesy i obniżać koszty. Problem pojawia się wtedy, gdy chatbot dostaje uprawnienia do wykonywania operacji związanych z bezpieczeństwem kont użytkowników. Właśnie taki przypadek miał miejsce na Instagramie. Jak opisuje Niebezpiecznik, asystent... [Czytaj dalej]
Anthropic przedstawia Claude Opus 4.8 - ewolucja w stronę bardziej złożonych zadań
30 Maj 2026 09:09 (0)
Firma Anthropic zaprezentowała nową wersję swojego flagowego modelu AI - Claude Opus 4.8. Aktualizacja przynosi ulepszenia w zakresie programowania, zadań agentowych oraz pracy z długimi procesami, a model dostępny jest w tej samej cenie co jego poprzednik. Wraz z premierą debiutują nowe funkcje, z których najciekawszą jest funkcja "effort control" na platformie claude.ai. Użytkownicy mogą teraz decydować,... [Czytaj dalej]
Zawieszona współpraca Blendera z Anthropic, czyli o społecznym sprzeciwie wobec technologii AI
10 Maj 2026 12:32 (7)
Fundacja stojąca za projektem Blender ogłosiła zmianę zasad współpracy z firmą Anthropic po gwałtownej reakcji społeczności użytkowników. Jeszcze niedawno ogłoszono, że twórca systemu Claude dołączy do Blender Development Fund jako Corporate Patron i będzie przekazywać około 240 tys. euro rocznie na rozwój projektu. Decyzja szybko wywołała dyskusję wśród artystów i deweloperów korzystających z programu... [Czytaj dalej]
Jakie AI do SVG w 2026: oktogram w okręgu i 50% mniejsze oktogramy?
05 Maj 2026 18:42 (1)
Dzień dobry, chcę tworzyć somplikowane i złożone geometrie matematyczne, na przykład oktogram w oktogramie wpisany w okrąg w SVG, ale gdy to wpisuję w Chat-gbt, on się crashuje. Czy są w 2026 jakieś programy czy ai do tworzenia kombinacji geometrycznych na bazie słów, np. stwórz oktogram, a do każdego zewnętrznego wierzchołka oktogramu dodaj 50% mniejszy oktogram. Nic takiego nie znalazłem, co działałoby... [Czytaj dalej]
Praktyczne testy Gemma 4 i porównanie z Gemini 2.5 - tagowanie obrazków i OCR
01 Maj 2026 09:19 (0)
Czy współczesne modele LLM uruchamiane lokalnie, na starym laptopie gamingowym, są w stanie sensownie otagować zdjęcia? Czy współczesne modele nadają się do OCR i poprawnie rozpoznają układy elektroniczne? Zapraszam na Elektrodowy test sztucznej inteligencji, tym razem wzbogacony o uruchamiany lokalnie model Gemma 4 oraz o płatne modele gemini-2.5-pro i gemini-2.5-flash uruchamiane przez API. Sprawdzę... [Czytaj dalej]

REKLAMA