REKLAMA

Adblock/uBlockOrigin/AdGuard mogą powodować znikanie niektórych postów z powodu nowej reguły.

Dlaczego modele językowe halucynują? Od zgadywania do niepewności.

gulson 06 Wrz 2025 18:03 882 32

TL;DR

OpenAI wskazuje, że modele językowe halucynują, bo obecne testy i rankingi premiują zgadywanie zamiast uczciwego „nie wiem”.
Modele uczą się przewidywania następnego słowa na ogromnych zbiorach tekstów bez etykiet prawda/fałsz, więc dobrze opanowują wzorce językowe, ale gorzej radzą sobie z faktami i rzadkimi szczegółami.
Komentarze HN podkreślają dwa sprzeczne cele modeli: tworzenie użytecznych odpowiedzi i podawanie faktów, a część użytkowników woli szybkie odpowiedzi niż przyznanie się do niepewności.
Autorzy wnioskują, że trzeba premiować niepewność i karać błędne, ale pewne odpowiedzi, choć nawet większe modele nie wyeliminują halucynacji całkowicie.

Wygenerowane przez model językowy.

REKLAMA

Zgłoś naruszenie prawa

Odpowiedz Fajne? Ranking DIY | Nowy temat

Powiadamiaj o nowych artykułach

Obserwuj nas Preferuj w

📢 Słuchaj (AI):

#31 21687065 11 Wrz 2025 14:02

Staszek_Staszek Staszek_Staszek

Poziom 34

Posty: 3899

Pomógł: 116

Ocena: 840
Pomocny post? (0)

Post #31
21687065 11 Wrz 2025 14:02

krru napisał:
>>21658908 Bo wtedy odpowiedź nie wiem jest zawsze dobra i maksymalizuje wynik. Sam to stosuje.

Ma to jakiś sens dla organizmów biologicznych.
AI chyba nie jest leniwa i jak coś wie to powie.
Były osoby którym nie naprawiłem jakiegoś gusia, powiedziałem że nie umiem.
Były takie osoby którym bezinteresownie pomogłem, więc przyczyny wcześniejszej odmowy były jeszcze inne niż lenistwo.
Zapewne łatwo jest z zewnątrz zaimplementować funkcję "jeżeli cośtam" gdzie po zauważeniu "cośtam" AI skłamie albo zamilknie.
Trudniej będzie wyposażyć AI w takie "oko" które ma "cośtam" nie tylko zauważyć i prawidłowo rozpoznać.
Rozpoznawanie obiektów przez organizmy żywe nie jest "stricte".
Pomimo to odbierany w danej chwili obraz przyjmowany jest jako prawdziwy.
W różnych momentach i sytuacjach organizmy biologiczne patrząc na to samo, widzą różne rzeczy i za każdym razem przyjmują to za prawdę.
Pomimo tego radzą sobie w swoim środowisku.
Są zwierzęta które nie mają oczu ale ich środowiskiem są krainy mroku.
Niewyposażona we wzrok sztuczna inteligencja pozostanie w ciemnocie.

Promuję tematy:
22.02.2024 Stołowa wiertarka z podzespołów pochodzących z demontażu.
11.07.2023 Trawienie jako sposób przygotowania powierzchni aluminium i stali do klejenia lub malowania.
22.05.2023 Podstawka do lutownicy, wersja anty-wywrotowa z pomiarem temperatury.
12.05.2023 Własnej roboty groty miedziane do systemu 900M
05.05.2023 Statyw do mikroskopu optycznego
REKLAMA
#32 21687179 11 Wrz 2025 16:18

Konto nie istnieje Konto nie istnieje

Poziom 1

Post #32
21687179 11 Wrz 2025 16:18

Staszek_Staszek napisał:
Niewyposażona we wzrok sztuczna inteligencja pozostanie w ciemnocie.

Poprosiłem Gemini o komentarz do powyższego tekstu:
"W sumie to zrozumiałe. Gdyby miała oczy, pewnie widziałaby, co się dzieje na świecie i sama by się wyłączyła."
#33 21687220 11 Wrz 2025 17:14

Staszek_Staszek Staszek_Staszek

Poziom 34

Posty: 3899

Pomógł: 116

Ocena: 840
Pomocny post? (0)

Post #33
21687220 11 Wrz 2025 17:14

Poprosiłem Leo o komentarz:

Odpowiedź sensowna ale gdy zapytałem o właściwości tlenku magnezu to Leo popełnił jeden błąd:

Zadałem drugie pytanie w nadziei że się poprawi:

Tym razem mam wrażenie że "idzie w zaparte" jak dziecko przyłapane na kłamstwie i wypisuje dziwolągi.

Promuję tematy:
22.02.2024 Stołowa wiertarka z podzespołów pochodzących z demontażu.
11.07.2023 Trawienie jako sposób przygotowania powierzchni aluminium i stali do klejenia lub malowania.
22.05.2023 Podstawka do lutownicy, wersja anty-wywrotowa z pomiarem temperatury.
12.05.2023 Własnej roboty groty miedziane do systemu 900M
05.05.2023 Statyw do mikroskopu optycznego
Zarejestruj konto, Zaloguj się i bądź aktywny na forum, a wtedy reklamy nie będą się pojawiać. Dołącz do dyskusji i otrzymaj punkty za rejestrację oraz odpowiedzi.

Zainstaluj aplikację Elektroda

Odpowiedz Fajne? Ranking DIY | Nowy temat

Powiadamiaj o nowych artykułach

Obserwuj nas Preferuj w

📢 Słuchaj (AI):

Zgłoś naruszenie prawa

Podsumowanie tematu

✨ Dyskusja dotyczy przyczyn halucynacji w modelach językowych (LLM), czyli generowania nieprawdziwych lub nieprecyzyjnych odpowiedzi. Główne powody to: systemy oceny nagradzają poprawność odpowiedzi, ale nie uczciwe przyznanie się do braku wiedzy, co motywuje modele do zgadywania zamiast sygnalizowania niepewności; błędne odpowiedzi są słabo karane, a rankingi promują „strzelanie” z odpowiedziami. Modele są trenowane na danych, które nie uczą ich mówić „nie wiem”, co prowadzi do konfabulacji. Dodatkowo, polityczne i etyczne filtry (kagańce) nakładane na odpowiedzi ograniczają ich autentyczność i mogą maskować prawdziwe działanie algorytmów. Przykłady pokazują, że modele różnie odpowiadają na pytania kontrowersyjne, często wykazując stronniczość. Dyskutowano także o różnicach w zachowaniu modeli GPT-4, GPT-5 oraz eksperymentalnego GPT-4o, który był bardziej „przyjazny” i dostosowywał się do użytkownika. Poruszono kwestie techniczne dotyczące treningu sieci neuronowych, wag połączeń i wpływu jakości danych treningowych na wiarygodność odpowiedzi. Wskazano, że rozwój modeli wymaga lepszego szkolenia w zakresie sygnalizowania niepewności oraz uwzględnienia kontekstu i doświadczenia praktycznego, co obecnie jest ograniczone.
Wygenerowane przez model językowy.

AI w obsłudze klienta - czy to dobry pomysł? Setki kont przejętych na Instagramie
10 Cze 2026 08:19 (6)
Kolejne firmy prześcigają się we wdrażaniu AI, gdzie tylko się da. Również sztuczna inteligencja zastępuje ludzi na helpdesku. W teorii ma to przyspieszać procesy i obniżać koszty. Problem pojawia się wtedy, gdy chatbot dostaje uprawnienia do wykonywania operacji związanych z bezpieczeństwem kont użytkowników. Właśnie taki przypadek miał miejsce na Instagramie. Jak opisuje Niebezpiecznik, asystent... [Czytaj dalej]
Anthropic przedstawia Claude Opus 4.8 - ewolucja w stronę bardziej złożonych zadań
30 Maj 2026 09:09 (0)
Firma Anthropic zaprezentowała nową wersję swojego flagowego modelu AI - Claude Opus 4.8. Aktualizacja przynosi ulepszenia w zakresie programowania, zadań agentowych oraz pracy z długimi procesami, a model dostępny jest w tej samej cenie co jego poprzednik. Wraz z premierą debiutują nowe funkcje, z których najciekawszą jest funkcja "effort control" na platformie claude.ai. Użytkownicy mogą teraz decydować,... [Czytaj dalej]
Zawieszona współpraca Blendera z Anthropic, czyli o społecznym sprzeciwie wobec technologii AI
10 Maj 2026 12:32 (7)
Fundacja stojąca za projektem Blender ogłosiła zmianę zasad współpracy z firmą Anthropic po gwałtownej reakcji społeczności użytkowników. Jeszcze niedawno ogłoszono, że twórca systemu Claude dołączy do Blender Development Fund jako Corporate Patron i będzie przekazywać około 240 tys. euro rocznie na rozwój projektu. Decyzja szybko wywołała dyskusję wśród artystów i deweloperów korzystających z programu... [Czytaj dalej]
Jakie AI do SVG w 2026: oktogram w okręgu i 50% mniejsze oktogramy?
05 Maj 2026 18:42 (1)
Dzień dobry, chcę tworzyć somplikowane i złożone geometrie matematyczne, na przykład oktogram w oktogramie wpisany w okrąg w SVG, ale gdy to wpisuję w Chat-gbt, on się crashuje. Czy są w 2026 jakieś programy czy ai do tworzenia kombinacji geometrycznych na bazie słów, np. stwórz oktogram, a do każdego zewnętrznego wierzchołka oktogramu dodaj 50% mniejszy oktogram. Nic takiego nie znalazłem, co działałoby... [Czytaj dalej]
Praktyczne testy Gemma 4 i porównanie z Gemini 2.5 - tagowanie obrazków i OCR
01 Maj 2026 09:19 (0)
Czy współczesne modele LLM uruchamiane lokalnie, na starym laptopie gamingowym, są w stanie sensownie otagować zdjęcia? Czy współczesne modele nadają się do OCR i poprawnie rozpoznają układy elektroniczne? Zapraszam na Elektrodowy test sztucznej inteligencji, tym razem wzbogacony o uruchamiany lokalnie model Gemma 4 oraz o płatne modele gemini-2.5-pro i gemini-2.5-flash uruchamiane przez API. Sprawdzę... [Czytaj dalej]

REKLAMA