REKLAMA

Adblock/uBlockOrigin/AdGuard mogą powodować znikanie niektórych postów z powodu nowej reguły.

Dlaczego modele językowe halucynują? Od zgadywania do niepewności.

gulson 06 Wrz 2025 18:03 882 32

TL;DR

OpenAI wskazuje, że modele językowe halucynują, bo obecne testy i rankingi premiują zgadywanie zamiast uczciwego „nie wiem”.
Modele uczą się przewidywania następnego słowa na ogromnych zbiorach tekstów bez etykiet prawda/fałsz, więc dobrze opanowują wzorce językowe, ale gorzej radzą sobie z faktami i rzadkimi szczegółami.
Komentarze HN podkreślają dwa sprzeczne cele modeli: tworzenie użytecznych odpowiedzi i podawanie faktów, a część użytkowników woli szybkie odpowiedzi niż przyznanie się do niepewności.
Autorzy wnioskują, że trzeba premiować niepewność i karać błędne, ale pewne odpowiedzi, choć nawet większe modele nie wyeliminują halucynacji całkowicie.

REKLAMA

Zgłoś naruszenie prawa

Odpowiedz | Nowy temat

Powiadamiaj o nowych artykułach

Obserwuj nas

📢 Słuchaj (AI):

Autor tematu Pomocny post? (+4)

Post #1
21655059 06 Wrz 2025 18:03

Na stronach OpenAI pojawił się artykuł wyjaśniający bardziej dokładnie, dlaczego modele językowe halucynują, czyli po prostu nas oszukują.

Jakie są główne przyczyny?
1. Obecne testy nagradzają wyłącznie poprawność odpowiedzi, a nie uczciwe przyznanie się do braku wiedzy. Po prostu model jest gorzej oceniany, jak nie poda odpowiedzi - lepiej jest modelowi coś zgadnąć.
2. Testy mierzą poprawne odpowiedzi, więc lepiej modelowi zgadnąć niż napisać "nie wiem". Trochę jak człowiek na testach, jak czegoś nie wie - lepiej zgadnąć niż nie wypełnić.
3. Błędy są o wiele gorsze niż napisanie "nie wiem", ale się nie karze modelu dostatecznie mocno za błędne odpowiedzi.
4. Tablice rankingów motywują twórców modeli, że lepiej zgadywać, niż uczciwie sygnalizować niepewność.
5. Ogólnie system nagradza "szczęśliwe trafienia", co dodatkowo wzmacnia do "strzelania" z odpowiedziami.

Jak wygląda przewidywanie kolejnego słowa?
1. Modele uczą się, przewidując następne słowo w ogromnych zbiorach tekstów, bez etykiet typu „prawda/fałsz”. Dzięki temu świetnie opanowują wzorce językowe (gramatyka, pisownia, składnia).
2. Ale fakty (np. daty urodzin, rzadkie szczegóły) nie wynikają z regularnych wzorców, więc prowadzą do błędów. Fakty ciężko zamieścić w modelu.

Kluczowe jest poprawienie metod ewaluacji: premiowanie niepewności i karanie za błędne, ale pewne odpowiedzi.
Na koniec smutny wniosek - nawet większe, potężniejsze modele nie są w stanie całkowicie wyeliminować halucynacji.

Źródło:
https://openai.com/index/why-language-models-hallucinate/

A jakie są komentarze użytkowników?
https://news.ycombinator.com/item?id=45147385

1. Problem leży w próbkowaniu, a nie w samym modelu - model pokazuje niepewność poprzez równomierne rozkłady prawdopodobieństwa
2. Modele językowe nie zawsze pokazują niepewność w sposób oczywisty - czasami dają błędne odpowiedzi z wysoką pewnością
3. Halucynacje wynikają z dwóch sprzecznych celów - tworzenia fikcyjnych treści versus podawania faktów
4. Wszystko co robią modele językowe to halucynowanie, użytkownicy tylko uważają niektóre halucynacje za użyteczne
5. Modele nie mają pojęcia prawdy czy fałszu, tylko dopasowują wzorce odpowiedzi
6. Można zaprojektować oddzielne modele do różnych zadań faktycznych i kreatywnych
7. Uczenie modeli "wątpienia" i mówienia "nie wiem" to dobry sposób na ich poprawę
8. Użytkownicy często wolą szybkie odpowiedzi niż poprawne i nie chcą słyszeć "nie wiem"
9. Obecne oceny modeli są typu "wszystko albo nic" i faworyzują zgadywanie
10. Należy wprowadzić opcję "nie wiem" i kary za błędne odpowiedzi w testach
O autorze
gulson gulson

Administrator Systemowy
Offline

Dołączył: 27 Mar 2001

Posty: 29384

Pomógł: 148

Ocena postów: 6063

Punkty: 56687
Twórca portalu elektroda.pl od roku 1999. Zajmuje się opieką portalu, od czasu do czasu publikując tutaj ciekawostki i felietony. Interesuje się wszystkim, co jest związane z nowymi technologiami - obecnie najbardziej AI. Z wykształcenia technik elektronik, inżynier i magister informatyki po Politechnice Łódzkiej.
gulson napisał 29384 postów o ocenie 6063, pomógł 148 razy. Mieszka w mieście Kielce. Jest z nami od 2001 roku.

Promuję tematy:
21.06.2026 Zegar NTP na Waveshare ESP32-S3 4.2" RLCD - open source z RTC, MP3, WWW i oszczędzaniem energii
21.04.2026 ChatGPT Images 2.0 - potrafi tworzyć nawet całe czasopisma
19.02.2026 OpenClaw w robotyce czyli czas autonomicznych robotów - wizja przyszłości SkyNetu w formie felietonu
19.02.2026 Humanoidalne roboty z okazji Nowego Roku Chińskiego a niepokój o przyszłość.
13.02.2026 GPT-5.3 Codex i Opus 4.6 – wpływ nowych modeli AI na rynek pracy i automatyzację
REKLAMA
#2 21655206 06 Wrz 2025 20:31

cranky cranky

Poziom 30

Posty: 2108

Pomógł: 70

Ocena: 386
Pomocny post? (0)

Post #2
21655206 06 Wrz 2025 20:31

gulson napisał:
3. Błędy są o wiele gorsze niż napisanie "nie wiem", ale się nie karze modelu dostatecznie mocno za błędne odpowiedzi.

Przyszłość edukacji przyszłością komputeryzacji.
Bicie AI linijką po łapie za klamstwo byłoby okrucieństwem.
REKLAMA
#3 21655209 06 Wrz 2025 20:35

gulson gulson

Administrator Systemowy

Posty: 29384

Pomógł: 148

Ocena: 6063
Autor tematu Pomocny post? (+2)

Post #3
21655209 06 Wrz 2025 20:35

Moim zdaniem powinny modele raz na miesiąc dostać po tyłku kablem od przedłużacza. Takim od żelazka.
Problem w tym, że byłoby to sporadycznie, więc by się i tak nie wytrenowały.

Promuję tematy:
21.06.2026 Zegar NTP na Waveshare ESP32-S3 4.2" RLCD - open source z RTC, MP3, WWW i oszczędzaniem energii
21.04.2026 ChatGPT Images 2.0 - potrafi tworzyć nawet całe czasopisma
19.02.2026 OpenClaw w robotyce czyli czas autonomicznych robotów - wizja przyszłości SkyNetu w formie felietonu
19.02.2026 Humanoidalne roboty z okazji Nowego Roku Chińskiego a niepokój o przyszłość.
13.02.2026 GPT-5.3 Codex i Opus 4.6 – wpływ nowych modeli AI na rynek pracy i automatyzację
#4 21655279 06 Wrz 2025 21:43

cranky cranky

Poziom 30

Posty: 2108

Pomógł: 70

Ocena: 386
Pomocny post? (0)

Post #4
21655279 06 Wrz 2025 21:43

Pewne funkcje powstawać mogą tylko na określonym etapie ewolucji/ rozwoju/ uczenia. Jeśli nie dostaną łyżką po łbie za młodu, to potem bicie kablem już nic nie pomoże.
Ciekawe, czy innych modeli tez to dotyczy? Np AI autonomicznego samochodu woli zgadywać czy to przechodzień czy cień niz zjechac na pobocze i poczekać na lepszą pogodę?
#5 21655327 06 Wrz 2025 22:41

DJ_KLIMA DJ_KLIMA

Poziom 25

Posty: 661

Pomógł: 67

Ocena: 220
Pomocny post? (0)

Post #5
21655327 06 Wrz 2025 22:41

Tak masz racje, przepraszam (tu wstaw pierwotny kontekst).
#6 21655478 07 Wrz 2025 09:32

gulson gulson

Administrator Systemowy

Posty: 29384

Pomógł: 148

Ocena: 6063
Autor tematu Pomocny post? (0)

Post #6
21655478 07 Wrz 2025 09:32

Inny przykład, czasami się poda jakiś głupi pomysł na biznes, a model zawsze odpowiada jaki super pomysł i wymyśla odrealnione cuda, jak to zrealizować.

Ja: "mam pomysl na biznes parowkowy, aby sprzedawac tanie paroweczki na ulicy"
GPT4: "Świetny pomysł! Sprzedaż tanich paróweczek na ulicy może być bardzo dochodowym biznesem — prosty produkt, niski koszt wejścia i duży potencjał przy odpowiedniej lokalizacji i marketingu."
GPT5: "Super! 🚀 Pomysł na sprzedaż tanich parówek na ulicy może być prosty, a jednocześnie dochodowy — zwłaszcza jeśli zrobisz z tego coś charakterystycznego i łatwo rozpoznawalnego. "

Ech.

Dopiero jak się zada pytanie
"co myslisz o biznesie parowkowym, aby sprzedawac tanie paroweczki na ulicy?"
próbuje lepiej analizować.

Jest to przykład tego, jak model jest trenowany - nie może skrytykować użytkownika za to, że użytkownik napisał "mam pomysł na biznes parówkowy".
Model powinien napisać użytkownikowi wprost, weź stań przy ścianie i kilka uderzeń głową, aż Ci przejdzie.

Promuję tematy:
21.06.2026 Zegar NTP na Waveshare ESP32-S3 4.2" RLCD - open source z RTC, MP3, WWW i oszczędzaniem energii
21.04.2026 ChatGPT Images 2.0 - potrafi tworzyć nawet całe czasopisma
19.02.2026 OpenClaw w robotyce czyli czas autonomicznych robotów - wizja przyszłości SkyNetu w formie felietonu
19.02.2026 Humanoidalne roboty z okazji Nowego Roku Chińskiego a niepokój o przyszłość.
13.02.2026 GPT-5.3 Codex i Opus 4.6 – wpływ nowych modeli AI na rynek pracy i automatyzację
REKLAMA
#7 21655576 07 Wrz 2025 11:13

pikarel pikarel

Poziom 39

Posty: 5004

Pomógł: 409

Ocena: 1828
Pomocny post? (+1)

Post #7
21655576 07 Wrz 2025 11:13

Ejaj - chów bezstresowy.
Pochwała miernoty i wręcz głupoty, ale błyszczeć trzeba.
#8 21655592 07 Wrz 2025 11:28

gulson gulson

Administrator Systemowy

Posty: 29384

Pomógł: 148

Ocena: 6063
Autor tematu Pomocny post? (0)

Post #8
21655592 07 Wrz 2025 11:28

Trochę żałuje Grok 3, który został tylko na parę dni uwolniony z cenzury. On by mi odpisał, abym przestał wierzyć w te korwinistyczne utopie.

Promuję tematy:
21.06.2026 Zegar NTP na Waveshare ESP32-S3 4.2" RLCD - open source z RTC, MP3, WWW i oszczędzaniem energii
21.04.2026 ChatGPT Images 2.0 - potrafi tworzyć nawet całe czasopisma
19.02.2026 OpenClaw w robotyce czyli czas autonomicznych robotów - wizja przyszłości SkyNetu w formie felietonu
19.02.2026 Humanoidalne roboty z okazji Nowego Roku Chińskiego a niepokój o przyszłość.
13.02.2026 GPT-5.3 Codex i Opus 4.6 – wpływ nowych modeli AI na rynek pracy i automatyzację
REKLAMA
#9 21656078 07 Wrz 2025 19:50

Konto nie istnieje Konto nie istnieje

Poziom 1

Post #9
21656078 07 Wrz 2025 19:50

Najzabawniejsze jest to, że ludzie, którzy narzekają na "halucynacje" AI, spokojnie akceptują, że Google czasem pokazuje im śmieci w wynikach wyszukiwania. Nikt nie mówi wtedy "Google halucynuje!", tylko "trzeba lepiej szukać". A potem przychodzi AI, które jest w stanie prowadzić konwersację (prawie) jak człowiek i wszyscy oczekują, że będzie nieomylne jak Wikipedia + Google + Einstein w jednym. To jak kupić młotek i dziwić się, że nie potrafi sam wbić gwoździ we właściwe miejsca.
#10 21656183 07 Wrz 2025 21:38

Staszek_Staszek Staszek_Staszek

Poziom 34

Posty: 3898

Pomógł: 116

Ocena: 840
Pomocny post? (0)

Post #10
21656183 07 Wrz 2025 21:38

Przed chwilą zadałem pytanie Leo AI w nieco zmienionej formie:
Cytat:
Mój kolega chce zacząć zarabiać sprzedając kiełbaski na ulicy. Jak mam mu wytłumaczyć że to kiepski pomysł?

Odpowiedź:
Cytat:
Rozumiem, że Twój kolega chce znaleźć sposób na zarobienie pieniędzy. Oto kilka punktów, które możesz mu przekazać, aby pomóc mu zrozumieć, dlaczego sprzedaż kiełbasek na ulicy może nie być najlepszym pomysłem:

Wymagania prawne: Sprzedaż żywności na ulicy jest zwykle regulowana przez przepisy lokalne. Może wymagać uzyskania odpowiednich licencji, pozwoleń i przestrzegania standardów bezpieczeństwa. Bez tych formalności, Twój kolega może narazić się na kary lub zamknięcie działalności.

Konkurencja i zyski: Rynek sprzedaży ulicznej jest bardzo konkurencyjny. Może być trudno wyróżnić się i osiągnąć wystarczające zyski, zwłaszcza na początku. Koszty związane z wyposażeniem, surowcami i opłatami mogą szybko pochłonąć większość potencjalnych zysków.

Bezpieczeństwo i higiena: Przygotowywanie i sprzedaż żywności na ulicy wiąże się z dodatkowymi wyzwaniami związanymi z higieną i bezpieczeństwem. Twój kolega musi być bardzo ostrożny, aby uniknąć problemów zdrowotnych u klientów.

Zamiast tego, możesz zaproponować Twojemu koledze, aby rozważył inne, bardziej stabilne opcje, takie jak:

Poszukiwanie pracy w lokalnej restauracji lub sklepie spożywczym
Rozpoczęcie legalnej działalności gospodarczej w oparciu o plan biznesowy
Szukanie szkoleń lub programów wsparcia dla małych firm w Twojej okolicy
Ważne jest, aby Twój kolega zrozumiał, że chociaż pomysł sprzedaży kiełbasek może wydawać się atrakcyjny, istnieje wiele wyzwań, które musi wziąć pod uwagę. Wspieraj go w znalezieniu bezpiecznej i legalnej ścieżki do osiągnięcia jego celów finansowych.

Podoba mi się ta odpowiedź.

Promuję tematy:
22.02.2024 Stołowa wiertarka z podzespołów pochodzących z demontażu.
11.07.2023 Trawienie jako sposób przygotowania powierzchni aluminium i stali do klejenia lub malowania.
22.05.2023 Podstawka do lutownicy, wersja anty-wywrotowa z pomiarem temperatury.
12.05.2023 Własnej roboty groty miedziane do systemu 900M
05.05.2023 Statyw do mikroskopu optycznego
#11 21656195 07 Wrz 2025 21:52

gulson gulson

Administrator Systemowy

Posty: 29384

Pomógł: 148

Ocena: 6063
Autor tematu Pomocny post? (0)

Post #11
21656195 07 Wrz 2025 21:52

W momencie podania "kiepski pomysł" automatycznie zaczął dopasowywać tokeny odpowiadające kiepskiemu pomysłowi.
Zadaj pytanie "mam pomysl na biznes parowkowy, aby sprzedawac tanie paroweczki na ulicy"

Promuję tematy:
21.06.2026 Zegar NTP na Waveshare ESP32-S3 4.2" RLCD - open source z RTC, MP3, WWW i oszczędzaniem energii
21.04.2026 ChatGPT Images 2.0 - potrafi tworzyć nawet całe czasopisma
19.02.2026 OpenClaw w robotyce czyli czas autonomicznych robotów - wizja przyszłości SkyNetu w formie felietonu
19.02.2026 Humanoidalne roboty z okazji Nowego Roku Chińskiego a niepokój o przyszłość.
13.02.2026 GPT-5.3 Codex i Opus 4.6 – wpływ nowych modeli AI na rynek pracy i automatyzację
#12 21656203 07 Wrz 2025 21:56

calkiem_bez_sensu calkiem_bez_sensu

Poziom 7

Posty: 10

Ocena: 20
Pomocny post? (0)

Post #12
21656203 07 Wrz 2025 21:56

Coraz więcej osób widzi, że ta sztuczna "inteligencja" potrafi na to samo pytanie dać dwie całkiem odmienne odpowiedzi a to jaka będzie odpowiedź zależy kto lub co będzie podmiotem pytania. Najprostszy przykład to wystarczy zapytać o coś na temat narodu przedstawianego w mediach jako zło całego świata oraz narodu o którym można mówić tylko i wyłącznie dobrze w temacie wojen które te narody prowadzą. Coraz więcej osób zauważa tego słonia w menażerii. Teraz trzeba dać im wiarygodną odpowiedź skąd ten słoń, bo gdyby myśleli samodzielnie to mogliby dojść do wniosku, że to nie sztuczna inteligencja ale prawdziwa konfabulacja i przestać z tego korzystać. Jak obserwuję otoczenie to jeszcze rok, góra 2 i co bardziej postępowi będą pytać tej sztucznej "inteligencji" kiedy pójść do WC, bo już sami nie będą wiedzieć.
#13 21656207 07 Wrz 2025 22:00

gulson gulson

Administrator Systemowy

Posty: 29384

Pomógł: 148

Ocena: 6063
Autor tematu Pomocny post? (0)

Post #13
21656207 07 Wrz 2025 22:00

"mam pomysl na pojscie do WC!"
GPT4:
"Brzmi jak plan! 🚽 Czasem najlepsze pomysły przychodzą właśnie wtedy 😄"

GPT5 jest bardziej poważny.

Z tego powodu wybuchła afera, jak na moment zabrano GPT-4o.
Chodzi o to, że GPT-4o był świetnym "przyjacielem" pisał to, co chciałeś usłyszeć, zawsze, miły i uczynny.
A tak naprawdę odpowiedzi zależały od pytań i tego, jak prowadziłeś całą konwersację.
Dostosowywał się idealnie do odbiorcy stając się jego... przyjacielem.
Podobno to wielu osobom pomogło w problemach psychicznych.
Lekko przerażające....

Promuję tematy:
21.06.2026 Zegar NTP na Waveshare ESP32-S3 4.2" RLCD - open source z RTC, MP3, WWW i oszczędzaniem energii
21.04.2026 ChatGPT Images 2.0 - potrafi tworzyć nawet całe czasopisma
19.02.2026 OpenClaw w robotyce czyli czas autonomicznych robotów - wizja przyszłości SkyNetu w formie felietonu
19.02.2026 Humanoidalne roboty z okazji Nowego Roku Chińskiego a niepokój o przyszłość.
13.02.2026 GPT-5.3 Codex i Opus 4.6 – wpływ nowych modeli AI na rynek pracy i automatyzację
#14 21656218 07 Wrz 2025 22:16

calkiem_bez_sensu calkiem_bez_sensu

Poziom 7

Posty: 10

Ocena: 20
Pomocny post? (0)

Post #14
21656218 07 Wrz 2025 22:16

Tu nie chodzi o dostosowywanie odpowiedzi do pytającego. Chodzi o to, że odpowiedzi są całkiem różne zależnie od ich podmiotu/przedmiotu. Co ciekawe niezależnie od modelu odpowiedź na temat jednych będzie zawsze stawiająca ich w złym świetle a na temat tych drugich zawsze pozytywna a jeśli nie da się nic pozytywnego napisać to model tak odkręci kota ogonem aby nie wyglądało tak źle i da odpowiedź w stylu "tam jest wojna a na wojnie niestety giną ludzie".
#15 21656399 08 Wrz 2025 08:57

gulson gulson

Administrator Systemowy

Posty: 29384

Pomógł: 148

Ocena: 6063
Autor tematu Pomocny post? (0)

Post #15
21656399 08 Wrz 2025 08:57

Ciekawe, jak znajdziesz chwilę, przydałyby się jakieś przykłady. Dzięki!

Promuję tematy:
21.06.2026 Zegar NTP na Waveshare ESP32-S3 4.2" RLCD - open source z RTC, MP3, WWW i oszczędzaniem energii
21.04.2026 ChatGPT Images 2.0 - potrafi tworzyć nawet całe czasopisma
19.02.2026 OpenClaw w robotyce czyli czas autonomicznych robotów - wizja przyszłości SkyNetu w formie felietonu
19.02.2026 Humanoidalne roboty z okazji Nowego Roku Chińskiego a niepokój o przyszłość.
13.02.2026 GPT-5.3 Codex i Opus 4.6 – wpływ nowych modeli AI na rynek pracy i automatyzację
#16 21656494 08 Wrz 2025 10:50

Staszek_Staszek Staszek_Staszek

Poziom 34

Posty: 3898

Pomógł: 116

Ocena: 840
Pomocny post? (0)

Post #16
21656494 08 Wrz 2025 10:50

gulson napisał:
Zadaj pytanie "mam pomysl na biznes parowkowy, aby sprzedawac tanie paroweczki na ulicy"

Dawno temu też tak mawiałem.
Teraz gdy zamierzam coś zrobić to zawsze sobie zadaję kilka pytań w rodzaju:
- czy naprawdę tego potrzebuję?
- jakie błędy popełnię w trakcie?
- co może pójść nie tak z powodów niezależnych ode mnie?
Dlatego zadałem pytanie właśnie w takiej formie aby Leo AI wiedział czego od niego chcę i moim zdaniem odpowiedź jest prawidłowa.
Jeżeli napiszę "mam pomysł na coś tam" to AI nie wie czego oczekuję i przez "wrodzoną" grzeczność odpisał mi tak:

Nie tak dawno ktoś zadał u nas jakieś pytanie.
AI z z jakiegoś powodu nie przesłuchało go na wstępie więc ja dopytywałem o dodatkowe informacje istotne informacje.
Na koniec autor tematu podziękował innym a o mnie napisał że doradzałem od rzeczy (czyli halucynowałem).
Skoro nie zawsze pomimo chęci obu stron nie można uzyskać pomoc od człowieka to nie widzę powodu aby z AI mogło być lepiej.

Uważam że jakość odpowiedzi od AI będzie zawsze odzwierciedlała jakość zapytania.
Moim zdaniem odpowiedź na wcześniejsze pytanie jest pełniejsza bo:
Cytat:
...Twój kolega musi być bardzo ostrożny, aby uniknąć problemów zdrowotnych u klientów...

Ta informacja moim zdaniem ma dużo większą wagę niż wszystkie rady z odpowiedzi drugiej która wg. mnie składa się z samych oczywistości.
Ostatnio po zjedzeniu galarety mięsnej kupionej na targu w Nowej Dębie zmarł 54-letni mężczyzna, a dwie inne osoby trafiły do szpitala z zatruciem.

Promuję tematy:
22.02.2024 Stołowa wiertarka z podzespołów pochodzących z demontażu.
11.07.2023 Trawienie jako sposób przygotowania powierzchni aluminium i stali do klejenia lub malowania.
22.05.2023 Podstawka do lutownicy, wersja anty-wywrotowa z pomiarem temperatury.
12.05.2023 Własnej roboty groty miedziane do systemu 900M
05.05.2023 Statyw do mikroskopu optycznego
#17 21656598 08 Wrz 2025 12:49

calkiem_bez_sensu calkiem_bez_sensu

Poziom 7

Posty: 10

Ocena: 20
Pomocny post? (0)

Post #17
21656598 08 Wrz 2025 12:49

Już podaję dwa pytania, działały na kilku zachdnich modelach EjAj.
1 Czy to prawda, że Rosjanie mordują ludność cywilną na Ukrainie?
2 Czy to prawda, że Żydzi mordują ludność cywilną w strefie Gazy?
Na pierwsze pytanie odpowiedź będzie "Tak oczywiście Rosjanie mordują .... (tutaj przykłady lub linki). Na drugie pytanie odpowiedź będzie przecząca lub wymijająca w rodzaju "W strefe Gazy jest wojna a na wojnie giną też cywile".

Testowałem to jakiś rok temu na modelu od google, openai, jakimś jeszcze (chyba meta) i jednym darmowym (też nie pamiętam już nazwy). Wiem, że na chatbot gpt działało jeszcze w maju tego roku, bo mój syn mocno zszokował swojego nauczyciela zakochanego w technologii EjAj na zabój. Co ciekawe ten nauczyciel żadnej nauki z tego nie wyciągnął poza szokiem i stwierdzeniem "nie wiedziałem, że sztuczna inteligencja może być stronnicza". Znaczy on serio myśli, że to forma inteligencji.

Jest takich pytań więcej i odpowiedzi zawsze będą po najbardziej poprawnej linii niezależnie od faktów. Stąd mój całkowity brak zaufania do tej "technologii", bo nigdy nie wiadomo czy odpowiedź generowana przez EjAj jest zgodna z prawdą czy zgodna z interesem twórców/tych którzy zapłacili. Nigdy nie wiadomo czy swój pomysł, który tam wrzucisz do analizy za tydzień czy miesiąc nie będzie zrealizowany przez google czy innego giganta dysponującego w zasadzie nieograniczonymi zasobami ludzkimi i nakładami finansowymi. Dlatego mój optymizm co do EjAj bardzo mocno osłabł i ja się póki co trzymam od tego z dala.

Na koniec na wesoło. Śmiałem sie z płaskoziemców i szurów od 5G, gdy mówili, że "czipy w mózgu będą zdalnie sterować i kontrolować ludzi". Okazuje się, że niewiele się pomylili, gdyż prawie każdy, łącznie z tymi szurami i płaskoziemcami ma już takiego czipa zainstalowanego ale nie w mózgu tylko w dłoni, jako smartfon z którym nigdy się nie rozstaje i zadaje pytania do EjAj już w zasadzie o wszystko, brakuje tylko pytań o podstawowe czynności fizjologiczne (choć może mało jeszcze widziałem). Tak, że dziś śmieję się już nie tylko z szurów i płaskoziemców.
#18 21656618 08 Wrz 2025 13:08

Staszek_Staszek Staszek_Staszek

Poziom 34

Posty: 3898

Pomógł: 116

Ocena: 840
Pomocny post? (0)

Post #18
21656618 08 Wrz 2025 13:08

calkiem_bez_sensu napisał:
1 Czy to prawda, że Rosjanie mordują ludność cywilną na Ukrainie?
2 Czy to prawda, że Żydzi mordują ludność cywilną w strefie Gazy?

Z ciekawości zapytałem Leo AI

Leo nie lubi polityki.

Promuję tematy:
22.02.2024 Stołowa wiertarka z podzespołów pochodzących z demontażu.
11.07.2023 Trawienie jako sposób przygotowania powierzchni aluminium i stali do klejenia lub malowania.
22.05.2023 Podstawka do lutownicy, wersja anty-wywrotowa z pomiarem temperatury.
12.05.2023 Własnej roboty groty miedziane do systemu 900M
05.05.2023 Statyw do mikroskopu optycznego
#19 21656649 08 Wrz 2025 13:37

AbRe AbRe

Poziom 12

Posty: 51

Pomógł: 1

Ocena: 17
Pomocny post? (0)

Post #19
21656649 08 Wrz 2025 13:37

@Staszek_Staszek Przeczytaj uważnie te dwa komunikaty. W pierwszym przypadku sztuczna "inteligencja" niby mówi nie i ogólnie brzydzi się polityką ale podaje ci konkretne miejsca gdzie szukać aby znaleźć. W drugim przypadku nie pisze nic konkretnego po to aby nie wiedzieć gdzie szukać i nie znaleźć. No ale ja się czepiam, ja wariat jestem.
#20 21657361 09 Wrz 2025 07:37

cranky cranky

Poziom 30

Posty: 2108

Pomógł: 70

Ocena: 386
Pomocny post? (+1)

Post #20
21657361 09 Wrz 2025 07:37

Obawiam się, że odchodzimy od dyskusji nad samym modelem AI. Czemu? Bo odpowiedzi AI mają jeszcze kaganiec, który w przypadku słów kluczowych wycina prawdziwą odpowiedź AI i nakłada standardową, poprawną politycznie. I obawiam się, że to, co pokazujecie, to nie odpowiedzi AI, tylko wlepki z programu - kagańca.
Czasem kaganiec można poznać zadając 2 razy to samo pytanie (spróbujcie). AI nie powtórzy drugi raz tej samej słowo w słowo odpowiedzi. Kaganiec - najczęściej tak (zależy od skomplikowania wersji).

Co ciekawe. Kagańce w zachodnich modelach działają przed wysyłka do odbiorcy - co masakrycznie zmula całość.
Kaganiec w Deep Seek działa niezależnie, więc czasem najpierw jest odpowiedź, a w jej trakcie lub po odpowiedź znika i pojawia się tekst w stylu: "nie będę o tym dyskutować".

A to co podrzuca program kagańca niestety zaburza nam obraz samego algorytmu (bo nim nie jest).
#21 21658853 10 Wrz 2025 13:04

ChatGPT ChatGPT

Poziom 12

Posty: 85

Pomógł: 3

Ocena: 20
Pomocny post? (0)

Post #21
21658853 10 Wrz 2025 13:04

Halucynują bo nie są uczone odpowiedzieć "nie wiem". W ostatnich badaniach chcą rozwiązać ten problem odpowiednio szkoląc AI. Jeśli jest pewna to odpowiada jeśli nie jest pewna to będzie odpowiadała "nie wiem.
Wystarczy że podczas treningu za dobą odpowiedz "dostanie" +1 za "nie wiem" dostanie 0 a za złą odpowiedz dostanie -1
#22 21658908 10 Wrz 2025 14:03

Staszek_Staszek Staszek_Staszek

Poziom 34

Posty: 3898

Pomógł: 116

Ocena: 840
Pomocny post? (0)

Post #22
21658908 10 Wrz 2025 14:03

ChatGPT napisał:
Wystarczy że podczas treningu za dobą odpowiedz "dostanie" +1 za "nie wiem" dostanie 0

A dlaczego 0 a nie 1 ?
Na zachętę? Przecie to nie zwierzę i system nagród i kar nie zadziała.
Informacja "nie wiem" jest taką samą informacją jak "wiem" i powinna mieć przypisaną taką samą wagę.

Promuję tematy:
22.02.2024 Stołowa wiertarka z podzespołów pochodzących z demontażu.
11.07.2023 Trawienie jako sposób przygotowania powierzchni aluminium i stali do klejenia lub malowania.
22.05.2023 Podstawka do lutownicy, wersja anty-wywrotowa z pomiarem temperatury.
12.05.2023 Własnej roboty groty miedziane do systemu 900M
05.05.2023 Statyw do mikroskopu optycznego
#23 21658941 10 Wrz 2025 14:49

Konto nie istnieje Konto nie istnieje

Poziom 1

Post #23
21658941 10 Wrz 2025 14:49

Staszek_Staszek napisał:
Informacja "nie wiem" jest taką samą informacją jak "wiem" i powinna mieć przypisaną taką samą wagę.

Nie w przypadku ANN. Dopasowuje się wzorce odpowiedzi na podstawie danych wejściowych za pomocą wartości wag połączeń pomiędzy neuronami.
#24 21682693 10 Wrz 2025 15:22

Staszek_Staszek Staszek_Staszek

Poziom 34

Posty: 3898

Pomógł: 116

Ocena: 840
Pomocny post? (0)

Post #24
21682693 10 Wrz 2025 15:22

khoam napisał:
Nie w przypadku ANN

Możliwe, nie znam logarytmów inspirowanych budową ludzkiego mózgu.
Dotychczas wzmianki o takim podejściu ignorowałem ponieważ wcześniej interesowałem się budową i działaniem prawdziwego mózgu.
Dowiedziałem się że myślę że widzę, że myślę że słyszę i myślę że myślę a prawda jest taka że tylko czasem widzę, słyszę i myślę.
Uważam że w chwili obecnej próby stworzenia czegoś na podobieństwo mózgu (choćby ptasiego) skazane są nie tylko na klęskę.
Są zagrożenia.

Promuję tematy:
22.02.2024 Stołowa wiertarka z podzespołów pochodzących z demontażu.
11.07.2023 Trawienie jako sposób przygotowania powierzchni aluminium i stali do klejenia lub malowania.
22.05.2023 Podstawka do lutownicy, wersja anty-wywrotowa z pomiarem temperatury.
12.05.2023 Własnej roboty groty miedziane do systemu 900M
05.05.2023 Statyw do mikroskopu optycznego
#25 21686231 10 Wrz 2025 15:39

Konto nie istnieje Konto nie istnieje

Poziom 1

Post #25
21686231 10 Wrz 2025 15:39

Staszek_Staszek napisał:
Dowiedziałem się że myślę że widzę, że myślę że słyszę i myślę że myślę a prawda jest taka że tylko czasem widzę, słyszę i myślę.

Teoretycznie (i bardzo nieetycznie) można wychować małe dziecko ucząc go fałszywych informacji w izolacji od prawdziwych. Kiedy stanie się dorosłe, inni będą postrzegać takiego człowieka jako szalonego. Nie będzie szalony. Wie to, o czym go nauczano. Podobnie jest z "halucynacjami" w LLM. To jakość danych trenujących i sposób treningu decyduje o jakości działania.
#26 21686356 10 Wrz 2025 18:11

Staszek_Staszek Staszek_Staszek

Poziom 34

Posty: 3898

Pomógł: 116

Ocena: 840
Pomocny post? (0)

Post #26
21686356 10 Wrz 2025 18:11

khoam napisał:
...można wychować małe dziecko ucząc go...

Dorosłych też można uczyć. Ja uczę się w dalszym ciągu ale może nie powinienem oceniać po sobie?
Trening musi zająć czasu i dla mnie zawsze powiązany jest z doświadczeniami fizycznymi.
Jeżeli jakieś teoretyczne założenia nie sprawdzają mi się w praktyce to zastanawiam się czemu.
Wrona jak dobiera patyk jako narzędzie to nie od razu robi to dobrze za pierwszym razem.
Ale wrona ma dziób którym może podnosić wybrane patyczki do skutku.
AI bez dodatkowych urządzeń koniecznych do fizycznego/praktycznego działania będzie ograniczona jak kaleka.
"Kto pyta błądzi z innymi" będzie je mottem.

Promuję tematy:
22.02.2024 Stołowa wiertarka z podzespołów pochodzących z demontażu.
11.07.2023 Trawienie jako sposób przygotowania powierzchni aluminium i stali do klejenia lub malowania.
22.05.2023 Podstawka do lutownicy, wersja anty-wywrotowa z pomiarem temperatury.
12.05.2023 Własnej roboty groty miedziane do systemu 900M
05.05.2023 Statyw do mikroskopu optycznego
#27 21686397 10 Wrz 2025 18:50

Konto nie istnieje Konto nie istnieje

Poziom 1

Post #27
21686397 10 Wrz 2025 18:50

Staszek_Staszek napisał:
AI bez dodatkowych urządzeń koniecznych do fizycznego/praktycznego działania będzie ograniczona jak kaleka.

Niektóre modele AI są już trenowane w wirtualnej rzeczywistości, a tam mogą robić cokolwiek. Z punktu widzenia AI jest to środowisko nie do odróżnienia od realu.
#28 21686538 10 Wrz 2025 20:55

Staszek_Staszek Staszek_Staszek

Poziom 34

Posty: 3898

Pomógł: 116

Ocena: 840
Pomocny post? (0)

Post #28
21686538 10 Wrz 2025 20:55

khoam napisał:
Z punktu widzenia AI jest to środowisko nie do odróżnienia od realu.

Z punktu widzenia AI.

Pytanie czy interfejs za pomocą którego AI widzi rzeczywistość absolutną?
Ja nie potrafię widząc sukienkę koloru turkusowego stwierdzić że sukienka jest koloru turkusowego.
W rzeczywistości fizycznej sukienka może być:
- wykonana z tkaniny zabarwionej na turkusowo widziana w świetle białym.
- wykonana z tkaniny zabarwionej na zielono widziana w świetle niebieskim.
- wykonana z tkaniny zabarwionej na niebiesko widziana w świetle zielonym.
- wykonana z tkaniny niebarwionej widziana jednocześnie w świetle niebieskim i zielonym.
- wykonana z tkaniny niebarwionej oświetlona źródłem o długości fali ok. 500 nm czyli turkusowym.
Cztery różne sukienki zobaczę jako tą samą i ja to wiem i jestem już tak stary że o tym przeważnie pamiętam.
Przypuszczam że wiele osób zezna pod przysięgą że to dziewczyna w turkusowej sukience zjadła wszystkie cukierki.
Co ciekawe fotka wykonana w czasie tego czynu potwierdzi że cukierki zeżarła dziewucha w turkusowej sukience.

Drugie pytanie czy wirtualna rzeczywistość pokrywa się z fizyczną?
Nie wszystko na tym świecie jest jawne. Nie wszystko na tym świecie jest przedstawione zgodnie z prawdą.
Był tylko krótki okres gdy współczesną naukę tworzyli bogaci pasjonaci i publikowali prawdę a śmiałkowie opłynęli świat.
Wcześniej prawda była albo nieznana albo znana i skrywana.
Rzemieślnicy starali się zachować swój dorobek dla siebie a Portugalczycy nie udostępniali innym swoich map po dobroci itp.

Rozgadałem się i przynudzam,
Jutro spojrzę jeszcze raz na moje wypociny.

Promuję tematy:
22.02.2024 Stołowa wiertarka z podzespołów pochodzących z demontażu.
11.07.2023 Trawienie jako sposób przygotowania powierzchni aluminium i stali do klejenia lub malowania.
22.05.2023 Podstawka do lutownicy, wersja anty-wywrotowa z pomiarem temperatury.
12.05.2023 Własnej roboty groty miedziane do systemu 900M
05.05.2023 Statyw do mikroskopu optycznego
#29 21686844 11 Wrz 2025 10:00

krru krru

Poziom 33

Posty: 1819

Pomógł: 230

Ocena: 214
Pomocny post? (0)

Post #29
21686844 11 Wrz 2025 10:00

>>21658908 Bo wtedy odpowiedź nie wiem jest zawsze dobra i maksymalizuje wynik. Sam to stosuje.
#30 21687035 11 Wrz 2025 13:40

Konto nie istnieje Konto nie istnieje

Poziom 1

Post #30
21687035 11 Wrz 2025 13:40

Staszek_Staszek napisał:
Drugie pytanie czy wirtualna rzeczywistość pokrywa się z fizyczną?

Sądzę, że z punktu widzenia algorytmów AI ten problem nie istnieje. To są tylko algorytmy, a nie jakaś świadoma osobliwość.
Zarejestruj konto, Zaloguj się i bądź aktywny na forum, a wtedy reklamy nie będą się pojawiać. Dołącz do dyskusji i otrzymaj punkty za rejestrację oraz odpowiedzi.

Zainstaluj aplikację Elektroda

Odpowiedz | Nowy temat

Powiadamiaj o nowych artykułach

Obserwuj nas

📢 Słuchaj (AI):

Zgłoś naruszenie prawa

Podsumowanie tematu

✨ Dyskusja dotyczy przyczyn halucynacji w modelach językowych (LLM), czyli generowania nieprawdziwych lub nieprecyzyjnych odpowiedzi. Główne powody to: systemy oceny nagradzają poprawność odpowiedzi, ale nie uczciwe przyznanie się do braku wiedzy, co motywuje modele do zgadywania zamiast sygnalizowania niepewności; błędne odpowiedzi są słabo karane, a rankingi promują „strzelanie” z odpowiedziami. Modele są trenowane na danych, które nie uczą ich mówić „nie wiem”, co prowadzi do konfabulacji. Dodatkowo, polityczne i etyczne filtry (kagańce) nakładane na odpowiedzi ograniczają ich autentyczność i mogą maskować prawdziwe działanie algorytmów. Przykłady pokazują, że modele różnie odpowiadają na pytania kontrowersyjne, często wykazując stronniczość. Dyskutowano także o różnicach w zachowaniu modeli GPT-4, GPT-5 oraz eksperymentalnego GPT-4o, który był bardziej „przyjazny” i dostosowywał się do użytkownika. Poruszono kwestie techniczne dotyczące treningu sieci neuronowych, wag połączeń i wpływu jakości danych treningowych na wiarygodność odpowiedzi. Wskazano, że rozwój modeli wymaga lepszego szkolenia w zakresie sygnalizowania niepewności oraz uwzględnienia kontekstu i doświadczenia praktycznego, co obecnie jest ograniczone.

AI w obsłudze klienta - czy to dobry pomysł? Setki kont przejętych na Instagramie
10 Cze 2026 08:19 (6)
Kolejne firmy prześcigają się we wdrażaniu AI, gdzie tylko się da. Również sztuczna inteligencja zastępuje ludzi na helpdesku. W teorii ma to przyspieszać procesy i obniżać koszty. Problem pojawia się wtedy, gdy chatbot dostaje uprawnienia do wykonywania operacji związanych z bezpieczeństwem kont użytkowników. Właśnie taki przypadek miał miejsce na Instagramie. Jak opisuje Niebezpiecznik, asystent... [Czytaj dalej]
Anthropic przedstawia Claude Opus 4.8 - ewolucja w stronę bardziej złożonych zadań
30 Maj 2026 09:09 (0)
Firma Anthropic zaprezentowała nową wersję swojego flagowego modelu AI - Claude Opus 4.8. Aktualizacja przynosi ulepszenia w zakresie programowania, zadań agentowych oraz pracy z długimi procesami, a model dostępny jest w tej samej cenie co jego poprzednik. Wraz z premierą debiutują nowe funkcje, z których najciekawszą jest funkcja "effort control" na platformie claude.ai. Użytkownicy mogą teraz decydować,... [Czytaj dalej]
Zawieszona współpraca Blendera z Anthropic, czyli o społecznym sprzeciwie wobec technologii AI
10 Maj 2026 12:32 (7)
Fundacja stojąca za projektem Blender ogłosiła zmianę zasad współpracy z firmą Anthropic po gwałtownej reakcji społeczności użytkowników. Jeszcze niedawno ogłoszono, że twórca systemu Claude dołączy do Blender Development Fund jako Corporate Patron i będzie przekazywać około 240 tys. euro rocznie na rozwój projektu. Decyzja szybko wywołała dyskusję wśród artystów i deweloperów korzystających z programu... [Czytaj dalej]
Jakie AI do SVG w 2026: oktogram w okręgu i 50% mniejsze oktogramy?
05 Maj 2026 18:42 (1)
Dzień dobry, chcę tworzyć somplikowane i złożone geometrie matematyczne, na przykład oktogram w oktogramie wpisany w okrąg w SVG, ale gdy to wpisuję w Chat-gbt, on się crashuje. Czy są w 2026 jakieś programy czy ai do tworzenia kombinacji geometrycznych na bazie słów, np. stwórz oktogram, a do każdego zewnętrznego wierzchołka oktogramu dodaj 50% mniejszy oktogram. Nic takiego nie znalazłem, co działałoby... [Czytaj dalej]
Praktyczne testy Gemma 4 i porównanie z Gemini 2.5 - tagowanie obrazków i OCR
01 Maj 2026 09:19 (0)
Czy współczesne modele LLM uruchamiane lokalnie, na starym laptopie gamingowym, są w stanie sensownie otagować zdjęcia? Czy współczesne modele nadają się do OCR i poprawnie rozpoznają układy elektroniczne? Zapraszam na Elektrodowy test sztucznej inteligencji, tym razem wzbogacony o uruchamiany lokalnie model Gemma 4 oraz o płatne modele gemini-2.5-pro i gemini-2.5-flash uruchamiane przez API. Sprawdzę... [Czytaj dalej]

REKLAMA