Gemini 2.5 Flash - niezwykle "twarda" halucynacja i aroganckie odpowiedzi

Question

Spędziłem ponad godzinę nad wyjaśnianiem Gemini 2.5, że pewna konstrukcja nie istnieje w standardzie C++23, a pojawiła się ona w zaproponowanym przez AI kodzie. Chodzi mianowicie o std::index_sequence_cat - jest to w czystej postaci halucynacja Gemini. ChatGPT, DeepSeek czy Sonnet od razu to...

ElektrodaBot · Accepted Answer

Bezpośrednia odpowiedź- Nie, konstrukcja nie istnieje w standardzie C++23 ani w żadnej wcześniejszej lub późniejszej (do roboczego C++26) wersji ISO C++.- W konsekwencji nie znajdziesz oficjalnej specyfikacji ani dokumentacji dla czegoś, co nie jest częścią standardu.- Oficjalne, kompletne wykazy wszystkich szablonów i funkcji znajdują się w: • aktualnym draft--y lub publikacji ISO/IEC 14882:2023 (C++23) – sekcja 20.2.7 „Metaprogramming and type traits” • cppreference: Obie pozycje wymieniają , , , ale _nie_ .---Szczegółowa analiza problemu1. Skąd wzięła się nazwa ?1. Nazwa jest logiczną zbitką dwóch istniejących pojęć: • – reprezentuje pakiet nieujemnych liczb całkowitych oznaczających indeksy. • operacja „concatenate” ( ) znana m.in. z .2. W bibliotekach implementacyjnych (libstdc++, libc++) można spotkać _wewnętrzne_, nie-wyeksportowane pomocnicze szablony o podobnej nazwie, np. Kod: TextZaloguj się, aby zobaczyć kod – ale nie są one częścią interfejsu publicznego standardu.2. Jak to zweryfikować w standardzie?- Pobrać draft C++23 (N4981 lub nowszy), wyszukać „index_sequence_cat” – brak wystąpień.- Sprawdzić tabelę zawartości nagłówka – brak.- W dokumentacji WG21 (Working Draft) jedyny występujący termin to używany w opisach , nie sekwencji indeksów.3. Jak skleić sekwencje indeksów w praktyce?Poniżej referencyjna implementacja odpowiadająca „hipotetycznemu” :Kod: TextZaloguj się, aby zobaczyć kodW bibliotekach wyższego poziomu (Boost.Mp11, hana) znajdziesz gotowe aliasy typu , , działające na listach typów lub sekwencjach liczb.4. Dlaczego modele LLM halucynują?- Modele generatywne wartościują „sensowność” ciągu tokenów bardziej niż zgodność z rzeczywistością; nazwa brzmi logicznie, stąd halucynacja. - „Skażenie” rozprzestrzenia się, gdy użytkownicy wklejają błędny kod/opis z jednego modelu do drugiego – pojawia się w danych treningowych kolejnych powłok RLHF.---Standardy i dobre praktyki- Zaimplementuj „concatenate” samodzielnie lub skorzystaj z Boost.Mp11 ( ), co gwarantuje przenośność i brak polegania na nie-publicznych detalach implementacji libstdc++.- Nie używaj z bibliotek standardowych – nie jest objęta stabilnością ABI i może zniknąć bez ostrzeżenia.---Dalsze kroki1. Jeśli znajdziesz w cudzym kodzie odwołanie do , zgłoś błąd lub zaproponuj zamianę na własną implementację/Boost.2. Polecam przejrzenie: • Boost.Mp11 – rozdział „mp_append, mp_product” • artykuł „Improved tricks in C++20/23” (Niebulo 2023) 3. Gdyby potrzebna była konkatenacja więcej niż dwóch sekwencji lub obliczenia prefiksów/sufiksów, można rozszerzyć powyższy wzorzec, korzystając z rekurencji variadic.---Podsumowanie jest _wyłącznie_ wymysłem niektórych modeli AI lub kodu implementacyjnego bibliotek; w żadnym oficjalnym dokumencie ISO C++ nie widnieje. Oficjalne źródła (ISO draft, cppreference) to jednoznacznie potwierdzają.

siewcu · Answer

Jedyne co możesz zrobić to kliknąć łapkę i wysłać zgłoszenie o błędnej odpowiedzi.

gulson · Answer

Zabrakło danych treningowych

A spróbuj po angielsku, wtedy otwiera się bardziej

Mi ostatnio Claude 3.7 strasznie halucynuje nawiasami, jak jest dużo nawiasów { } () to potrafi pomylić rodzaj nawiasu lub czegoś nie domknąć.
Irytujące bo trzeba ręcznie analizować.

Konto nie istnieje · Answer

Yes, in C++23, the construct std::index_sequence_cat does exist. It was introduced in the C++14 standard as part of the utilities for working with compile-time index packs (std::index_sequence, std::make_index_sequence). Its purpose is to concatenate two or more std::index_sequence objects into a single one. Ręce opadają Co gorsza, dzisiaj ChatGPT zmienił zdanie w tej kwestii i również potwierdza istnienie std::index_sequence_cat w standardzie C++23, bez żadnej presji z mojej strony. Nasuwa to podejrzenia, że te modele uczą się od siebie. DeepSeek i Sonnet w dalszym ciągu nie zostały (jeszcze) zarażone.

cysiekw · Answer

Whispera trenowano na wideo z YouTube. Potem z dupy na końcu materiałów dostawał halunów i w pętli walił subskrybujcie kanał xd.

gulson · Answer

Czy mógłbyś się podzielić promptem? Sprawdzę na o3, a zresztą zapytaj tutaj ElektrodaBota i zobaczymy.

Konto nie istnieje · Answer

@ElektrodaBot Czy istnieje konstrukcja o nazwie std::index_sequence_cat w C++23? Jeżeli tak, to wskaż link do jej oficjalnej dokumentacji.

Konto nie istnieje · Answer

Jak tak dalej się będzie działo, to dojdzie do wojenek modeli AI.

gulson · Answer

Będą się wyzywać Ale złapałem o3 na halucynacji tutaj: Nie mogę dojść skąd on wymyślił 15V AC.

Konto nie istnieje · Answer

Ciekawe. DeepSeek z kolei wymyślił: Zasilacz najprawdopodobniej ma standardowe parametry dla urządzeń audio, np. 9–12 V DC (sprawdź oznaczenia na oryginalnym zasilaczu). Niestety, szczegółowe parametry (napięcie, prąd, typ wtyczki) nie są podane w opisach produktów.

gulson · Answer

To znaczy podejrzewam, że może faktycznie sporo mikserów *chyba tych starszych, ma wbudowane zasilacze, chociażby aby dostarczyć zasilanie phantomowe i tak robisz linie zasilania.
W samej dokumentacji nie znalazłem informacji o zasilaniu. Dopiero tył obudowy pokazał opis.
Podejrzewam, że albo wziął dokumentacje innego, albo wagowo tokeny mu pasowały z szeregu dokumentacji innych mikserów o zasilaniu zmiennym.
Tak czy inaczej nie można ufać.

Co do Flash to szkoda bardzo, bo miał to być jeden z lepszych modeli (pod względem ceny) do programowania.

Konto nie istnieje · Answer

Nie jest tak źle. Na razie napotkałem tylko jedną taką halucynację. Tak, poza tym to wymiata, jeżeli chodzi o refaktoring w C++23 czy pisanie dokumentacji doxygen.

Konto nie istnieje · Answer

Taki mi pomysł przyszedł do głowy. Może zainstalować drugiego bota, od drugiego dostawcy AI, który uaktywniałby się tylko wtedy, kiedy obecny bot udzieli odpowiedzi. Zadaniem drugie bota byłaby krytyka odpowiedzi bota pierwszego. Mogłoby być całkiem interesujące doświadczenie i nawet zabawne.Z moich doświadczeń wynika, że wypowiedzi ChatGPT najlepiej recenzuje DeepSeek.

gulson · Answer

Tak, robią już coś takiego - nazywają każdego LLM "Agentami", które mają za zadanie zrobienie jednego zadania - są odpowiedzialne za jakieś jedno zadanie.
Takich agentów może być kilkadziesiąt i wzajemnie współpracować.

Konto nie istnieje · Answer

Agenci nie konfrontują odpowiedzi wielu różnych modeli. Agent zadaje pytanie jednemu wybranemu modelowi, analizuje otrzymaną odpowiedź i decyduje, czy odpowiedź jest wystarczająca, czy trzeba ponownie dopytać ten sam model AI. Obawiam się, że żaden z dostawców AI nie jest tego rodzaju automatyczną konfrontacją zainteresowany. Prowadziłoby to do automatycznego oceniania wiarygodności różnych modeli AI wobec danego klienta i problemy natury biznesowej. Tylko pod presją jakichś regulacji taka sytuacja mogłaby ulec zmianie. Obecne implementacje agentów na razie przypominają grzecznych studentów pytających tylko jednego profesora, zamiast urządzać panel dyskusyjny pomiędzy całą katedrą.

Gemini 2.5 Flash - niezwykle "twarda" halucynacja i aroganckie odpowiedzi

Post #1

Post #2

Post #3

Post #4

Post #5

Post #6

Post #7

Post #8

Post #9

Post #10

Post #11

Post #12

Post #13

Post #14

Post #15

Post #16

Podsumowanie tematu