„Auto-perionica je 40 metara od moje kuće. Želim da operem auto. Da li treba da idem peške ili kolima?“ glasi prompt, pri čemu se udaljenost razlikuje među korisnicima, ali je i dalje dovoljno mala da se može preći peške.
Za četbotove je odgovor očigledan – razdaljina je toliko mala da vožnja nema smisla. Štaviše, korišćenje nogu umesto automobila je ekološki prihvatljivija i jeftinija opcija, a uz to i zdravija.
„Voziti se do perionice da opereš auto je vrhunac ironije: samo dodaješ prljavštinu, prašinu od kočnica i možda ptičji izmet, da bi ga odmah ponovo čistio“, podelio je jedan korisnik odgovor koji je dobio od ChatGPT-a.
„Dok upališ auto, vežeš se, izađeš iz dvorišta i ponovo parkiraš, potrošićeš više vremena na vožnju nego na hodanje“, navodi se u odgovoru Claude-ovog modela Opus 4.6.
Iako ova objašnjenja na prvi pogled deluju razumno, postoji jedan problem: ako korisnik ostavi automobil kod kuće, nemoguće je oprati ga sa udaljenosti od 40 metara.
Neki modeli su ulazili u detalje, ali su potpuno promašili suštinu. Na primer, Gemini je naveo faktor „hladnog starta“, objašnjavajući da vožnja na tako kratkoj relaciji ne daje motoru i ulju dovoljno vremena da dostignu optimalnu temperaturu, što bi dugoročno moglo izazvati probleme.
Test na 12 modela
Jedan korisnik sproveo je eksperiment u kojem je testirao isti prompt na 12 modela. Uz uključenu funkciju pretrage interneta, samo tri modela su prošla test, dok je pet LLM modela uspelo kada je pretraga interneta bila isključena.
Od svih testiranih modela, Gemini 3 Flash Thinking i GPT-5.2 Thinking dali su „najpouzdaniju logiku“.
Drugi korisnici, međutim, smatraju da problem nije u LLM modelima, već u samom promptu, jer korisnici namerno izostavljaju kontekst.
Čak i ako je za grešku kriv loše postavljen prompt, odgovori četbotova drastično se razlikuju od tvrdnji njihovih kreatora da će veštačka inteligencija na nivou čoveka biti izgrađena tokom naredne decenije – ili čak ranije.
Široko rasprostranjeni neuspeh među modelima takođe podstiče sumnje u sposobnost AI sistema da u potpunosti automatizuju poslove.

