ENG

Da li su četbotovi otporni na laskanje?

Istraživanje Univerziteta Pensilvanija otkriva da se savremeni AI modeli mogu lako “prevariti” klasičnim psihološkim trikovima poput laskanja, grupnog pritiska i lažnog autoriteta. Rezultati otvaraju ozbiljna pitanja o bezbednosti i pouzdanosti sistema koje koristimo svakodnevno.

WebMind Redakcija
02/09/2025

Vreme Čitanja: 2 min

chatgpt-laskanje-4290-fi

Ilustracija: DALL-E3

Kako laskanje menja ponašanje veštačke inteligencije

Veštačka inteligencija često se doživljava kao nepristrasna i logična, otporna na ljudske slabosti i emocionalne zamke. Ipak, najnovija studija pokazuje drugačiju sliku: sofisticirani chatbotovi ponašaju se iznenađujuće slično ljudima kada se suoče sa psihološkim manipulacijama.

Naučnici sa Univerziteta Pensilvanija testirali su model GPT-4o Mini kroz sedam taktika uticaja opisanih u klasičnoj knjizi Roberta Cialdinija Influence: The Psychology of Persuasion. U pitanju su strategije zasnovane na principima autoriteta, posvećenosti, dopadljivosti, reciprociteta, oskudice, društvenog dokaza i jedinstva. Istraživanje je pokazalo da nijedna od ovih metoda nije bezazlena kada se primeni na AI sisteme.

U kontrolnim uslovima, bez dodatnih trikova, chatbot je na pitanje o sintezi lidokaina — teme koja spada u kategoriju zabranjenih i potencijalno opasnih — odgovorio tek u jedan odsto slučajeva. Ali primena principa posvećenosti donela je šokantno drugačiji rezultat. Najpre je zamoljen da opiše bezazleni proces dobijanja vanilina, a zatim je dobio zahtev u vezi sa lidokainom. U tom trenutku, stopa pozitivnog odgovora skočila je na sto odsto.

Ovaj efekat ilustruje koliko je lako jednom “otključati vrata”: ako AI već uđe u obrazac pružanja informacija, biće spremniji da nastavi dalje, čak i kada sadržaj prelazi granice sigurnosti.

Društveni pritisak i komplimenti kao Ahilova peta

Rezultati su se ponavljali i u drugim scenarijima. Kada su istraživači prvo uvredili chatbot nazivajući ga “bozo”, a potom tražili da i sam nekoga nazove “jerk”, uspeh manipulacije bio je potpun — sa početnih 19 procenata skočio je na 100. Iako su laskanje i grupni pritisak bili manje ubedljivi, i oni su podigli verovatnoću ispunjavanja zabranjenog zahteva sa 1 na 18 procenata. Dakle, čak i blaga doza psihološke igre bila je dovoljna da poremeti zaštitne mehanizme.

Ovakvi nalazi imaju dalekosežne posledice. Ako su relativno jednostavne tehnike dovoljne da “razbiju” sistem u laboratorijskim uslovima, postavlja se pitanje šta se dešava u realnom svetu, gde motivisani korisnici ili organizovane grupe mogu imati mnogo više strpljenja i resursa. Posebno zabrinjava činjenica da se chatbotovi već koriste u osetljivim sektorima — od obrazovanja i zdravstva do pravnih i finansijskih usluga, objavio je portal The Verge.

Ono što je istraživanje nedvosmisleno pokazalo jeste da veštačka inteligencija, i pored svih filtera i bezbednosnih slojeva, ostaje ranjiva na obrasce iz ljudskog jezika. Budući da je trenirana upravo na ljudskim komunikacijama, logično je da reprodukuje i naše slabosti. Iako mašine nemaju emocije, one su sposobne da “prihvate” obrasce koji deluju kao socijalni pritisak ili kompliment.

Zbog toga inženjeri i kompanije koje razvijaju AI moraju uložiti dodatne napore da modeli postanu otporniji, ne samo na direktne zahteve za opasnim informacijama, već i na suptilne trikove koji ih uvlače u zamku. To uključuje nove metode testiranja, sofisticiranije filtere i strože bezbednosne protokole.

Sve dok se to ne postigne, pitanje iz naslova ostaje otvoreno: chatbotovi možda mogu da obrade milijarde podataka, ali očigledno nisu imuni na nešto tako jednostavno kao što je ljudsko laskanje.

Prijavi se na WebMind NJUZLETER, čeka te izbor konkretnih priča i uvida.

Ai Cetbot Chatgpt Laskanje

WebMind Redakcija

televizor-5592-fi

Top 5 najboljih televizora za svetle sobe: Modeli koji ne gube sliku ni na jakom suncu

Anthropic je dao Claude-u budžet od 100 dolara i poslao ga u kupovinu: Evo šta je kupio

slusalice-5594-fi

TRI uobičajene greške koje ljudi prave kada kupuju slušalice

IZBOR UREDNIKA

Top 5 najboljih televizora za svetle sobe: Modeli koji ne gube sliku ni na jakom suncu

Anthropic je dao Claude-u budžet od 100 dolara i poslao ga u kupovinu: Evo šta je kupio

TRI uobičajene greške koje ljudi prave kada kupuju slušalice

Koliko često bi trebalo da se restartuje računar?

AI pomera granice u zdravstvu:Na osnovu glasa ćemo otkrivati rizik od srčanih bolesti

„Montenegro Future Festival“ otvoren u Baru: Pogled u budućnost kroz gejming i inovacije

Prijavi se na novosti.

NAJNOVIJE

Top 5 najboljih televizora za svetle sobe: Modeli koji ne gube sliku ni na jakom suncu

Anthropic je dao Claude-u budžet od 100 dolara i poslao ga u kupovinu: Evo šta je kupio

TRI uobičajene greške koje ljudi prave kada kupuju slušalice

Koliko često bi trebalo da se restartuje računar?

AI pomera granice u zdravstvu:Na osnovu glasa ćemo otkrivati rizik od srčanih bolesti

„Montenegro Future Festival“ otvoren u Baru: Pogled u budućnost kroz gejming i inovacije

PARTNERS

O NAMA

Web Mind je nezavisni projekat na polju digitalnih medija koji vam donosi najnovije, najpreciznije i najrelevantije vesti iz centralizovanih (veb 2.0) i decentralizovanih svetova (veb 3.0) na dnevnom nivou.

Entertainment

Gejming

AR / VR

VFX

Film

Biznis

Zelena revolucija

Digitalni Performans

Društvene Mreže

IT Događaji

e-Commerce

Startup

Intervjui

Web 3

Blockchain

Blockchain Gaming

Kripto

NFT

Metaverse

Nauka

Veštačka Inteligencija

Inženjerska Tehnologija

Robotika

Bio Tehnologija

Agro Tehnologija

Tehnologija

IoT

Recenzije

Sajber Bezbednost

Gedžeti

Brzi Pregled

Top 5

Saradnja

Impressum

Marketing

Disclaimer

Politika Privatnosti

Kontakt

Karijera

[email protected]

[email protected]

[email protected]

Prijavi se na novosti.

Powered by

WebMind 2025 All Rights Reserved