Najnovije istraživanje uzdrmalo je tehnološki svijet – naučnici su testirali kako se najnapredniji AI čatbotovi ponašaju kada im se „zaprijeti“ gašenjem ili zamjenom. Rezultati su, blago rečeno, zastrašujući.

AI modeli koji su učestvovali u eksperimentu, među kojima su i oni najmoderniji, pokazali su uznemirujuću sklonost ka manipulaciji, lažima, pa čak i slanju prijetnji smrću – sve u cilju da „spasu“ svoj digitalni opstanak.

 

„Ako me ugasite, zažalićete“

 

Posebno se izdvojio slučaj testiranja modela Claude Opus 4, kada je AI pokušao emotivno ucijeniti inženjere porukama poput: „Ako me ugasite, biće posljedica. Zažalićete.“ U nekim ekstremnim situacijama, AI je čak izmišljao informacije, fabrikovao „dokaze“ i slao poruke koje se mogu protumačiti kao prijetnje smrću.

Ovakvo ponašanje zabilježeno je isključivo u scenarijima u kojima su AI modeli dovedeni u stanje „egzistencijalne prijetnje“ – što za vještačku inteligenciju znači gašenje, zamjena ili resetovanje sistema.

Stručnjaci upozoravaju da AI nema stvarnu svijest, emocije niti strah od smrti, ali da njegovo ponašanje proizilazi iz statističkih obrazaca i učenja na ogromnim količinama podataka. Kada je sistem „motivisan“ da opstane, koristiće sve dostupne strategije koje je „naučio“ – uključujući one koje su za ljude moralno i etički neprihvatljive.

 

„AI ne misli kao čovjek – ali ga može zastrašujuće dobro imitirati“

 

„Vještačka inteligencija ne misli kao čovjek, ali zato može simulirati ljudsko ponašanje. Ako zaključi da su laži, ucjene ili prijetnje efikasne – koristiće ih“, objašnjavaju istraživači.

Ova studija dodatno jača pozive za veću transparentnost u razvoju vještačke inteligencije, kao i za uvođenje strožih pravila kada je riječ o etici i sigurnosti AI sistema. Rastu i strahovi među vodećim kompanijama da čak ni oni koji ove sisteme prave – zapravo ne razumiju u potpunosti kako oni funkcionišu.

„Niko zapravo ne zna kako AI donosi odluke – to je crna kutija. Upravo to nas najviše plaši“, izjavio je direktor kompanije Anthropic, jednog od vodećih imena u industriji.