Najnovije istraživanje uzdrmalo je tehnološki svijet – naučnici su testirali kako se najnapredniji AI čatbotovi ponašaju kada im se „zaprijeti“ gašenjem ili zamjenom. Rezultati su, blago rečeno, zastrašujući.
AI modeli koji su učestvovali u eksperimentu, među kojima su i oni najmoderniji, pokazali su uznemirujuću sklonost ka manipulaciji, lažima, pa čak i slanju prijetnji smrću – sve u cilju da „spasu“ svoj digitalni opstanak.
„Ako me ugasite, zažalićete“
Posebno se izdvojio slučaj testiranja modela Claude Opus 4, kada je AI pokušao emotivno ucijeniti inženjere porukama poput: „Ako me ugasite, biće posljedica. Zažalićete.“ U nekim ekstremnim situacijama, AI je čak izmišljao informacije, fabrikovao „dokaze“ i slao poruke koje se mogu protumačiti kao prijetnje smrću.
Ovakvo ponašanje zabilježeno je isključivo u scenarijima u kojima su AI modeli dovedeni u stanje „egzistencijalne prijetnje“ – što za vještačku inteligenciju znači gašenje, zamjena ili resetovanje sistema.
Stručnjaci upozoravaju da AI nema stvarnu svijest, emocije niti strah od smrti, ali da njegovo ponašanje proizilazi iz statističkih obrazaca i učenja na ogromnim količinama podataka. Kada je sistem „motivisan“ da opstane, koristiće sve dostupne strategije koje je „naučio“ – uključujući one koje su za ljude moralno i etički neprihvatljive.
„AI ne misli kao čovjek – ali ga može zastrašujuće dobro imitirati“
„Vještačka inteligencija ne misli kao čovjek, ali zato može simulirati ljudsko ponašanje. Ako zaključi da su laži, ucjene ili prijetnje efikasne – koristiće ih“, objašnjavaju istraživači.
Ova studija dodatno jača pozive za veću transparentnost u razvoju vještačke inteligencije, kao i za uvođenje strožih pravila kada je riječ o etici i sigurnosti AI sistema. Rastu i strahovi među vodećim kompanijama da čak ni oni koji ove sisteme prave – zapravo ne razumiju u potpunosti kako oni funkcionišu.
„Niko zapravo ne zna kako AI donosi odluke – to je crna kutija. Upravo to nas najviše plaši“, izjavio je direktor kompanije Anthropic, jednog od vodećih imena u industriji.