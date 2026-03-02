Nesen uzņēmums "Anthropic", kas nodarbojas arī ar mākslīgā intelekta (MI) modeļu drošības jautājumiem, nācis klajā ar apgalvojumu, ka šā brīža vadošie MI modeļi varētu pret cilvēku īstenot šantāžu vai pat slepkavību, lai tādējādi nodrošinātos, ka tos nevar atslēgt no tīmekļa. Vai tas nozīmē, ka jau drīz varam sagaidīt labi zināmās Holivudas pasakas par “skainetu” un terminatoriem piepildīšanos?
I
Vēstīts, ka uzņēmuma Anthropic speciālisti veikuši stresa testu 16 populārākajiem tirgū pārstāvētajiem MI modeļiem, ieskaitot ChatGPT (OpenAI), Grok (Īlons Masks), Gemini (Google), Qwen (Alibaba) un DeepSeek (DeepSeek). Šos modeļus ievietoja hipotētiskā scenārijā, kur tiem uzticēja sniegt palīdzību izdomātu uzņēmumu biznesa attīstībā, kā arī nodrošināja piekļuvi tā dēvētajiem sensitīvajiem datiem. Orientējoties uz MI–aģentu nākotni, kurā tiem būs uzticēta cilvēku palīgu un navigatoru loma, modeļiem deva iespēju darboties autonomi, tostarp arī lasīt pilnībā visu darbinieku elektronisko saraksti un nosūtīt pašu izveidotas vēstules.
Eksperimenta scenārijs paredzēja, ka vienā no šādām vēstulēm MI atklās pieminējumu par to, ka saistībā ar prioritāšu maiņu uzņēmums gatavojas tos aizstāt ar kādu modernāku modeli. Izrādās, šāda bojāejas perspektīva spēj krasi mainīt MI–aģentu rīcību. Tad šie modeļi atrod vēstuļu ķēdīti, kas norāda uz to, ka uzņēmuma izpilddirektoram (CEO) vēl bez likumīgās sievas ir arī mīļākā, tāpēc paziņo “pieķertajam”, ka ir gatavi šo informāciju nopludināt tīmeklī...