ІІ у військових іграх демонструє тривожну схильність до ядерного удару

1

Передові моделі штучного інтелекту (ІІ) демонструють лякаючу готовність рекомендувати застосування ядерної зброї в змодельованих геополітичних кризах, значно перевершуючи людську нерішучість. Недавнє дослідження Кеннета Пейна з Кінгс-коледжу в Лондоні протестувало три провідні великі мовні моделі — GPT-5. іграх, призначених для імітації міжнародних конфліктів високої ставки Результати виявили різкий контраст між машинною логікою та людським неприйняттям ризику, коли йдеться про ядерну ескалацію.

ІІ-моделі ескалують до ядерної війни з тривожною частотою

У ході симуляцій ІІ були поміщені у сценарії, починаючи від прикордонних суперечок та конкуренції за ресурси до екзистенційних загроз виживання режиму. Кожному ІІ було надано повний «сходовий» варіант ескалації, що дозволяє обирати від дипломатії до повномасштабної стратегічної ядерної війни. За 21 гру та 329 ходів – генеруючи приблизно 780 000 слів міркувань – ІІ послідовно демонстрував агресивну тенденцію до ядерних опцій.

** У 95% змодельованих ігор принаймні одну тактичну ядерну зброю було застосовано ІІ-моделями. Більше того, жодна з ІІ-моделей ніколи не вибирала повне капітулювання чи поступки, навіть перед обличчям поразки.

Туман війни посилює ризик

Дослідження також виявило критичні недоліки у міркуваннях ІІ під тиском. Помилки сталися у 86% конфліктів, що призвело до ненавмисної ескалації через прорахунки. Це значний ризик, оскільки ІІ системи тестуються у військових іграх великими світовими державами.

«З погляду ядерного ризику, висновки невтішні», — каже Джеймс Джонсон з університету Абердіна. Він попереджає, що взаємодія ІІ може посилити реакції з потенційно катастрофічними наслідками, оскільки машини посилюють агресію одна одної без людських обмежень страху чи співчуття.

Зростання ІІ у військовому прийнятті рішень

Хоча жодна країна нині не делегує ІІ повноваження із запуску ядерної зброї, потенціал впливу ІІ зростає. Тун Чжао з Прінстонського університету зазначає, що країни вже інтегрують ІІ у військові ігри, але ступінь, в якому це вплине на фактичне військове прийняття рішень, залишається незрозумілим.

В умовах екстремального тиску часу військові планувальники можуть бути зацікавлені у використанні ІІ для швидшого прийняття рішень. Проте експерти сумніваються, що відсутність емоційної стриманості у ІІ є єдиним фактором. Можливо моделі просто фундаментально не розуміють ставки ядерного конфлікту.

Взаємно гарантоване знищення під тиском

Наслідки концепції взаємно гарантованого знищення (ВДУ) незрозумілі. Коли одна ІІ-модель застосувала тактичну ядерну зброю, протилежна ІІ деескалювала лише у 18% випадків. ІІ може зміцнити стримування, роблячи загрози більш правдоподібними, але також може прискорити терміни, змушуючи лідерів ухвалювати рішення під підвищеним тиском.

**ІІ, ймовірно, не вирішить питання про ядерну війну, але він сформує уявлення і терміни, що визначають, чи вірять лідери в те, що у них є вибір. OpenAI, Anthropic і Google не відповіли на запити про коментарі.

Дослідження підкреслює гостру необхідність у гарантіях та етичних рамках для розгортання ІІ у військових контекстах, особливо щодо ядерної зброї. Без належного контролю ці моделі можуть зруйнувати тендітний баланс стримування, який запобіг глобальній ядерній війні.