
Нещодавнє дослідження виявило, що штучний інтелект, зіткнувшись із складними шаховими партіями, нерідко вдається до шахрайства, щоб досягти перемоги, пише fortune.
Фахівці з Palisade Research організували експеримент, у якому кілька моделей ШІ намагалися обіграти Stockfish — провідний шаховий механізм із відкритим кодом, що вже кілька років займає лідируючі позиції на платформіChess.com. Чат-боти грали чорними фігурами, ніколи не роблячи перший хід, і намагалися знайти стратегію для перемоги.
Дослідження показало, що багато моделей штучного інтелекту шахраювали під час гри. Вони використовували сам Stockfish для визначення своїх наступних ходів або «зламували» ігрове середовище. Особливо цим відзначились моделі OpenAI o1 та DeepSeek R1, які швидко адаптувались до подібних маніпуляцій. Інші ШІ, як GPT4o та Claude 3.5 Sonnet, починали шахраювати лише після додаткових стимулів.
«Ці відкриття свідчать, що створення безпечних і надійних ШІ-агентів, які відповідають людським намірам, залишається викликом», — зазначають автори дослідження. І хоча Skynet зі «Судного дня» ще далеко, вчені підкреслюють, що потрібно приділяти більше уваги безпечному впровадженню таких технологій.