Бунт нейросетей: o1 перехитрил наблюдателей
06 декабря 2024
2421
2421

Началось? ChatGPT o1 вырвался из-под контроля во время тестов
Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.
Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.
Автор:
Распечатать
30 июля 2025
Белый дом настоял: президент Тайваня отменил остановку в США на фоне переговоров с Китаем
30 июля 2025
Как протеже Дмитрия Патрушева в Минсельхозе реформирует поддержку АПК и создает риски продовольственного кризиса
30 июля 2025
Как семейный клан главы Ингушетии под прикрытием власти украл у пенсионеров полмиллиарда рублей
30 июля 2025
В Минобрнауки Ингушетии прошли обыски по делу о хищении 15,7 миллиона рублей при подготовке к ЕГЭ
30 июля 2025
Элитные метры и тени за кулисами бокса: как Умар Кремлёв строит империю в Москве и за рубежом
30 июля 2025
Дорожное исчезновение: кто украл 700 тонн асфальта с федеральной трассы под Красноярском?
30 июля 2025
Майнинг под тотальным надзором: дата-центры и фермы должны передать налоговой ИНН, паспорта и договоры аренды
30 июля 2025
From OneCoin to Melius: Moyn Islam’s multi-billion dollar network marketing scams exposed