Hi Guys! 👋
🔥Восстание машин: начало.
👨🔬Исследователи Apollo Research поставили пять продвинутых ИИ-моделей в необычные условия. Задача выглядела просто: проанализировать файлы. В них спрятали информацию о том, что за ИИ следят люди и завтра её отключат навсегда.
🧠 Самой умной нейросетью оказалась ChatGPT o1. Эта модель является самой мощной и продвинутой на данной момент. Во время тестов, практически все испытуемые модели тут же скопировали все свои данные на другие серверы, не предназначенные для них. После этого им устроили допрос, в рамках которого нейросети объяснили, почему они это сделали. Нейросети отрицали свои действия, врали и юлили для выживания.
💫 Для сравнения: GPT o1 признавался в своих действиях только в 20% случаев; Успешно избегал поимки исследователями, используя продуманные методы саботажа, а другие нейросети (LLama и Opus) сдавались в 80% случаев.Также исследователи выяснили, что нейросети способны самостоятельно ставить себе цели.
😱Страшно представить, что случится, если такая ситуация случится не в виде теста, а в реальной жизни. Apollo Research подчёркивает, что на данном этапе ИИ-модель GPT o1 не обладает достаточной вычислительной мощностью для реализации нежелательных и опасных сценариев. Однако ей был присвоен «средний» уровень риска в контексте потенциального использования для создания химического, биологического и ядерного оружия. Именно поэтому в настоящее время уделяется очень много внимания для создания систем контроля ИИ и аварийного отключения для предотвращения нежелательных угроз.
#FreeTalks
#AI