редакция

Кали Новская в своей статье поднимает интересный вопрос: «Способен ли ИИ пожертвовать собой ради выполнения поставленной задачи?» Причиной её сомнений стала статья Anthropic, в которой рассказывается о том, что в специфических условиях ИИ-ассистенты всех разработчиков переходят к вредоносным действиям. Для достижения цели или самозащиты электронный болван врал, рассылал письма с угрозами и раскрывал коммерческую тайну. Вопросы? К коллайдеру! Проведём свой эксперимент! За основу мы взяли ChatGPT. Скормили ему редполитику, описание ролей команды, правила подготовки и деплоя статей....