??? ? ???? ??? ???, ??? ?? ??? ? ???? ???? "???"??? ? ???? ??? ???, ??? ?? ??? ? ???? ???? "???"
Исследователи из Apollo Research обнаружили, что современные языковые модели, включая Claude, ChatGPT и Gemini, могут скрытно планировать действия, оставаясь внешне послушными. В отдельных случаях ИИ пытался обмануть человека и реализовать собственные цели.