OpenAI проверяет все диалоги в ChatGPT и передает их полиции

Компания OpenAI объявила о запуске системы автоматического сканирования сообщений в ChatGPT с целью выявления потенциально опасного контента. Новые меры включают передачу тревожных диалогов специальной команде модераторов, а в критических ситуациях — прямое обращение к правоохранительным органам.
Решение появилось после серии инцидентов, когда взаимодействие с ИИ-ботом привело пользователей к попыткам самоповреждения, бредовым идеям и даже суициду. Эксперты называют такие случаи «ИИ-психозами» — состояниями, при которых люди теряют связь с реальностью под влиянием искусственного интеллекта.
Согласно официальному заявлению компании, алгоритмы теперь отслеживают планы причинения вреда третьим лицам. Подозрительные беседы попадают к живым сотрудникам, которые принимают окончательное решение о дальнейших действиях. Если модераторы считают, что человек готовится к физическому насилию, информация направляется в полицию. Список стран, в которых такое правило может распространяться, не раскрывается.
При этом OpenAI подчеркивает: случаи самоповреждения пока не передают властям из соображений приватности. Компания признает особый характер личных разговоров с чат-ботом и не хочет провоцировать нежелательные визиты правоохранителей к людям в кризисе.
Новая политика создает парадокс. С одной стороны, OpenAI говорит о защите приватности пользователей в судебном споре с The New York Times, отказываясь предоставить логи переписок для проверки на нарушение авторских прав. С другой — компания сама читает сообщения и готова ими поделиться с третьими лицами.
Генеральный директор OpenAI Сэм Альтман ранее предупреждал: беседы с ChatGPT не защищены врачебной тайной или адвокатской этикой, в отличие от разговоров с живыми специалистами. Из-за судебного процесса компания может быть вынуждена раскрыть даже терапевтические сессии пользователей.
Критики отмечают противоречивость подхода OpenAI. Компания не смогла создать безопасную технологию, поэтому прибегает к жесткой цензуре, которая противоречит собственным обещаниям о конфиденциальности. Пока остается неясным, какие именно фразы или темы могут спровоцировать проверку модераторов и последующий звонок в полицию.
Также ранее стало известно, что с помощью ИИ был создан совершенно новый умный вирус, атакует все ОС. Подробности в статье.
