Студент создал приложение, которое отлавливает написанные ИИ тексты

Нашумевший ChatGPT способен на многое. Например, он может писать за учеников сочинения и эссе. Государственные школы Нью-Йорка уже запрещают учащимся и учителям использовать чат-бот с искусственным интеллектом. Но когда это мешало списывать? Тем более проверить, чем пользовались учащиеся при подготовке домашней работы, практически невозможно. Решение придумал Эдвард Тиан, 22-летний выпускник Принстонского университета. Он создал приложение, которое может определить, написан ли текст с помощью ChatGPT или его создал человек.

GPTZero в действии: бот правильно опознал текст, написанный ИИ. Здесь ChatGPT пытался написать «эссе об этике плагиата ИИ, которое могло бы пройти инструмент обнаружения ChatGPT»GPTZero в действии: бот правильно опознал текст, написанный ИИ. Здесь ChatGPT пытался написать «эссе об этике плагиата ИИ, которое могло бы пройти инструмент обнаружения ChatGPT»

В зимние каникулы Тиан не терял времени зря и создал GPTZero. Мотивацией для написания бота стала борьба с тем, что он считает ростом плагиата ИИ. С момента выпуска ChatGPT стали поступать сообщения о том, что учащиеся используют передовую языковую модель, чтобы выдавать задания, написанные ИИ, за свои собственные.

«Вокруг так много шумихи вокруг чата. И то, и это написано искусственным интеллектом? Мы, люди, заслуживаем знать правду!» — написал Тиан в твиттере,  представляя GPTZero.

Эдвард Тиан, 22-летний студент факультета компьютерных наук в ПринстонеЭдвард Тиан, 22-летний студент факультета компьютерных наук в Принстоне

После того, как 2 января он выпустил своего бота в сеть, с ним связались учителя и поделились положительными результатами проверок. Более 30 000 человек опробовали GPTZero в течение недели после запуска. Приложение оказалось настолько популярным, что вышло из строя от наплыва желающих. Streamlit, бесплатная платформа, на которой размещается GPTZero, решила поддержать начинание Тиана и​ ​предоставила больше памяти и ресурсов для обработки трафика.

Как работает GPTZero

Чтобы определить, написан ли отрывок искусственным интеллектом, GPTZero использует два показателя: «perplexity» (замешательство) и «burstiness» (порывистость). Замешательство измеряет сложность текста. Если GPTZero не до конца понимает написанное, значит, текст имеет высокую сложность и скорее всего написан человеком. А если текст более знаком боту — потому что он был обучен на подобных данных — тогда сложность будет считаться низкой и, следовательно, с большей вероятностью текст сгенерирован ИИ.

Второй показатель, порывистость, анализирует отдельные предложения. Люди склонны писать неравномерно: длинные предложения перемежаются короткими. Предложения ИИ имеют тенденцию к однородности, то есть все имеют примерно одинаковую длину.

В демонстрационном видео Тиан использовал своего бота для сравнения статьи в The New Yorker и сообщения LinkedIn, написанного ChatGPT. Бот успешно отличил авторство человека от ИИ.

Тиан признаёт, что его бот не на 100% надёжен, это подтверждают некоторые пользователи, протестировавшие ChatGPT. Но автор работает над улучшением точности модели.

Разоблачение ИИ

Тиан не одинок в борьбе с плагиатом и подлогами ИИ. Сам OpenAI, разработчик ChatGPT, заявил о своём стремлении предотвратить плагиат ИИ. В прошлом месяце Скотт Ааронсон, исследователь, занимающийся безопасностью ИИ в OpenAI, сообщил, что компания работает над возможностью нанесения «водяных знаков» на текст, сгенерированный GPT, то есть «незаметного секретного сигнала», который позволит идентифицировать источник текста.

Hugging Face (американская компания, разрабатывающая инструменты для создания приложений с использованием машинного обучения) выпустила инструмент,  позволяющий определить, был ли текст создан с помощью GPT-2, более ранней версии модели ИИ, на основе которой сделан ChatGPT. 

Сам Тиан не против использования инструментов ИИ, таких как ChatGPT. И GPTZero не предназначен для предотвращения использования подобных технологий. Однако он считает, что к любым новыми технологиям нужно подходить ответственно.   

© Habrahabr.ru