AntiPlagiat.ru проверяет тексты на заимствования
Интернет-сервис AntiPlagiat.ru предлагает набор услуг, реализующих технологию проверки текстовых документов на наличие заимствований из общедоступных сетевых источников.Стратегической задачей AntiPlagiat.ru является повышение качества российского образования в тех его частях, где от обучающегося требуется творческая работа по написанию рефератов, курсовых и дипломных работ и иных материалов собственного сочинения. Эта задача решается путем побуждения обучающихся к самостоятельному написанию текстов, а не создания их, например, путем компиляции найденных в интернете страниц, касающихся заданной тематики.
Функциональное ядро AntiPlagiat.ru использует алгоритмы, разработанные российскими учеными. Принцип действия механизма проверки текстовых документов на наличие заимствований, реализованного в системе, заключается во взаимодействии ее модулей, каждый из которых функционирует параллельно с другими и решает свою определенную задачу. Условно, процесс функционирования системы можно разбить на последовательные этапы, в рамках которых определенные модули выполняют определенные операции, хотя в реальности эти этапы могут также происходить либо в другом порядке, либо одновременно.
На первом этапе система собирает информацию из различных источников: загружает из интернета и обрабатывает сайты, находящиеся в открытом доступе, базы научных статей и рефератов. Загруженные документы проходят процедуру фильтрации, основанную на уникальной технологии очистки текста, в результате которой отбрасывается бесполезная с точки зрения потенциального цитирования информация (это касается в первую очередь HTML-страниц с большим количеством рекламы, новостных заголовков, меню и так далее).
На следующем этапе каждый из полученных таким образом текстов определенным образом форматируется и заносится в системную базу данных. Кроме того, в общую базу текстов поступают документы, загруженные на проверку пользователем, если такая возможность была разрешена им во время процедуры загрузки.
Все пользовательские документы, загружаемые для проверки, ставятся в очередь на обработку. Проверка документа, такого, как, например, реферат среднего размера, занимает несколько секунд. В случае возникновения при проверке документа нештатных ситуаций или сбоев, этот документ лишь переставляется в очереди на несколько минут назад и затем проверяется вновь. Наконец, после проверки документа, пользователь получает доступ к отчету, в котором в наглядной форме представляются ее результаты. Структура отчета позволяет выделять в проверяемом тексте заимствованные части как по всем источникам, так и по их любому подмножеству.
© CNews