[Из песочницы] Цензурирование китайского интернета

Привет, Хабр! Представляю вашему вниманию перевод статьи «Learning China«s Forbidden History, So They Can Censor It».

Тысячи низкооплачиваемых работников на так называемых «фабриках цензуры» прочесывают онлайн-мир на предмет запрещенного контента, где даже фотография пустого стула может вызвать большие проблемы.

dgwegzkiwtrygojxp1jxu2kcsxm.png

Ли Чэнчжи (Li Chengzhi) было чему поучиться, когда он впервые устроился на работу в качестве профессионального цензора. Как и многие молодые люди в Китае, 24-летний выпускник колледжа мало что знал о событиях на площади Тяньаньмэнь (Tiananmen) в 1989 году. Он никогда не слышал о самом знаменитом китайском диссиденте Лю Сяобо (Liu Xiaobo), лауреате Нобелевской премии мира, который умер, находясь под стражей, два года назад.

Теперь, после определенного периода обучения, он знает, что искать и что блокировать. Он часами просматривает онлайн-контент для китайских медиа-компаний, ищущих что-либо, что может вызвать гнев правительства. Он знает, как определять кодовые слова, которые косвенно относятся к китайским лидерам и скандалам, или мемы, которые затрагивают темы, о которых китайское правительство было бы непротив умолчать.

Г-н Ли, на лице которого все еще видны следы от прыщей, серьезно относится к своей работе. «Я помогаю очищать онлайн пространство» — говорит он.

Для китайских компаний очень важно «быть на короткой ноге» с правительственными цензорами. В дополнение к этому, власти требуют, чтобы компании подвергали себя самоцензуре, стимулируя их таким образом нанимать тысячи людей для контроля контента.

Это, в свою очередь, создало новую растущую и прибыльную индустрию: фабрики цензуры.

Г-н Ли работает в пекинской компании Beyondsoft, занимающейся техническими услугами, которая, помимо всего прочего, берет на себя тяготы цензурирования других компаний. Он работает в офисе, в городе Чэнду (Chengdu), расположенном в самом сердце высокотехнологичной промышленной зоны, в достаточно новом и светлом офисе, который напоминает офисы хорошо финансируемых стартапов в таких технологических центрах, как Пекин и Шэньчжэнь (Shenzhen). Они недавно переехали сюда, потому что заказчики жаловались на то, что их предыдущий офис был слишком тесен, для того, чтобы их сотрудники могли качественно выполнять свою работу.

«Всего одно маленькое упущение может привести к серьезной ошибке» — говорит Ян Сяо (Yang Xiao), глава подразделения интернет-услуг и анализа контента Beyondsoft. (Beyondsoft отказывается афишировать, на какие китайские СМИ или онлайн-компании работает, ссылаясь на политику конфиденциальности).

Китай создал самую обширную и сложную в мире систему онлайн-цензуры. Эта система стала еще сильнее при президенте Си Цзиньпине (Xi Jinping), который хочет, чтобы интернет играл более важную роль в укреплении влияния Коммунистической Партии. Все больше контента попадает в категорию сомнительного, а наказания становятся все более суровыми.

После тщательной проработки вопросов контроля, Китай теперь проповедует политику Интернета, контролируемого правительством. Даже такие традиционные оплоты свободы слова, как Западная Европа и США, рассматривают свои собственные меры по ограничению цифрового пространства. Такие платформы, как Facebook и YouTube, заявили, что они будут нанимать тысячи людей, чтобы лучше контролировать контент. Такие работники, как г-н Ли, демонстрируют крайности данного подхода, контролирующего то, что каждый день видят более 800 миллионов интернет-пользователей Китая.

В Beyondsoft, на фабриках по анализу контента, работают более 4000 человек (по сравнению с примерно 200 в 2016 году). Они просматривают и проверяют контент днем ​​и ночью.

«Мы — Foxconn в индустрии данных» — говорит г-н Ян, сравнивая свою фирму с крупнейшим контрактным производителем, который штампует айфоны и другие продукты для Apple.

Многие онлайн медиа компании имеют свои собственные внутренние группы по анализу контента, количество которых порой исчисляется тысячами. Они изучают способы внедрения искусственного интеллекта для автоматизации и ускорения работы. Глава AI лаборатории крупной интернет-медиа-компании, пожелавшей остаться неизвестной, сказал, что компания разработала около 120 моделей машинного обучения.

Но успех непостоянен. Пользователи могут легко обмануть алгоритмы. «Алгоритмы искуственного интеллекта достаточно сообразительны, но не до такой степени, как человеческий мозг » — сказал Ли. «Они пропускают много вещей при просмотре контента».

У Beyondsoft имеется команда из 160 человек в Чэнду, работающих четыре смены в день, просматривающих потенциально неприемлемый контент в приложении агрегирования новостей.

Для того же приложения у Beyondsoft есть другая команда в западном городе Сиань (Xi«an), которая фильтрует потенциально оскорбительный и пошлый контент. Как и в остальной части мира, интернет в Китае изобилует порнографией и другими материалами, которые многие пользователи сочли бы неподобающими.

В офисе Чэнду работники должны оставлять свои смартфоны в специальных шкафчиках, в коридоре. Им также запрещается делать скриншоты или отправлять какую-либо информацию со своих компьютеров.

Почти все работники — выпускники колледжа в возрасте от 20 лет. В большинстве своем они не интересуются политикой, или попросту безразличны к ней. В Китае многие родители и учителя говорят молодежи, что забота о политике ведет к одним неприятностям.

Для решения этого вопроса г-н Ян и его коллеги разработали комплексную систему обучения. Новые сотрудники начинают с недельного «теоретического» обучения, во время которого старшие сотрудники обучают их работе с конфиденциальной информацией, которую они не могли знать ранее.

«Мой офис находится рядом с большой комнатой для обучения» — говорит г-н Ян. «Я частенько слышу возгласы удивления, доносящиеся оттуда». «Они порой не знают даже таких вещей, как 4 Июня», — добавил он, говоря о событии на площади Тяньаньмэнь (Tiananmen) в 1989 году.

Beyondsoft разработала обширную базу данных, основанную на такой информации, которую г-н Ян называет одной из своих «ключевых компетенций». Компания также использует антицензурное программное обеспечение для регулярного посещения запрещенных веб-сайтов, заблокированных правительством Китая. После этого база данных обновляется. Новые сотрудники изучают эту базу данных так же тщательно, как при подготовке к вступительным экзаменам в колледж. После двух недель изучения они проходят тест.

Заставка на каждом компьютере одинаковая: фотографии и имена нынешних и бывших членов Постоянного Комитета Политбюро, высшего руководства Коммунистической Партии. Работники должны запомнить эти лица: только государственные веб-сайты и получившие специальное одобрение политические блоги — так называемый «белый список» — могут публиковать фотографии высших руководителей.

В начале смены работников информируют о последних инструкциях по цензурированию, отправленных заказчиками, которые в свою очередь, получают их от государственных цензоров. Затем работники должны ответить на 10 вопросов, предназначенных для проверки их памяти. Результаты таких проверок влияют на размер их заработной платы.

Вот пример одного из таких вопросов: Какое из следующих имен является именем дочери Ли Пэна (Li Peng), бывшего премьер-министра Китая? Правильный ответ — Ли Сяолинь (Li Xiaolin) — давняя мишень онлайн-насмешек за ее предпочтения к дорогим модным вещам и за то, что она является одной из многих детей высокопоставленных чиновников, занимающих высокие должности.

Это относительно легкий вопрос. Более сложные вопросы заключаются в разборе окольных путей, с помощью которых китайские интернет-пользователи избегают жесткой цензуры, чтобы просто поболтать о житейских делишках.

Возьмем, к примеру, комментарий гонконгского новостного сайта 2017 года, в котором сравнивались шесть китайских лидеров времен Мао Цзэдуна (Mao Zedong) и императоры времен династии Хань (Han). Некоторые китайские пользователи начали использовать имена императоров, говоря о политических лидерах. Работники Beyondsoft должны были точно знать, какое имя императора связано с определенным именем лидера.

Здесь нашлись даже фотографии пустого стула. Это отсылки к г-ну Лю (Liu) — лауреату Нобелевской премии, которому не разрешили покинуть Китай для участия в церемонии награждения, вследствие чего, его представлял пустой стул. Ссылки на роман Джорджа Оруэлла »1984» также находятся под запретом.

Программное обеспечение Beyondsoft просматривает веб-страницы и помечает потенциально оскорбительные слова разными цветами. Таким образом, если страница полна слов с цветовой маркировкой, то требуется более внимательно ее изучить. Наличие только одного или нескольких помеченных слов допускается.

Согласно веб-сайту Beyondsoft, служба мониторинга контента Rainbow Shield собрала более 100 000 основных «щекотливых» слов и более трех миллионов их производных. Политически некорректные слова составляют одну треть от общего количества, затем идут слова, связанные с порнографией, проституцией, азартными играми и ножами.

Работники вроде г-на Ли, зарабатывают от 350 до 500 долларов в месяц, что является среднем уровнем заработной платы в Чэнду. Предполагается, что каждый работник в течение смены просматривает от 1000 до 2000 статей. Статьи, в приложениях просмотра новостей, должны быть одобрены или отклонены в течение часа. В отличие от работников Foxconn, они не работают сверхурочно, потому что переработка может повредить точности проверки, говорит г-н Ян — исполнительный руководитель.

Допустить ошибку бывает довольно легко. В одной статье о Пэн Лиюань (Peng Liyuan), первой леди Китая, по ошибке была использована фотография известной певицы, которая, по слухам, была связана с другим политическим лидером. По словам г-на Яна, ошибка была найдена кем-то еще, до того, как статья была опубликована.

Г-н Ли говорит, что почти все худшие ошибки были связаны с информацией о высших руководителях. Однажды он пропустил крошечную фотографию г-на Си (Xi) на веб-сайте, не входящем в белый список, т.к. очень устал. Он до сих пор винит себя за эту оплошность.

Когда его спросили, поделился ли он с семьей и друзьями тем, что ему удалось узнать, например, новостями о событиях на площади Тяньаньмэнь, г-н Ли яростно ответил категорическим «нет». «Эта информация не предназначена для посторонних людей», — говорит он. «Это может породить слухи, как только люди об этом узнают».

Но жестокие преследования являются историческими фактами. Это не было слухами. Как он примиряет все это в своей голове? «Для определенных вещей, — говорит он — нужно просто соблюдать правила».

© Habrahabr.ru