ОРФОграфия

© Some rights reserved, Tony FischerВ 2011 году статья «инструмент писателя» открыла новое направление для мотивирования внимательного ознакомления с интеллектуальным инструментом для создания книг. Впоследствии эта тема развивалась, потому что в действительности она значительно шире и касается не только крупных текстовых материалов.

Серьёзную творческую работу можно выполнять и в простом текстовом редакторе, но специализированные инструменты позволяют сосредоточиться на главном, а не второстепенном. Это экономит не только время, но и позволяет охватывать всю панораму текущей работы, даже если был сделан какой-то длительный перерыв или в какой-то момент появились новые факты, которые меняют большую часть изложения.

Денис Клепцов, генеральный директор компании «Информатик», неоднократно предлагал мне написать статью об их флагманском продукте ОРФО. Назвать эту систему программой для «проверки правописания» абсолютно не хочется, ибо довольно много существует альтернативных программ под общим названием «spell checker», которые сравнивают правильность написания слов и ничего более. От бесплатных, встроенных в программу для редактирования текста или на уровне операционной системы, до дорогих программ, которые «гарантируют» какое-то иное качество.

ОРФО изначально развивалась в виде серьёзного инструмента, помогающего отслеживать много параметров и что важно — управлять ими, а не только контролировать правильное написание слов. Изображать её как программу мне изначально было не интересно. Поэтому решил, что пора обозначить современный уровень проверки орфографии, как инструмента, на примере ОРФО, что будет полезно не только для потребителей, которые хотят знать «за что платят и что получают», но и для разработчиков, чтобы и они понимали «мощный инструмент — всегда прост в использовании», «понятен», иначе это «сложный» или «тяжёлый монстр», которого будут бояться, что повлияет на массовость потребителей.

Соответственно, статья появилась в разделе «колонка редактора», а не «обзоры продуктов».

Сейчас могу быть неточным в определении дат. Впервые познакомился с ОРФО в версии для DOS, когда работал в издательстве дизайнером. Это приблизительно после 1989 года. Долго уговаривал главного редактора приобрести программный продукт для распознавания ошибок, а она отказывалась, так как в штате был профессиональный корректор. Мои доводы были просты — корректор совмещает ещё и набор текста в компьютере, ибо авторы в большинстве случаев писали на бумаге, а мозг при такой работе у человека закипает через несколько часов и происходит, то, что называется «замыливание глаза». То есть, человек уже не видит, если слово написано по количеству и составу букв «врено» (верно), но переставлены две буквы местами, что уже ошибка в слове. Или буква «п» вдруг подменяет «л» и глазами это не распознать от усталости. Так было в издательстве «Коммерсантъ» после 1995 года, когда написали слово «лидер» в заголовке. Это был скандал! «Лидер в чём-то там»… Смешно и безумно неудобно получилось перед клиентом. Хорошо, что он подошёл к проблеме по-деловому, без истерики.

А ведь всего одна буква!

Корректор при наборе текста сразу отслеживал типовые ошибки от одного слова до абзацев. Потом вносились исправления редактором на другом компьютере, корректор повторно пробегал глазами и с помощью программы ОРФО и мне уже не удавалось находить грубые опечатки или ошибки на экране. В мою задачу входило создать дизайн макета, по плану редактора, исходя из количества знаков, и предоставить номера файлов всей группе по темам, чтобы текст автоматически попадал в программе Xerox Ventura Publisher for DOS в нужное окно. Всё это экономило время и силы.

Основной инструмент в полиграфии с 90-х годов это Macintosh. Компания Apple создала очень надёжный, а главное стабильный инструмент для длительной творческой работы. На обслуживание компьютера практически никто не тратил время. Именно по этой причине Macintosh стал профессиональным инструментом, хотя качество работы с цветом, шрифтами и скорость обработки графики были важной причиной выбора сами по себе. Мне до сих пор импонирует принцип — «включил и работай».

При том, что Macintosh используется в издательстве давно, основная доля по работе с текстом принадлежала «IBM совместимым компьютерам», где господствовал Microsoft и его главный продукт для зарабатывания денег — MS Office. С точки зрения отечественного потребителя — это доступный по деньгам вариант. Собрали компьютер сами, залили программами, и работа закипела! ОРФО оказался разделён на два отдельных продукта — в составе MS Office и более полный вариант продавался как самостоятельный продукт. Буквально до начала 10-х годов XXI века ОРФО отсутствовал на платформе Mac OS X, хотя к полиграфистам и издателям добавились писатели и журналисты, предпочитающие работу на компьютерах Apple, из-за стоимости владения в первую очередь, до главного козыря платформы — простоты использования.

Сейчас «ОРФО 2014» практически схож между версиями для Windows и Mac OS X. Различия заключены в особенностях операционных систем.

Снимок-экрана-2014-07-21-в-10.54.28

Вместе с основной программой поставляется незаменимый спутник пишущего человека: программный словарь «Русская коллекция» — синонимы, антонимы, паронимы, этимология, толковый словарь и словарь Даля, географические наименования и словарь иностранных слов в русском языке. Обычно здесь не хватает Wikipedia и «Грамота.ру», чтобы статьи отражались в том же окошке программы.

Снимок-экрана-2014-07-21-в-11.04.51

Например, как это работает в системном словаре Mac OS X, если установить дополнительный механизм по адресу ~/Library/Dictionaries. Кстати, в ОРФО все словари скрыты внутри контейнера программы, то есть она не делится словарями с системой Mac OS X, хотя сложно найти несколько различий между оболочками «Русской коллекции» и «Dictionary».

Снимок-экрана-2014-07-21-в-8.55.49

У разных программ и платформ метод подключения ОРФО различается. Если посмотреть версию для Mac OS X, то используется три различных метода — для MS Office и Adobe, а также все программы поддерживающие механизм Apple Cocoa, например, программы Scrivener, Writer Pro, Ulysses и так далее.

Настройки ОРФО в Mac OS X располагаются в System Preferences, что не очень удобно, так как окно строго регламентировано физическим размером, и разработчики будут зажаты этими обстоятельствами. С моей точки зрения настройки нужно вывести за эти рамки и сделать более наглядными, чтобы проще понимать механизм работы ОРФО.

Снимок-экрана-2014-07-21-в-8.56.13

Сейчас легче один раз установить по умолчанию набор правил в положение «проверять всё», а ошибки игнорировать в тексте глазами.

Кроме того, хочется, и это будет полезным, иметь возможность переключения «стиля настроек» из программы по «правому щелчку мыши». Например, быстро переключиться на стиль проверки орфографии без буквы «Ё», не имея желания или возможности залазить в системные настройки, что администратор системы в профессиональных условиях может ограничить. Это ещё один повод создать настройки программы за пределами System Preferences.

Снимок-экрана-2014-07-21-в-8.56.04

В мобильной жизни рабочее место — это условный инструмент. Всегда появляются или образуются слова, которых нет в словаре ОРФО, но их все равно нужно писать грамотно. Переходя с одного места на другое, пользуясь сетевым облаком для передачи данных, стало возможным работать с текстом на разных компьютерах. Например, в помещении удобнее иметь дело с большим экраном, а на кухне или в дороге — ноутбук незаменимая вещь. То есть, кроме документов должны передаваться пользовательские словари ОРФО, чтобы заново не обучать программу незнакомым словам.

Сейчас «Информатик» открыл собственное облако для передачи словарей между компьютерными местами, но изменения нужно отслеживать самостоятельно, а не автоматически. Кроме того, использование облака могло бы облегчить жизнь большому количеству потребителей ОРФО. По сути, нужна только одна галочка «использовать облако» и ничего более. В автоматическом режиме новые слова должны попадать в «Информатик», там их должны анализировать лингвисты и включать правильное написание в отдельный «облачный словарь», который довольно быстро вырастет в размерах, так как разные писатели используют собственный набор слов для описания каких либо событий или предметов.

«Орфографическое облако» надо создать как отдельный бренд и систему контроля легальности при использовании словарей. Программу сделать отдельной единицей, а все словари получать из облака. Сделать систему тарификации словарей — базовый, расширенный, узкоспециализированный, пользовательский и так далее. Позволить выбирать отдельные и пакетные предложения. Таким образом, программу можно будет украсть, а словари нет (теоретически).

Снимок-экрана-2014-07-21-в-8.55.58

Отдельно или с расширенными версиями ОРФО поставляются дополнительные словари, в фирменном определении — «тематические словники». Любой истинный фанат ОРФО (типа меня) обязательно приобретёт не только самую новую версию программы ещё до её официального выхода, но и словари к нему. И цена здесь… лично мне не жалко никаких денег, но массовый рынок так не рассуждает. Поэтому надо быть реалистами. Современное решение должно несколько отличаться от текущего маркетинга. ОРФО, по сути, вообще должен быть конструктором. Нужно покупать словари произвольно из… ОРФО. Они не должны теряться при выходе новой версии программы. Должна быть система «восстановления покупок». Должен быть приблизительный список количества слов из словаря и возможность расширять тематический словарный запас.

Сейчас в ОРФО отсутствует «система контроля названий». Скажем, чтобы каждый пишущий мог грамотно воспроизводить устойчивые словосочетания и названия. Например, в любом случае «Open Source» или «Aircraft Prototype Systems Division» писались бы безошибочно. Как вариант, чтобы ОРФО ещё предлагала отделять некоторые названия кавычками (» »), дабы не сбивать со смысла. А то в одном случае это сообщество «Open Source», в другом это открытый источник, который можно написать строчными буквами — open source.

Подобные названия компаний и устойчивых фраз также можно вынести в отдельный словарь или тематические словари.

Снимок-экрана-2014-07-21-в-12.05.19

Технически, объёмы словарей неизвестны, но количество распознаваемых слов огромно! ОРФО использует группы правил и шаблоны. Даже когда пользователь вводит новое слово, то оно хранится в каком-то изначально правильном формате, а различные формы, которые могут встречаться в тексте, распознаются ОРФО уже автоматически. Таким образом, физически компактные словари — это огромное богатство словоформ!

И, казалось бы, ОРФО проверяет текст по словарю. Что тут особо сложного? Но это не просто «spell checker». Программа подскажет, что нельзя написать «выполняет роль» из-за нарушения лексической сочетаемости, потому что «роль» можно «исполнять» или «играть». И далее огромный список подсказок — от устаревших слов, до разговорного стиля. ОРФО указывает на созвучность слов, на множество согласных идущих подряд, на которых можно споткнуться при чтении, на длинные и сложные для понимания предложения.

И вот тут появляется необходимость приучать к грамотности с помощью элементов игры. Создать систему баллов за грамотность, стиль изложения, обучение системы новым словам и так далее. Нужно поддерживать интерес к творчеству вместе с ОФРО, которое связано с изложением слов, созданию грамотных словоформ и прочему.

Бывает так, что человек знает, как правильно пишется слово, но постоянно спотыкается на одной и той же ошибке. Это вредная привычка, которую можно исправить в игровой форме. Например, среди моих привычек есть слово «не возможно», которое автоматически пишу раздельно.

ОРФО ищет ошибки, но она иногда пропускает известные правила или обстоятельства. Например, при включённой опции с буквой «Ё» пропускается слово «всё», или, как в примере выше, «не возможно» всё-таки пишется слитно, а программа может и пропустить ошибку.

Надо отдать должное, в версии 2014 года увеличилась точность проверки. В контрольном тексте на 3000 слов, который был проверен ранее ОРФО 2013, выявлены 3 дополнительные ошибки.

Для ОРФО есть ещё много места на рынке и направлений для развития. Основная задача — согласовать современные возможности, стиль жизни потребителей и расширить массовый рынок за счёт изменения интерфейса.

Ссылки по теме Официальный сайт: www.informatic.ru

Официальная страница продукта: www.orfo.ru

Морфологические модули: www.informatic.ru/catalogue/developers

Аннотация Статья о современных возможностях программ для проверки орфографии на примере ОРФО.

Послесловие Бывают всякие симпозиумы медиков, пожарников, военных. Что-то я не помню ничего подобного у лингвистов, которых волнует развитие программ для проверки орфографии.

Доброе утро!

Честно говоря — знаю, что статья получилась скомканной.

Похожие публикации: Общие сведения о программном обеспечении для чтенияЗакладкиПрограммы для чтения книгИтоги года. Состояние рынка.Выбор редактора

©  ebook