Какие форматы лучше? Фрагмент №2.

Формируйте тело... форматы электронных книг! :-)Электронные книги описываются различными форматами данных, а их разнообразие зависит от назначения, возможностей, платформы, веса, кодировки, простоты или «универсальности» (последнее довольно часто субъективно). Потребителям не так важно уметь различать логически их принадлежность к целям и задачам, заменяя свои знания комфортом применения и доступностью контента в конкретном формате.

Очень важно понимать в какой формат пользователь может самостоятельно перевести свои документы, чтобы иметь возможность прочитать их с помощью различных устройств или с помощью специализированных программ. Не стоит отбрасывать в сторону возможность последующего редактирования оцифрованного документа. Если используется оцифровка книг, журналов или газет, а в последнее время еще и статей из Интернета, то и здесь форматы могут использоваться по принципу простоты создания, архивирования и каталогизации, нежели целевого выбора и последующего комфорта чтения. Очень важно учитывать объем информации.

В результате контент может быть изготовлен фактически в любом формате, без определения качества, масштабируемости, «веса». Довольно часто использование форматов опирается на убеждение в принадлежности к чему-либо, чем на изначальную цель, которую закладывал в формат его разработчик.

Профессионалы могут поступать несколькими способами в зависимости от последующего качества применения и выделенных для этого ресурсов, в том числе и финансовых, а не только технических или людских:

Создавать контент по природному происхождению и предназначению формата. Использовать формат ради последующей защиты, а не обязательного комфорта во время чтения. Или идти по самому короткому пути, как и обычный пользователь, упрощая создание цифрового контента, сокращая время, экономя бюджет. Для этого формат может быть выбран любой, лишь бы он мог быть доступен, и понимаем профессионалу. И самое неприятное свойство из всех перечисленных — неграмотность профессионала, который создает цифровой контент. Нет никакой разницы между созданием документа для чтения, но ради редактирования. Или наоборот, когда контент нужно сохранить для редактирования, а не для чтения в том виде, в котором невозможно создавать исправления и дополнения в тексте, но на экране такой документ может выглядеть восхитительно и ради этого все создавалось неправильно. Назначение форматов проще всего воспринимать правильно, если воспользоваться трактовкой термина — предназначение формата, определения того, ради чего нужно создать контент в определенном виде или, иначе говоря, «форме». В любом случае должна главенствовать конечная цель, которая сопоставляется с используемыми средствами (ресурсами в том числе) и возможностью последующего применения, хранения или все одновременно.

Назначение форматов формируется за счет нескольких свойств: возможности формата, предназначения, в которое включены свойства по созданию, редактированию и последующему чтению, причем следует учитывать конечную платформу для осуществления целей.

«Чтение» следует разделить на две части: комфорт функции и предварительный просмотр, ради ознакомления с материалом. Не всегда возможно совместить подобные свойства гармонично, или результат сводится к упрощению основной функции ради предварительного просмотра.

Здесь необходим реальный пример, чтобы четко представлять различие.

PDF содержит в себе одну или множество страниц с контентом. RTF ничем не отличается в данном случае, хотя формат принципиально другой. Предварительный просмотр возможен с помощью вывода страницы на экран в любом объеме, то есть не обязательно демонстрировать всю страницу в полном размере. Достаточно видеть фрагмент, но при котором можно ознакомиться с содержимым, прочитать его или попросту рассмотреть. Сложность в том, что предварительный просмотр формируется по первой странице, по которой сложно определить содержимое всего документа. Все это сводится к созданию крупной пиктограммы первой страницы.

Специализированные форматы содержат в себе дополнительные секции в структуре данных: анонс, трейлер, тизер.

Если представить электронную полку с книгами, то около обложек специализированных форматов можно вывести аннотацию, потому что она заранее известна и её не следует генерировать из основного текста. Прописана внутри данных и находится в специальной секции формата, а всем другим форматам доступна демонстрация обложки, создание крупной пиктограммы с текстом, случайное выдергивание фрагмента после ключевого слова в тексте или после конкретной страницы и результат не предугадать заранее.

Основные предназначения форматов можно представить по типу:

Просмотр — назначение форматов при просмотре подготовленного контента сводится к определению платформы для использования. Определяется электронный носитель или программное обеспечение для любого или определенного устройства. Разница только в том, что создающий контент оператор подозревает конкретные ограничения при считывании формата. Возможности — определяются объемом документа и разработчиком. Предназначение — предполагается потребителем и подразумевается разработчиком, который в свою очередь определяет степень открытости формата. Создание документа — определяется способом и его доступностью, технически и лично, или с помощью различных ресурсов, в том числе сторонней помощи (англ. «Freelance» — форма удаленной работы). Редактирование — определяется не только инструменты и программы для внесения исправлений, но и саму возможность, как часть предназначения формата. Для некоторых форматов возможности редактирования ограничены и могут применяться не для замены текста, а для редактирования графических образов и иллюстраций внутри формата. Все из указанных типов могут иметь ограничения в зависимости от технической реализации формата, которое сводится к защите данных (англ. «DRM» — технические средства защиты) или к сжатию определенных типов данных:

Сжатие внедрения или связывания шрифтов и мультимедиа. Отдельное сжатие растровых изображений и текста. Сжатие самих «алгоритмов сжатия» растровых изображений. Использование встроенного механизма сжатия для всего документа и защита данных. Назначение формата зависит от типа используемых данных:

Векторные Графические Текстовые Мультимедиа Каждый тип данных поддерживает цветовую модель или их гибрид: RGB, CMYK, Grayscale, Lab, Duotone, Bitmap.

В формат могут быть встроены или описаны для использования предполагаемые шрифты. Обычный и типичный набор: Times, Courier, Helvetica, Symbol, Zapf Dingbats. Можно описать шрифты по типам, а не конкретно по имени: рубленый, с засечками и символьный.

Для сокращения ошибок, но ограничения масштабирования, некоторый текст в формате может быть заменен на другой тип. Например, математические формулы описанные текстом с использованием символьных шрифтов могут быть заменены иллюстрацией. Таким образом, текст заменяется графическим типом данных. Такой подход изменяет набор инструментов для дальнейшего редактирования, и масштабирование текста может быть непропорциональным по отношению к иллюстрации.

Графические форматы могут масштабироваться на экране пропорционально изображению, но если страница сделана полностью в графическом виде, то масштабирование может быть увеличено за видимые границы экрана, тем самым используется не увеличение масштаба содержимого, а фрагментация страницы в другом масштабе. Графический текст поддерживает жестко заданные границы полей и страниц, в отличие от текстовых форматов, которые могут увеличивать общее количество страниц в документе в зависимости от размера начертания шрифта.

В зависимости от формата данных внутри структуры документа некоторые форматы лучше использовать для определенного контента:

TXT — используется только для текста без разметки, типографикой в данном случае будет заниматься программное обеспечение. EPUB, FB2 и MOBI — содержат в себе смешанный тип данных, поэтому подходят для масштабирования текста во время чтения с сохранением заложенной разметки. Типографикой будет заниматься программное обеспечение, но оно знает выделение фрагментов текста заранее. Переносы слов обычно не описываются форматом, и этим точно будет заниматься только программное обеспечение по запрограммированному алгоритму естественного языка текста. PDF — следует описать отдельно, так как формат хоть и можно отнести к графическому из-за жесткой разметки текста и иллюстраций, но при наличии текста внутри структуры возможно масштабирование с потерей разметки. Класс TextFlow описывает содержимое текста и внутри есть описание параграфа, ссылок, графики и разделителей. DJVU — графический формат, хотя может содержать в себе дополнительные файлы с текстовыми данными. Популярность формата привела к тому, что внутри документа фактически находятся только графические образы страниц и ничего более. С подобной задачей справится любой контейнер с набором иллюстраций в строгой последовательности страниц. CBZ и CBR — это как раз наглядный пример контейнера с графическими данными, где название файла соответствует номеру страницы. В качестве контейнера используются популярные архиваторы ZIP или RAR. Таким образом, форматы определяют тип используемых данных и по ним можно предположить предназначение форматов.

EPUB, FB2 и MOBI современные форматы для чтения различной литературы в текстовом виде. Особой разницы для потребителей контента в них не заложено. Они в равной степени могут почти одно и то же. Изменение размера шрифта позволяет адаптировать текст под размер экрана носителя с учетом предпочтений конечного пользователя. Для профессионалов это форматы, в которых набор текста может быть сложен для табличных и формульных данных. Это трудоемко и требует особого внимания и терпения. Часто эти типы данных конвертируют или сохраняют в графическом формате, чтобы сократить время набора и ограничить количество вероятных ошибок при сборке итогового документа. Таким образом, внутри масштабируемого формата могут быть данные, которые не подлежат масштабированию с переносом строк.

Графические форматы, к которым сейчас можно отнести почти всё, что в большей степени содержит факсимильный образ страницы, как правило пригодны для печати. Удобство чтения форматов зависит от размера экрана носителя. От комфорта не только при увеличении или уменьшении фрагмента страницы, но и от скорости управления документом и этими функциями.

Форматы для комиксов CBZ и CBR хоть и являются полностью графическими, но лучшие существующие программы автоматически определяют границы кадров и могут по отдельности увеличивать на экране только их зоны. Не всегда возможно комфортное прочтение текста в «баблах», но это в основном в тех комиксах, которые создавались без учета цифровой эпохи и были рассчитаны для чтения только в оригинальном размере печатной страницы.

Такие форматы как DOC или RTF годятся для последующего редактирования, но это еще не значит, что программное обеспечение для чтения поддерживает функции не только полнофункционального редактора, но и даже самых простых возможностей — замены отдельных букв, слов, предложений и так далее. Из этого следует сделать вывод таким образом, что не существует универсально удобных инструментов для чтения и редактирования. В некоторых случаях функции доступны, но не обеспечивают должного комфорта.

Мнение об «универсальности форматов» — это тоже часть предназначения, но не их носителей. Например, PDF может быть удобен как формат с возможностью последующей распечатки на принтере или для чтения на большом экране компьютера, планшета, но плохо совместим с медлительными компактными устройствами, на которых удобно читать, но только в текстовом формате.

Полностью графические форматы JPG, PNG, TIFF и так далее, также могут применяться для чтения. Их назначение не будет отличаться от графических форматов описанных выше, но с очень важным ограничением — поддерживается только одна страница иначе это уже контейнер.

Аннотация Назначение форматов следует привязать между источником получения контента и носителем, где важным фактором является «комфорт» приобретения и дальнейшего использования контента.

Послесловие Потерпите, скоро начнутся новогодние темы и подведение итогов года.

Удачи и расслабляйтесь при чтении! Не корову проигрываете, а знакомитесь с миром.

Похожие публикации: teXet TB-504 и TB-506: летние отпускные настроения с ультратонкими читалкамиAirBook City Light HD: первое украинское устройство современного уровня доступно в Украине! Оцифровка книгФорматы книг. Современное представление…Какие форматы лучше? Фрагмент №3.

©  ebook