Тематическая картография: общие вопросы
Хочу поделиться с вами переводом руководства по тематической картографии от ребят из axismaps.
Рекомендую к прочтению информационным дизайнерам, журналистам (данных), аналитикам, начинающим картографам, а также всем, кто хочет научиться читать тематические карты и отличать хорошую карту от плохой, вводящей читателя в заблуждение. Всех заинтересовавшихся приглашаю под кат.
Материала довольно много, поэтому я разбил его на несколько частей. В переводе сохранён оригинальный, «американский» стиль изложения, когда к важным умозаключениям возвращаются по несколько раз. Несмотря на то, что в руководстве описаны лишь базовые принципы тематической картографии, и некоторые аспекты намеренно упрощены, этих знаний будет достаточно для визуализации данных в большинстве случаев.
Навигационные карты и тематические карты
Большинство карт попадают в одну из двух широких категорий:
Общегеографические (физические) карты отображают различные локации и объекты, такие как страны, города, реки и т.д… Это те карты, которыми вы наверняка пользуетесь в повседневной жизни, например, карты Google, которые помогают вам найти где что находится. Другие распространённые физические карты делают акцент на рельефе — это топографические карты.
Тематические карты не просто показывают локации, но показывают различные атрибуты или статистику, соответствующую данной местности, различные пространственные закономерности и взаимосвязи между локациями. Например, если физическая карта показывает местоположение города, то тематическая может вдобавок показывать население этого города. В одном случае мы картируем местность, в другом данные. Это руководство посвящено тематическим картам, их различным типам и базовым принципам создания.
Представление данных
Вообще говоря, тематическая картография — это о различном представлении пространственных данных. Делается это с помощью нескольких визуальных переменных, таких как размер, цвет и форма. Конкретный способ зависит от природы представляемых данных (счётные ли это данные или номинальные), а так же от типа геометрии (точка или площадной объект). В этом руководстве мы рассмотрим некоторые распространённые способы создания тематических карт в купе с советами и лучшими практиками.
Знайте ваши данные
Успех многих тематических карт обусловлен правильным выбором способа представления данных. Другими словами, не все географические данные одинаковые, поэтому и картироваться они должны по-разному. Например, площадная картограмма хорошо работает для таких вещей, как размер населения или продолжительнсоть жизни (которые являются числами), но она не подойдёт для номинальных данных, особенно если категории невозможно упорядочить, Такие данные, как преобладающая религия или тип почвы, по своей сути не могут быть измерены количественно. Для площадной картограммы нужны числа, чтобы соответственным образом масштабировать регион, без них никак. То же самое справидливо для градуированных символьных карт, хороплетов и точечных картограмм плотности.
Ниже следует краткое описание типов измерений. Более детально каждый тип карт будет рассмотрен в соответствующем разделе далее.
Типы измерений
Числовые данные являются самым распространённым типом данных тематических карт. Всё, что может быть посчитано (люди, баррели нефти) или измерено (температура, доход), отлично подходит для тематических карт. При этом не забывайте о важности нормировки данных; это влияет на то, какие типы карт вы можете (или не можете) использовать для визуализации.
Номинальные данные (также известные как категорийные или качественные данные) никак не ассоциированны с числами, и принципиально не могут быть как-либо упорядочены (ранжированы).
Порядковые данные по сути категорийные данные, которые можно упорядочить. Например, размеры футболок (s / m / l / xl), риск затопления (низкий риск / средний риск / высокий риск) или возрастная группа(молодёжь / зрелый возраст / пожилые люди). Для картирования порядковых данных лучше всего подходит хороплет с последовательной цветовой шкалой, либо градуированная символьная карта с количеством классов равным количеству категорий в данных.
Нормализовать или нет?
Очень важным аспектом тематической картографии является то, в каком виде вы используете данные, в чистом виде (например, население каждой из стран) или же в нормализованном виде (например, население страны на квадратный километр её территории). В первом случае мы увидим сколько людей живёт на территории страны, во втором мы увидим на сколько плотно заселена территория. Основной причиной для нормализации данных является возможность сравнивать очень разные территории. Например, вы можете напрямую сравнить такую большую страну как Канада с такой небольшой как Швейцария. И хотя в Канаде проживает значительно больше людей чем в Швейцарии, плотность населения там куда меньше. Без нормализации данных увидеть этот факт будет не так просто.
Примечание: Если вы собираетесь создавать хороплет, используйте ТОЛЬКО нормализованные данные.
Подведём итоги: Если вы хотите чтобы ваши пользователи видели магнитуду (количественный порядок величин), используйте данные в чистом виде. Если же вы хотите показать относительную разницу (в которой уже учтены такие вещи как размер территории), то используйте нормализованные данные.
Являются ли мои данные уже нормализованными?
Очень может быть! Если числовые данные содержат в описании "x на квадратный километр/милю/...", или "x на душу населения", или "процент", или "соотношение x / y", тогда можно пропустить этап нормализации данных.
Как нормализовать ваши данные
Основные способы нормализации данных следующие: поделить данные на (1) площадь, соответствующую этим данным, создав тем самым данные вида "x на квадратный километр/милю"; (2) на количество людей внутри этой территории, создав данные вида "x на душу населения" или "x как % от всего населения".
Когда использовать
Если вы собираетесь классифицировать ваши данные, вы должны определиться как с количеством классов, так и с методом разбиения на интервалы (классы). Существует множество различных способов систематичной классификации данных, ниже мы рассмотрим их достоинства и недостатки.
Смысл классификаци в сокращении большого количества наблюдений путём их группировки до нескольких интервалов или классов. Зачем? Потому что пользователям гораздо проще воспринимать несколько чётко определённых классов, чем «сырые» данные. Если классификация сделана грамотно, то она помогает гораздо проще и яснее донести послание, заложенное в карту. Однако, классификация процесс не из лёгких, очень часто подобрать «идеальный» метод под конкретный набор данных удаётся далеко не с первого раза. Всегда важно понимать данные с которыми работаешь, а не просто применять «любимый» метод классификации. Неподходящий метод классификации может создать на карте ложные паттерны, имеющие мало общего с реальным гегографическим феноменом, который вы пытаетесь визуализировать. Карты, использующие сомнительные методы классификации, не просто не эффективны, они вводят в заблуждение.
Классификация имеет большое значение, потому что группировка данных один из наиболее фундаментальных аспектов генерализации карт — процесса упрощения реального мира до рамок холста карты. Поэтому даже небольшие различия в этом процессе могут кардинально изменить внешний вид карты и её посыла. Несмотря на всё это, пользователи редко придают этому значение и не подвергают сомнению предложенные им классы, а ведь это один из простейших способов "обманывать картами" намеренно или по неведению. Тем не менее, классификация очень полезна и является базовым навыком при создании тематических карт.
На этой карте использована схема с 5 классами с равными интервалами (1-10, 11-20, ...).
Примечание: Всё вышеперечисленно справедливо также для хороплетов, градуированных символьных карт и картограмм, поскольку вы можете создать версии этих карт с разбиением на классы.
Цель классификации данных
Вообще говоря, основная цель классификаци в том, чтобы объединить вместе схожие наблюдения и разделить существенно различающиеся. С математической точки зрения цель в нахождении оптимального числа классов и определении их границ таким образом, чтобы минимизировать вариацию внутри классов и максимизировать различия между классами. Например, имеется набор данных из 4 наблюдений 1.3, 1.6, 3.5 и 3.9, логично разбить его на две группы: 1.3 и 1.6 в первую группу и 3.5, 3.9 во вторую, потому что между ними явный числовой разрыв. Такой поход очень распространён и называется «максимальные разрывы».
Однако, всё не так просто, и максимизация разницы между группами не всегда уместна. Предположим, что в примере выше значение 1.5 является критическим, и важно дифференцировать значения относительно этой критической точки. Например, если локации соответствует значение ниже 1.5, то ей доступна экстренная финансовая помощь. В этом случае внешние ограничения перевешивают логичные с точки зрения математики доводы, и, хотя 1.3 и 1.6 являются близки по значению, они будут отнесены к разным классам.
Количество классов
Если вы не уверены, то создавайте карту с 3–7 классами данных. Конечно ваши цели и сами данные должны влиять на принятие решения, например, политическая карта США обычно имеет только 2 класса (небезызвестные карты красно-синих штатов). Карты, показывающие отклонения от среднего, также будут иметь всего 2 класса (ниже среднего и выше среднего).
Чем больше классов вы будете использовать, тем больше подробностей будет видно на карте (что хорошо), но при этом будет возрастать сложность восприятия карты и, как следствие, риск неправильной интерпритации данных, так как большее количество цветов труднее различать (а ещё сложнее печатать такую карту). Ключевой вопрос — как много подробностей вы хотите показать? Карта с 3 классами/цветами будет очень легко читаться, но может скрыть от читателя некоторые важные аспекты данных, и при этом может создать искусственные географические паттерны из-за объединения по факту разных территорий. Единственно верного количества классов для карты не существует, так что экспериментируйте.
Не уверены сколько классов использовать? Посмотрите распределение ваших данных на гистограмме: есть ли явные кластеры внутри ваших данных, есть ли большие разрывы, формирующие естественные группы? Если так, то выберите количество классов соответственно этому.
Метод классификации
Также как нет единственно верного количества класов, нет и единственно верного способа разбить данные на интервалы. Посмотрите на гистограмму (или диаграмму разброса), чтобы определить «форму» ваших данных. Постарайтесь определить величины с близкими частотами в один класс, а величины с сильно различающимися частотами разнести по разным классам.
По форме этих гистограмм можно предполажить, что 3 или 4 класса будет хорошим выбором.
При отсутствии иных умозаключений, естественные «перепады/разрывы» являются хорошей основой для формирования интервалов.
РАВНЫЕ ИНТЕРВАЛЫ разбивают данные на классы одинакового размера (например, 0-10, 10-20, 20-30, и т.д.) и лучше всего работают на равномерно распределённых данных. ВНИМАНИЕ: Избегайте использования разбиения на равные интервалы, если на гистограмме виден явный перекос (ассиметричность), или присутствуют большие выбросы. Выбросы будут плодить пустые классы, а перекосы приведут к большой вариации внутри классов. Так как в данных по отелям нет явных выбросов, то использование равных интервалов здесь допустимо.
КВАНТИЛИ помогут создать карту с равным количеством наблюдений в каждом классе: если у вас 30 регионов и 6 классов данных, то в каждом классе будет по 5 регионов. Недостаток квантилей в том, что они могут привести к очень разным интервалам у разных классов (например, 1-4, 4-9, 9-250… последний класс огромен). Выбросы также могут разделить области с очень близкими частотами и привести к объединению областей с разными частотами, что крайне не желательно, так что всегда смотрите разбиение на гистограмме. ВНИМАНИЕ: В примере с данными по отелям использование квантилей приводит к тому, что часть третьего кластера попадает во второй класс, хотя гораздо ближе к наблюдениям из третьего класса.
ЕСТЕСТВЕННЫЕ РАЗРЫВЫ являются в некотором смысле «оптимальным» решением, потому что изначально минимизируют вариацию внутри классов и максимизируют различия между ними. Одним из недостатков этого метода является то, что каждый набор данных уникален и, соответственно, разбиение тоже. Это приводит к невозможности сравнивать аналогичные карты разных наборов данных, например, в атласах карт или сериях карт, показывающих динамику во времени. В таких случаях лучше использовать другую схему разбивки на классы.
ВРУЧНУЮ приходится расставлять границы классов во многих случаях. Причины могут быть разными: необходимо учесть критическую точку в данных, сделать одной из границ среднее значение, сделать карту частью серии/атласа (чтобы сохранялась преемственность цветов и диапазонов в серии). Если разбиения других методов могут быть улучшены небольшими правками, то не бойтесь скорректировать их вручную.
Предварительные знания
Логчино предположить, что подписи и текст на картах используются для именования объектов и локаций, но их роль гораздо важнее. Подписи не только обозначают местоположение объектов, но также отображают их тип и форму, связи между ними, символизируют ассоциируемые с ними данные. Текст в виде коротких блоков и описаний используется для обозначения важных элементов карты, таких как заголовки, источники данных, тип проекции, масштаб, легенда и назначение карты. Преобладание подписей на карте (в особенности физической) ведёт к конкуренции за внимание с остальными символами карты, при этом подписи и текст очень сильно влияют на общее впечатление, создаваемое картой. Они помогают глубже погрузить читателя в изучаемую тему и облегчить понимание местности, как никакие другие графические инструменты (например, цвет).
Задача 1) подбора шрифтов и стилей (начертаний) и задача 2) размещения (позиционирования) подписей и текста на карте называется «типографирование карты». Обе они влияют на то, как хорошо работает и воспринимается карта в целом. Вследствие итеративной природы процесса (перемещение подписи, или изменение шрифта часто ведёт к эффекту домино и каскадному изменению в типографике карты), типографирование всегда относилось к одному из самых трудоёмких процессов в картографии, и остаётся таким по сей день, несмотря на современные достижения по автоматизации этого процесса.
О чем важно задуматься перед типографированием карты
1) Какова смысловая иерархия у объектов, которые я хочу подписать? Смысловая иерархия позволяет вам проранжировать объекты карты в порядке их важности. К примеру, на некоторых картах столицы могут быть важнее других крупных городов, которые, в свою очередь, могут быть важнее малых городов. Регионы и страны могут быть выше любого из городов в смыслвой иерархии. Такой способ концептуального ранжирования поможет в дальнейшем создать визуальныую иерархию подписей на карте.
2) Зачем мне нужна визуальная иерархия подписей и текста карты? Визуальная иерархия является важнейшим аспектом дизайна карты, она помогает читателю организовать графическую информацию таким образом, чтобы она была наиболее доступна и понятна. При правильном использовании, визуальная иерархия позволяет читателю проще и быстрее выполнять такие базовые задачи, как категоризация, группировка, поиск и сканирование информации. На первой карте, ниже показан пример визуальной иерархии подписей. Без визуальной иерархии, как на втором примере, чтение карты становится очень затруднительным, так как все подписи равносильны по уровню важности.
При прочих равных, больший кегль и более жирное начертание повышает уровень визуальной иерархии подписи. Капитализация и использование «тяжёлых» цветов, таких как черный, красный или розовый, имеет тот же эффект. Уменьшение размера шрифта и межбуквенного интервала (трекинг) понижает уровень подписи, то же делают и приглушенные цвета, вроде серого. Конечно же задача становится сложнее по мере увеличения количества подписей и их стилей на карте, поэтому создание хорошей визуальной иерархии потребует от вас неоднократного пересмотра решений, ряда экспериментов и постепенных улучшений.
3) О каких основных конвенциях типографирования карт следует знать? Конвенции это хорошая точка отсчёта, но не следует воспринимать их как правила, которые не могут быть нарушены. Вот несколько наиболее распространённых конвенций типографирования карт:
- Приоритеты размешения подписи точечного объекта: 1) сверху и справа, затем 2) снизу и справа, затем 3) сверху и слева, потом 4) снизу и слева. Размещение непосредственно сверху, снизу или с боков нежелательно.
- Визуально выровняйте по центру и увеличьте межбуквенный интервал подписей площадных объектов, чтобы обозначить их размер и форму.
- Используйте прописные буквы для подписей площадных объектов.
- Отделяйте культурные и физические фичи с помощью семейств шрифтов sans serif (без засечек) и serif (с засечками).
- Подписывайие водные объекты голубым курсивом.
- Делайте различия между подписями разного уровня хотя бы в 2 кегля.
- Не переворачивайте подписи вверх тормашками.
- Подписи не должны быть меньше 6-7pts у бумажных карт и 9-10pts у цифровых карт.
- Если необходимо, используйте один шрифт с засечками и один без, но не используйте больше одного шрифта без засечек на карте.
4) Как создать подходящее общее впечатление от карты и соответствующее настроение? Знание вашей аудитории и главной цели карты играют ключевую роль в формировании правильного «ощущения» карты. Если карта посвящена узкой тематике, нужно это отразить в её стиле. Все шрифты имеют свой «характер», который может создавать субъективное восприятие у читателя. Не используйте очень броские (замысловатые) шрифты, при этом подберите шрифт, подчеркивающий цель и тему карты. Выбор шрифта может придать карте формальный вид, неформальный, исторический, современный и т.д…
5) В каком виде и при каких обстоятельствах будет использоваться карта? Условия чтения являются очень важным фактором, определяющим на сколько читаемой и удачной будет карта. Важно как будет воспроизводиться карта (принтер, большой экран, проектор, мобильное устройство), с какого расстояния будет рассматриваться, какое будет освещение. В случае маленького разрешения, плохого качества воспроизведения, плохого освещения и больших дистанций чтения необходимо использовать более чёткие и контрастные шрифты, с хорошей читаемостью.
6) Как много подписей должно быть на карте? На этот вопрос нет простого ответа. Вообще говоря, подписей должно быть столько, сколько необходимо для поддержания цели карты и обеспечения контекстной информации. Физические карты обычно содержат широкий диапазон плотно расположенных подписей. Тематические карты, напротив, обычно содержат не так много подписей, потому что используют различные графические символы, цвета и пояснения для донесения основного послания. Также стоит обратить внимание на распределение подписей на карте, следует избегать слишком пустых областей и слишком «плотных», это может придать карте несбалансированный вид. В конце концов, добавлять подписи на карту просто, гораздо сложнее определить когда стоит остановиться.
7) Нужно ли мне знать что-нибудь о типографике? Да. Знания о шрифтах, их метриках и компонентах может очень помочь сделать правильный выбор шрифтов для вашей карты.
Кегль это высота прописного знака с выносными элементами. Исторически, в ручном наборе высокого способа печати кегль измеряли через высоту литерной площадки, на которой расположена буква или знак. Важно знать, что различные гарнитуры при одинаковом кегле могут иметь разный размер, как показано ниже. Кегль сам по себе никогда не должен использоваться для определения удобочитаемости.
Высота строчного знака (x-height) это высота буквы в нижнем регистре без учёта верхних и нижних выносных элементов (показана голубым пунктиром на картинке выше). Это свойство не менее важно размера кегля, когда дело касается удобочитаемости текста. При прочих равных, когда размер шрифта становится меньше, шрифты с большей высотой строчного знака кажутся больше по размеру. Также у шрифтов с большой высотой строчного знака больше внутрибуквенный просвет, что снижает вероятность их «схлопывания».
Засечки это небольшие отметки на концах линий некоторых букв, такие как на букве 'T' ниже. Шрифты для цифровых карт должны использовать засечки, которые будут читаемы даже на малых размерах шрифта. Хотя на малых размерах на экране куда лучше использовать шрифты без засечек. Однако, если всё же используете шрифт с засечками, то выбирайте шрифт с более тяжёлыми, «блочными» засечками (брусковые шрифты), такими как у шрифтов Georgia, Droid Serif или Bitstream Vera Serif.
Глубина семейства. Семейства шрифтов, содержащие много вариантов обычно хороший выбор, потому что предоставляют необходимое для карт разнообразие. Если шрифт имеет регулярное начертание, прямое, курсив и жирное начертание, то он покроет большинство задач типографирования карты. Такие семейства шрифтов, как Helvetica Neue, содержат очень много вариантов.
Стоимость. В большинстве случаев хороший шрифт стоит денег и нуждается в лицензии. Хорошая типографика стоит своих денег! Не надейтесь найти множество бесплатных шрифтов, которые будут иметь широкий выбор начертаний, будут одинаково хорошо смотреться на бумаге и на экране, содержать полный набор глифов, поддерживать множество языков и будут подходить для картографии. Тем не менее, есть ряд неплохих бесплатных шрифтов, которые можно найти на сайтах вроде Google Fonts.
Предлагаемые шрифты
Ниже некоторые из шрифтов для быстрого старта. Некоторые из них лучше для интерфейсов веб-карт, другие лучше для подписей, некоторые подойдут для обеих задач. Обратите внимание на узкие шрифты (condensed и narrow), они могут быть полезны для подписей. Также некоторые варианты шрифтов бывают как с засечками, так и без, это может быть удобно для создания более унифицированного вида карты. Большинство имеют минимум четыре базовых начертания (регулярный, жирный, курсив, жирный курсив), некоторые больше. Большинство бесплатны на Google Fonts, но некоторые на Typekit или платные.
Без засечек:
С засечками:
Моноширинный:
Символьные:
Контроль трёх измерений цвета
Успех многих тематических карт, таких как хороплеты, зависит от понимания как использовать цвет для кодирования геоданных, используя три измерения модели HSL: тон, насыщенность и светлота. В отличие от выбора цвета вашей гостиной, выбор цвета в картографии куда менее субъективен, чем может предположить большинство людей, картографы не делают выбор по принципу «выглядит мило». Напротив, существуют важные правила, определяющие как работают цветовые схемы, и как цвета должны соотноситься с данными. Ко всему прочему, существует ряд ограничений, накладываемый особенностями человеческого восприятия, например, нарушение цветовосприятия (около 8% мужчин). Эти ограничения нужно учитывать при выборе цвета, и не полагаться только на личное мнение. Хорошая новсть состоит в том, что ограничения эти довольно хорошо изучены, и существуют готовые рекомендации по их учёту и нивелированию.
Природа ваших данных определяет выбор цветовой схемы
Номинальные данные это по сути неупорядочиваемые категории, и они должны визуализироваться с использованием номинальной цветовой схемы. Если у вас упорядочиваемые категории или числовые данные, то вам нужна непрерывная цветовая схема. Непрерывные цветовые схемы могут быть однотонные или многотонные, но они должны быть упорядочены по разнице в светлоте и насыщенности. Дивергентные схемы следует использовать, если в данных есть естественная центральная точка, такая как ноль (разделение на позитивные и негативные значения), либо если необходимо сравнить значения относительно некоторой критической точки, например, среднего значения по стране (данные по регионам будут либо выше, либо ниже среднего). Есть замечательный инструмент для подбора цветовой схемы: ColorBrewer, там же можно найти более детальную информацию по характеристикам цветовых схем.
Схемы с учётом особенностей восприятия
Схемы на ColorBrewer учитывают особенности восприятия (pdf) так, чтобы изменения цвета на каждом шаге шкалы выглядели непротиворечиво для нашего зрения. Это необходимо делать, потому что человеческое зрение воспринимает одинаковое изменение в разных тонах по-разному. Из-за этого создание хорошей цветовой схемы становится очень сложной задачей. Вы не обязаны ограничиваться только вариантами схем ColorBrewer, но там вы всегда найдёте проверенные, надёжные схемы для вашего проекта.
Одна тема данных или несколько?
Если вы собираетесь делать тематическую карту, то вы будете работать с географическими данными, которые предстваляют из себя некоторый набор тематических атрибутов с геопривязкой. «Тематическими атрибутами» могут быть любые данные, ассоциированые с определённой локацией/местом. Например, продолжительность жизни, политические предпочтения, вид землепользования, уровень преступности, цены на недвижимость, очаги заболеваний и так далее.
Если ваши данные имеют только один тематический уровень (тему), то вы конечно же будете визуализировать только один атрибут. Если же данные покрывают несколько тем, вы можете выбрать между одномерной картой (один атрибут) и многомерной тематической картой, то есть картой, на которой визуализируется сразу несколько атрибутов, закодированных гибридным символом. Такие многомерные тематические карты кодируют множественные географические факты о каждой локации, используя сложные составные символы. Многомерные карты не всегда лучше одномерных, их недостатки и преимущества обсудим ниже.
Большинство тематических карт показывают один атрибут, такой как доход на душу населения. Очень часто простая одномерная карта — это всё что нужно, поскольку имеется только один атрибут для визуализации. Однако, наиболее интересные и информативные карты намеренно совмещают несколько наборов данных. Это позволяет читателям сравнивать разные данные напрямую и часто помогает выявить важные зависимости. Например, двумерная карта, показывающая доход на душу населения и продолжительность жизни, может выявить сильную корреляцию между этими двумя факторами. Многомерные карты также помогают сэкономить место, поскольку мы можем вместить на одну карту больше данных, а не распределять их по серии одномерных карт. Когда многомерные карты сделаны хорошо, они показыват куда больше, чем сумму слоёв данных, они рассказывают сложную пространственную историю.
Важные моменты и ограничения
Прежде чем делать выбор в пользу многомерных карт, важно знать, что создавать дизайн таких карт довольно сложно. Они могут быть легко перегружены множеством пересекающихся символов и цветов, каждый из которых борется за место на карте. Также следует учесть вашу аудиторию и то, сколько времени они вероятнее всего потратят на изучение вашей карты. На примере ниже двумерный хороплет использует довольно изощрённую цветовую схему, которая требует частого обращения к легенде, чтобы верно оценить карту. Простые одномерные карты куда доступнее широкой аудитории в этом смысле.
Несмотря на риск чрезмерного упрощения, одномерные тематические карты легко читаются и быстрее достигают своей цели. Многомерные карты богаче, но требуют больше усилий для понимания.
Делаем хорошую многомерную карту
ИСПОЛЬЗУЙТЕ ПРАВИЛЬНЫЕ ТИПЫ ДАННЫХ: Некоторые разновидности многомерных карт, такие как двумерный хороплет, лучше работают с порядковыми или числовыми данными. Другие, такие как двумерные пропорциональные символьные карты, могут работать с номинальными данными в качестве одного из атрибутов. Подробнее о типах данных смотрите в разделе «Типы измерений: номинальные, порядковые и числовые данные».
УДОСТОВЕРЬТЕСЬ ВО ВЗАИМОСВЯЗИ ДАННЫХ: Очень важно, чтобы наборы данных были соизмеримы и логически взаимосвязаны. Чтобы избежать ложных корреляций (или опровергнуть существование несуразных связей), вы должны быть способны обосновать взаимосвязь ваших переменных. Доход и образование с большой долей вероятности коррелируют и влияют друг на друга в реальном мире, а вот образование и стоимость арбузов, вероятно, не имеют логической связи, и любые найденные корреляции скорее всего просто совпадение.
ИЗБЕГАЙТЕ ВИЗУАЛИЗАЦИИ ВТОРОСТЕПЕННЫХ ДАННЫХ: Не все атрибуты в ваших геоданных имеет смысл визуализировать, некоторые являются второстепенными (служебными) данными и используются базами данных ГИС. Например, коды «FIPS» или «ID» являются уникальными идентификаторами и не являются тематическими данными. Другим примером являются такие параметры, как ПЛОЩАДЬ, ДЛИНА, которые необходимы для нормализации ваших данных и расчётов соотношений. О нормализации данных можно прочитать в соответствующем разделе: «Нормализация данных».
Отображаем Землю на плоскость
Развернуть Землю на плоскость без искажений того или иного вида невозможно. Представьте себе кожуру апельсина: если вы попытаетесь уложить её на плоскость, то вам прийдётся растягивать, сдавливать и надрывать её. Аналогичная ситуация с Землёй— если мы хотим создать плоскую карту, то искажения неизбежны. Хорошая новость состоит в том, что картографические проекции позволяют сделать это системно. Другими словами, мы будем точно знать как именно растянуто/сжато любое место на карте (в любой точке). Существует множество проекций, и каждая имеет собственную модель искажений, потому что существует больше одного способа развернуть кожуру апельсина на плоскость. Некоторые проекции могут сохранить отдельные свойства Земли без искажений, но сохранить без искажений всё — невозможно.
Свойства проекции
Мы обычно говорим о проекциях с точки зрения того, как они искажают или сохраняют определённые свойства Земли, которые мы называем свойства проекции. Существует четыре основных свойства:
Площадь — некоторые проекции искажают площади (например, проекция Меркатора)
Обратите внимание на Гренландию, на проекции Меркатора она почти что размером с Южную Америку. В действительности же Южная Америка в 8 раз больше Гренландии. Проекция Меркатора не сохраняет площади, и чем ближе к полюсам, тем больше искажения. С другой стороны, есть проекции, которые не искажают площади, например, Равновеликая цилиндрическая проекция.
Заметьте, здесь Гренландия правильного размера по сравнению с Южной Америкой. Проекции, сохраняющие площади, называются равновеликие. Картографическая проекция либо сохраняет площади везде, либо искажает их везде. Это свойство из ряда всё или ничего.
Форма — некоторые проекции искажают форму объектов (например, Азимутальная проекция)
На проекции выше посмотрите на Австралию (она справа), её невозможно узнать, а Новая Зеландия растянута в дугу вдоль левого края карты. Эта проекция не сохраняет вид, или форму локаций, она их или растягивает, или закручивает, или сплющивает. Сравните её с равноугольной конической проекцией Ламберта (ниже), сохраняющей общие формы континентов.
Проекции подобные этой называются равноугольные, или конформные, они сохраняют локальные углы. На практике это означает, что вещи на карте будут больше похоже на себя. На примере ниже, показано как выглядит Гренландия на трёх равноугольных проекциях (верхний ряд) и на трёх не равноугольных проекциях (нижний ряд).
Обратите внимание, что Гренландия на всех равноугольных проекциях выглядит по-гренландски. Форма немного меняется, некоторые части острова меняют размер, но в целом форма сохраняется. Также как прямоугольник и квадрат имеют похожую форму, хотя это разные фигуры, а квадрат и круг — нет.
Как и в случае сохранения площадей, сохранение форм выполняется либо везде, либо нигде.
Расстояние — большинство проекций искажают длины (например, Равнопромежуточная проекция)
Расстояние от Мэдисона до Буэнос-Айреса намного больше, чем от Мэдисона до Мадрида. Но на Равнопромежуточной проекции длины этих отрезков равны, потому что она не сохраняет дистанцию. А вот на Азимутальной проекции расстояния отображаются в правильной пропорции.
С сохранением дистанций есть одна особенность. У нас есть проекции, которые могут сохранять площади и форму везде на карте, но нет ни одной проекции, сохраняющей расстояния везде. Есть только проекции, которые сохраняют расстояния относительно одной или двух точек на карте. Расстояния из центра и к центру Азимутальной проекции отображаются корректно, а между любыми другими точками — с искажениями. Когда проекция сохраняет дистанцию, мы называем её равнопромежуточная, или эквидистантная.
Площадь, дистанция и форма — взаимоисключающие свойства проеции, если проекция сохраняет одно свойство, то оставшиеся два будут искажены.
Направление — иногда прямая линия не кратчайший путь!
Нью-Йорк и Стамбул находятся практически на одной широте, примерно на 41ºN. Это означает, что если вы направитесь из Нью-Йорка точно на восток, то доберётесь до Стамбула. Но это не означает, что это кратчайший путь между двумя городами.
На этом изображении одна из линий — прямая, самый простой путь между Нью-Йорком и Стамбулом, можно просто взять курс на восток и лететь. Но если вы предпочитаете пу