Рекомендации по разработке баз данных и клиентских приложений

3abe5c01307a8384579b8805ee98fe57.png

Привет, Хабр! Представляю Вашему вниманию небольшой список рекомендаций по разработке и сопровождению баз данных, надеюсь будет полезным!

Я постарался составить достаточно универсальный список, но все же, некоторые советы могут быть не применимы к определенным базам данных и типам приложений. Большинство рекомендаций было мной использовано в реальных проектах, например в одном из проектов простое увеличение FetchSize позволили ускорить загрузку приложения в три раза.

Хорошая схема базы данных решает многие вопросы в приложении, постарайтесь изучить и применять лучшие практики, плохо спроектированная схема доставит вам и вашим коллегам много хлопот.

Наиболее частый анти-паттерн в схемах это широкая таблица.

Приведу парочку таблиц, с которыми мне приходилось сталкиваться в проектах.

Table: Usl, Cols: Usl1…Usl88, далее в приложениях ну очень интересный код типа Usl1+…+Usl88

Table: DDUContracts, Cols: FirstPay, FirsPayDate, SecondPay, SecondPayDate — ну вы поняли, первой задачей в данном проекте мне было добавить третий платеж :)

Table: Contragents, Cols: Addr1, Addr2, Phone, MobilePhone — тоже реальный пример, попробуйте добавить третий адрес или новый тип телефона.

Table: GoodTable, Cols: Fld1, Fld2…Fld300

При проектировании схемы хранения, если сложно определиться с уровнем нормализации, лучше использовать третью нормальную форму.

В рамках проектируемой схемы должны быть приняты соглашения по именованию объектов, все создаваемые таблицы, представления, функции и прочие объекты базы данных должны создаваться по принятым соглашениям. Для упрощения поддержки соглашений, рекомендуется использовать шаблоны и (или) вспомогательные утилиты по генерации объектов.

Все объекты (таблицы, колонки, представления и т.д.) необходимо тщательно комментировать, если в используемой базе данных предусмотрены комментарии желательно использовать данные механизмы,   если база данных не поддерживает комментарий, можно разработать собственный механизм хранения комментариев.

Старайтесь минимизировать использование вызовы функций в условиях WHERE,   вызовы функций могут мешать использованию индексов и сильно замедлять получение данных.

При написании SQL запросов, особое внимание стоит обращать на количество логических чтений, большое количество логических чтений обычно указывает на недостаточное покрытие запроса индексами (Sargable).

В процессе проектирования и разработки базы данных, старайтесь полностью изучить механизмы предоставляемые поставщиком базы данных, например в Microsoft SQL Server последних версии существуют таблицы хранимые в памяти и хранимые вычисляемые колонки.

Если проект предусматривает поддержку нескольких баз данных, старайтесь применять ANSI SQL и не используйте слишком специфичные инструменты без сильной необходимости.

В современной практике разработки не рекомендуется использовать такой механизм баз данных как хранимые процедуры, это сильно ограничивает возможность изменения поставщика базы данных.

Старайтесь изучать и избегать узкие места заложенные проектировщиками используемой базы данных, например функция NVL (a, b) в Oracle интерпретирует оба аргумента, если аргумент b является подзапросом или вызовом функции, лучше использовать функцию COALESCE.

Примите во внимание, что сложные базы данных содержат достаточно много ошибок, постарайтесь ознакомиться со списком известных ошибок и принять во внимание данный фактор.

Весь код исполняемых объектов  (функции, процедуры, триггеры и т.д.) должен содержать подробное описание, желательно с работающими примерами вызовов и результатами.

Если в БД существует достаточно большое количество вспомогательных самописных функций и процедур, должен существовать подробный список с описанием, вместо списка можно использовать отдельную схему или соглашения по именованию, например вспомогательные функции по работе с датами можно создать в отдельной схеме UtilsDateTime.

Названия таблиц в множественном числе помогут избежать использования зарезервированных слов, их кстати удивительно много в базах данных.

Настройте и протестируйте механизмы бекапов.

Настройте механизмы обслуживания рекомендуемые для используемой базы данных, обычно это дефрагментация индексов и перестроение статистики.

Для удобства разработки и сопровождения, в достаточно больших командах принято использовать следующий набор баз данных (продуктовая, тестовая, стенд, общая или индивидуальная для разработки).  На текущий момент очень удобно разворачивать индивидуальные базы данных для разработчиков с использованием Docker.

Запланируйте регулярный аудит схем БД, например удаляйте неиспользуемые колонки.

Поскольку SQL код бывает достаточно плотным и не всегда хорошо читабельным, старайтесь оставлять подробные комментарии в данных случаях.

Старайтесь комментировать или давать описательные имена всем магическим константам, также иногда можно выносить константы в простые SQL функции.

Для улучшения читабельности рассмотрите возможность использования CTE.

В определенных условиях не всегда удается стандартными SQL средствами  получить требуемую производительность, в данном случае можно использовать кэширующие таблицы, вычисляемые хранимые колонки, материализованные представления и прочие механизмы и методы для достижения требуемых параметров производительности.

Все колонки в БД по размерности должны быть максимально приближены к хранимым значениям, слишком большие колонки могут негативно повлиять на производительность и место занимаемое таблицами.

Если при проектировании таблиц заранее известно про очень большую размерность таблиц, необходимо предусмотреть механизм секционирования таблиц.

Все изменения в объектах БД также необходимо хранить в GIT или любой другой используемой на проекте системе контроля версий.

Настройте логирование изменений объектов БД, обычно это триггер уровня БД и таблица в которую триггер записывает все изменения в объектах БД.

Разработка клиентских приложений и сервисов с использованием баз данных

Следите за размером строк в байтах генерируемые запросами на чтение данных, неоправданно большие размеры строк могут негативно сказаться на производительности как БД так и клиентских приложений. В исключительных случаях, можно увеличить параметр FetchSize в провайдере данных, для ускорения получения данных клиентским приложением.

Некоторые базы данных и провайдеры обеспечивают возможности для эффективной отмены SQL запросов, в данном случае в интерфейс можно добавить кнопку для отмены запросов.

В запросах старайтесь запрашивать только данные которые нужны в вашем приложении, в некоторых случаях логирование неиспользуемых данных можно достаточно просто добавить в код приложения. 

В проектах с большой нагрузкой, постарайтесь изучить и правильно использовать ConnectionPool.

Для повышения производительности приложений, рассмотрите возможность использования асинхронных запросов.

Для повышения производительности приложений старайтесь по возможности кешировать данные полученные из базы данных на клиенте.

С некоторыми операциями базы данных справляются достаточно плохо, в данном случае рассмотрите вопрос переноса операции на сторону клиента, например склеивание blob файлов в MS-SQL может быть достаточно медленным.

© Habrahabr.ru