Памятка/шпаргалка по SQL
Доброго времени суток, друзья!
Изучение настоящей шпаргалки не сделает вас мастером SQL, но позволит получить общее представление об этом языке программирования и возможностях, которые он предоставляет. Рассматриваемые в шпаргалке возможности являются общими для всех или большинства диалектов SQL.
Для более полного погружения в SQL рекомендую изучить эти руководства по MySQL и PostreSQL от Метанита. Они хороши тем, что просты в изучении и позволяют быстро начать работу с названными СУБД.
Официальная документация по MySQL.
Официальная документация по PostreSQL (на русском языке).
Свежий туториал по SQL от Codecamp.
При обнаружении ошибок, опечаток и неточностей, не стесняйтесь писать мне в личку.
Содержание
Что такое SQL?
SQL — это язык структурированных запросов (Structured Query Language), позволяющий хранить, манипулировать и извлекать данные из реляционных баз данных (далее — РБД, БД).
↥ Наверх
Почему SQL?
SQL позволяет:
- получать доступ к данным в системах управления РБД
- описывать данные (их структуру)
- определять данные в БД и управлять ими
- взаимодействовать с другими языками через модули SQL, библиотеки и предваритальные компиляторы
- создавать и удалять БД и таблицы
- создавать представления, хранимые процедуры (stored procedures) и функции в БД
- устанавливать разрешения на доступ к таблицам, процедурам и представлениям
↥ Наверх
Процесс SQL
При выполнении любой SQL-команды в любой RDBMS (Relational Database Management System — система управления РБД, СУБД, например, PostreSQL, MySQL, MSSQL, SQLite и др.) система определяет наилучший способ выполнения запроса, а движок SQL определяет способ интерпретации задачи.
В данном процессе участвует несколького компонентов:
- диспетчер запросов (Query Dispatcher)
- движок оптимизации (Optimization Engines)
- классический движок запросов (Classic Query Engine)
- движок запросов SQL (SQL Query Engine) и т.д.
Классический движок обрабатывает все не-SQL-запросы, а движок SQL-запросов не обрабатывает логические файлы.
↥ Наверх
Команды SQL
Стандартными командами для взаимодействия с РБД являются CREATE
, SELECT
, INSERT
, UPDATE
, DELETE
и DROP
. Эти команды могут быть классифицированы следующим образом:
DDL
— язык определения данных (Data Definition Language)
DML
— язык изменения данных (Data Manipulation Language)
DCL
— язык управления данными (Data Control Language)
Обратите внимание: использование верхнего регистра в названиях команд SQL — это всего лишь соглашение, большинство СУБД нечувствительны к регистру. Тем не менее, форма записи инструкций, когда названия команд пишутся большими буквами, а названия таблиц, колонок и др. — маленькими, позволяет быстро определять назначение производимой с данными операции.
↥ Наверх
Что такое таблица?
Данные в СУБД хранятся в объектах БД, называемых таблицами (tables). Таблица, как правило, представляет собой коллекцию связанных межуд собой данных и состоит из определенного количества колонок и строк.
Таблица — это самая распространенная и простая форма хранения данных в РБД. Вот пример таблицы с пользователями (users):
↥ Наверх
Что такое поле?
Каждая таблица состоит из небольших частей — полей (fields). Полями в таблице users являются userId, userName, age, city и status. Поле — это колонка таблицы, предназначенная для хранения определенной информации о каждой записи в таблице.
Обратите внимание: вместо userId
и userName
можно было бы использовать id
и name
, соответственно. Но при работе с несколькими объектами, содержащими свойство id
, бывает сложно понять, какому объекту принадлежит идентификатор, особенно, если вы, как и я, часто прибегаете к деструктуризации. Что касается слова name
, то оно часто оказывается зарезервизованным, т.е. уже используется в среде, в которой выполняется код, поэтому я стараюсь его не использовать.
↥ Наверх
Что такое запись или строка?
Запись или строка (record/row) — это любое единичное вхождение (entry), существующее в таблице. В таблице users
5 записей. Проще говоря, запись — это горизонтальное вхождение в таблице.
↥ Наверх
Что такое колонка?
Колонка (column) — это вертикальное вхождение в таблице, содержащее всю информацию, связанную с определенным полем. В таблице users
одной из колонок является city
, которая содержит названия городов, в которых проживают пользователи.
↥ Наверх
Что такое нулевое значение?
Нулевое значение (NULL) — это значение поля, которое является пустым, т.е. нулевое значение — это значение поля, не имеющего значения. Важно понимать, что нулевое значение отличается от значения 0
и от значения поля, содержащего пробелы (). Поле с нулевым значением — это такое поля, которое осталось пустым при создании записи.
↥ Наверх
Ограничения SQL
Ограничения (constraints) — это правила, применяемые к данным. Они используются для ограничения данных, которые могут быть записаны в таблицу. Это обеспечивает точность и достоверность данных в БД.
Ограничения могут устанавливаться как на уровне колонки, так и на уровне таблицы.
Среди наиболее распространенных ограничений можно назвать следующие:
NOT NULL
— колонка не может иметь нулевое значениеDEFAULT
— значение колонки по умолчаниюUNIQUE
— все значения колонки должны быть уникальнымиPRIMARY KEY
— первичный или основной ключ, уникальный идентификатор записи в текущей таблицеFOREIGN KEY
— внешний ключ, уникальный идентификатор записи в другой таблице (таблице, связанной с текущей)CHECK
— все значения в колонке должны удовлетворять определенному условиюINDEX
— быстрая запись и извлечение данных
Любое ограничение может быть удалено с помощью команды ALTER TABLE
и DROP CONSTRAINT
+ название ограничения. Некоторые реализации предоставляют сокращения для удаления ограничений и возможность отключать ограничения вместо их удаления.
↥ Наверх
Целостность данных
В каждой СУБД существуют следующие категории целостности данных:
- целостность объекта (Entity Integrity) — в таблице не должно быть дубликатов (двух и более строк с одинаковыми значениями)
- целостность домена (Domain Integrity) — фильтрация значений по типу, формату или диапазону
- целостность ссылок (Referential integrity) — строки, используемые другими записями (строки, на которые в других записях имеются ссылки), не могут быть удалены
- целостность, определенная пользователем (User-Defined Integrity) — дополнительные правила
↥ Наверх
Нормализация БД
Нормализация — это процесс эффективной организации данных в БД. Существует две главных причины, обуславливающих необходимость нормализации:
- предотвращение записи в БД лишних данных, например, хранения одинаковых данных в разных таблицах
- обеспечение «оправданной» связи между данными
Нормализация предполагает соблюдение нескольких форм. Форма — это формат структурирования БД. Существует три главных формы: первая, вторая и, соответственно, третья. Я не буду вдаваться в подробности об этих формах, при желании, вы без труда найдете необходимую информацию.
↥ Наверх
Синтаксис SQL
Синтаксис — это уникальный набор правил и рекомендаций. Все инструкции SQL
должны начинаться с ключевого слова, такого как SELECT
, INSERT
, UPDATE
, DELETE
, ALTER
, DROP
, CREATE
, USE
, SHOW
и т.п. и закнчиваться точкой с запятой (;
). SQL
не чувствителен к регистру, т.е. SELECT
, select
и SeLeCt
являются идентичными инструкицями. Исключением из этого правила является MySQL
, где учитывается регистр в названии таблицы.
Примеры синтаксиса
-- выборка
SELECT col1, col2, ...colN
FROM tableName;
SELECT DISTINCT col1, col2, ...colN
FROM tableName;
SELECT col1, col2, ...colN
FROM tableName
WHERE condition;
SELECT col1, col2, ...colN
FROM tableName
WHERE condition1 AND|OR condition2;
SELECT col2, col2, ...colN
FROM tableName
WHERE colName IN (val1, val2, ...valN);
SELECT col1, col2, ...colN
FROM tableName
WHERE colName BETWEEN val1 AND val2;
SELECT col1, col2, ...colN
FROM tableName
WHERE colName LIKE pattern;
SELECT col1, col2, ...colN
FROM tableName
WHERE condition
ORDER BY colName [ASC|DESC];
SELECT SUM(colName)
FROM tableName
WHERE condition
GROUP BY colName;
SELECT COUNT(colName)
FROM tableName
WHERE condition;
SELECT SUM(colName)
FROM tableName
WHERE condition
GROUP BY colName
HAVING (function condition);
-- создание таблицы
CREATE TABLE tableName (
col1 datatype,
col2 datatype,
...
colN datatype,
PRIMARY KEY (одна или более колонка)
);
-- удаление таблицы
DROP TABLE tableName;
-- создание индекса
CREATE UNIQUE INDEX indexName
ON tableName (col1, col2, ...colN);
-- удаление индекса
ALTER TABLE tableName
DROP INDEX indexName;
-- получение описания структуры таблицы
DESC tableName;
-- очистка таблицы
TRUNCATE TABLE tableName;
-- добавление/удаление/модификация колонок
ALTER TABLE tableName ADD|DROP|MODIFY colName [datatype];
ALTER TABLE tableName RENAME TO newTableName;
-- вставка значений
INSERT INTO tableName (col1, col2, ...colN)
VALUES (val1, val2, ...valN)
-- обновление записей
UPDATE tableName
SET col1 = val1, col2 = val2, ...colN = valN
[WHERE condition];
-- удаление записей
DELETE FROM tableName
WHERE condition;
-- создание БД
CREATE DATABASE [IF NOT EXISTS] dbName;
-- удаление БД
DROP DATABASE [IF EXISTS] dbName;
-- выбор БД
USE dbName;
-- завершения транзакции
COMMIT;
-- отмена изменений
ROLLBACK;
↥ Наверх
Типы данных
Каждая колонка, переменная и выражение в SQL
имеют определенный тип данных (data type). Основные категории типов данных:
Точные числовые
Приблизительные числовые
Дата и время
Строковые символьные
Строковые символьные (юникод)
Бинарные
Смешанные
↥ Наверх
Операторы
Оператор (operators) — это ключевое слово или символ, которые, в основном, используются в инструкциях WHERE
для выполнения каких-либо операций. Они используются как для определения условий, так и для объединения нескольких условий в инструкции.
В дальнейших примерах мы будем исходить из предположения, что переменная a
имеет значение 10
, а b
— 20
.
Арифметические
Операторы сравнения
Логические операторы
↥ Наверх
Выражения
Выражение (expression) — это комбинация значений, операторов и функций для оценки (вычисления) значения. Выражения похожи на формулы, написанные на языке запросов. Они могут использоваться для извлечения из БД определенного набора данных.
Базовый синтаксис выражения выглядит так:
SELECT col1, col2, ...colN
FROM tableName
WHERE [condition|expression];
Существуют различные типы выражений: логические, числовые и выражения для работы с датами.
Логические
Логические выражения извлекают данные на основе совпадения с единичным значением.
SELECT col1, col2, ...colN
FROM tableName
WHERE выражение дял поиска совпадения с едичиным значением;
Предположим, что в таблице users
имеются следующие записи:
Выполняем поиск активных пользователей:
SELECT * FROM users WHERE status = active;
Результат:
Числовые
Используются для выполнения арифметических операций в запросе.
SELECT numericalExpression as operationName
[FROM tableName
WHERE condition];
Простой пример использования числового выражения:
SELECT (10 + 5) AS addition;
Результат:
Существует несколько встроенных функций, таких как count()
, sum()
, avg()
, min()
, max()
и др. для выполнения так называемых агрегирующих вычислений данных таблицы или колонки.
SELECT COUNT(*) AS records FROM users;
Результат:
AVG
— вычисляет среднее значениеSUM
— вычисляет сумму значенийMIN
— вычисляет наименьшее значениеMAX
— вычисляет наибольшее значениеCOUNT
— вычисляет количество записей в таблице
Также существует несколько встроенных функция для работы со строками:
CONCAT
— объединение строкLENGTH
— возвращает количество символов в строкеTRIM
— удаляет пробелы в начала и конце строкиSUBSTRING
— извлекат подстроку из строкиREPLACE
— заменяет подстроку в строкеLOWER
— переводит символы строки в нижний регистрUPPER
— переводит символы строки в верхний регистр и т.д.
с числами:
ROUND
— округляет числоTRUNCATE
— обрезает дробное число до указанного количества знаков после запятойCEILING
— возвращает наименьшее целое число, которое больше или равно текущему значениюFLOOR
— возвращает наибольшее целое число, которое меньше или равно текущему значениюPOWER
— возводит число в указанную степеньSQRT
— возвращает квадратный корень числаRAND
— генерирует случайное число с плавающей точкой в диапазоне от 0 до 1
Выражения для работы с датами
Эти выражения, как правило, возвращают текущую дату и время.
SELECT CURRENT_TIMESTAMP;
Результат:
CURRENT_TIMESTAMP
— это и выражение, и функция (CURRENT_TIMESTAMP()
). Другая функция для получения текущей даты и времени — NOW()
.
Другие функции для получения текущей даты и времени:
CURDATE
/CURRENT_DATE
— возвращает текущую датуCURTIME
/CURRENT_TIME
— возвращает текущее время и т.д.
Функции для разбора даты и времени:
DAYOFMONTH(date)
— возвращает день месяца в виде числаDAYOFWEEK(date)
— возвращает день недели в виде числаDAYOFYEAR(date)
— возвращает номер дня в годуMONTH(date)
— возвращает месяцYEAR(date)
— возвращает годLAST_DAY(date)
— возвращает последний день месяца в виде датыHOUR(time)
— возвращает часMINUTE(time)
— возвращает минутыSECOND(time)
— возвращает секунды и др.
Функции для манипулирования датами:
DATE_ADD(date, interval)
— выполняет сложение даты и определенного временного интервалаDATE_SUB(date, interval)
— выполняет вычитание из даты определенного временного интервалаDATEDIFF(date1, date2)
— возвращает разницу в днях между двумя датамиTO_DAYS(date)
— возвращает количество дней с 0-го годаTIME_TO_SEC(time)
— возвращает количество секунд с полуночи и др.
Для форматирования даты и времени используются функции DATE_FORMAT(date, format)
и TIME_FORMAT(date, format)
, соответственно.
↥ Наверх
Создание БД
Для создания БД используется инструкция CREATE DATABASE
.
CREATE DATABASE dbName;
-- или
CREATE DATABASE IF NOT EXISTS dbName;
Условие IF NOT EXISTS
позволяет избежать получения ошибки при попытке создания БД, которая уже существует.
Название БД должно быть уникальным в пределах СУБД.
Создаем БД testDB
:
CREATE DATABASE testDB;
Получаем список БД:
SHOW DATABASES;
Результат:
↥ Наверх
Удаление БД
Для удаления БД используется инструкция DROP DATABASE
.
DROP DATABASE dbName;
-- или
DROP DATABASE IF EXISTS dbName;
Условие IF EXISTS
позволяет избежать получения ошибки при попытке удаления несуществующей БД.
Удаляем testDB
:
DROP DATABASE testDB;
Обратите внимание: при удалении БД уничтожаются все данные, которые в ней хранятся, так что будьте предельно внимательны при использовании данной команды.
Проверяем, что БД удалена:
SHOW DATABASES;
Для получения списка таблиц используется инструкция SHOW TABLES
.
Результат:
↥ Наверх
Выбор БД
При наличии нескольких БД, перед выполнением каких-либо операций, необходимо выбрать БД. Для этого используется инструкция USE
.
USE dbName;
Предположим, что мы не удаляли testDB
. Тогда мы можем выбрать ее так:
USE testDB;
↥ Наверх
Создание таблицы
Создание таблицы предполагает указание названия таблицы и определение колонок таблицы и их типов данных. Для создания таблицы используется инструкция CREATE TABLE
.
CREATE TABLE tableName (
col1 datatype,
col2 datatype,
...
colN datatype,
PRIMARY KEY (хотя бы одна колонка)
);
Для создания таблицы путем копирования другой таблицы используется сочетание CREATE TABLE
и SELECT
.
Пример создания таблицы users
, где первичным ключом являются идентификаторы пользователей, а поля для имени и возраста пользователя не могут быть нулевыми:
CREATE TABLE users (
userId INT,
userName VARCHAR(20) NOT NULL,
age INT NOT NULL,
city VARCHAR(20),
status VARCHAR(8),
PRIMARY KEY (id)
);
Проверяем, что таблица была создана:
DESC users;
Результат:
↥ Наверх
Удаление таблицы
Для удаления таблицы используется инструкция DROP TABLE
.
Обратите внимание: при удалении таблицы, навсегда удаляются все хранящиеся в ней данные, индексы, триггеры, ограничения и разрешения, так что будьте предельно внимательны при использовании данной команды.
Удаляем таблицу users
:
DROP TABLE users;
Теперь, если мы попытаемся получить описание users
, то получим ошибку:
DESC users;
-- ERROR 1146 (42S02): Table 'testDB.users' doesn't exist
↥ Наверх
Добавление колонок
Для добавления в таблицу колонок используется инструкция INSERT INTO
.
INSERT INTO tableName (col1, col2, ...colN)
VALUES (val1, val2, ...valN);
Названия колонок можно не указывать, однако, в этом случае значения должны перечисляться в правильном порядке.
INSERT INTO tableName VALUES (val1, val2, ...valN);
Во избежание ошибок, рекомендуется всегда перечислять названия колонок.
Предположим, что мы не удаляли таблицу users
. Заполним ее пользователями:
INSERT INTO users (userId, userName, age, city, status)
VALUES (1, 'Igor', 25, 'Moscow', 'active');
INSERT INTO users (userId, userName, age, city, status)
VALUES (2, 'Vika', 26, 'Ekaterinburg', 'inactive');
INSERT INTO users (userId, userName, age, city, status)
VALUES (3, 'Elena', 27, 'Ekaterinburg', 'active');
В таблицу можно добавлять несколько строк за один раз.
INSERT INTO users (userId, userName, age, city, status)
VALUES
(1, 'Igor', 25, 'Moscow', 'active'),;
(2, 'Vika', 26, 'Ekaterinburg', 'inactive'),
(3, 'Elena', 27, 'Ekaterinburg', 'active');
Также, как было отмечено, при добавлении строки названия полей можно опускать:
INSERT INTO users
VALUES (4, 'Oleg', 28, 'Moscow', 'inactive');
Результат:
Заполнение таблицы с помощью другой таблицы
INSERT INTO tableName [(col1, col2, ...colN)]
SELECT col1, col2, ...colN
FROM anotherTable
[WHERE condition];
↥ Наверх
Выборка полей
Для выборки полей из таблицы используется инструкция SELECT
. Она возвращает данные в виде результирующей таблицы (результирующего набора, result-set).
SELECT col1, col2, ...colN
FROM tableName;
Для выборки всех полей используется такой синтаксис:
SELECT * FROM tableName;
Произведем выборку полей userId
, userName
и age
из таблицы users
:
SELECT userId, userName, age FROM users;
Результат:
↥ Наверх
Предложение WHERE
Предложение WHERE
используется для фильтрации возвращаемых данных. Оно используется совместно с SELECT
, UPDATE
, DELETE
и другими инструкциями.
SELECT col1, col2, ...col2
FROM tableName
WHERE condition;
Условие (condition), которому должны удовлетворять возвращаемые записи, определяется с помощью операторов сравнения или логических операторов типа >
, <
, =
, NOT
, LIKE
и т.д.
Сделаем выборку полей userId
, userName
и age
активных пользователей:
SELECT userId, userName, age
FROM users
WHERE status = 'active';
Результат:
Сделаем выборку полей userId
, age
и city
пользователя с именем Vika
.
SELECT userId, age, city
FROM users
WHERE userName = 'Vika';
Результат:
Обратите внимание: строки в предложении WHERE
должны быть обернуты в одинарные кавычки (''
), а числа, напротив, указываются как есть.
↥ Наверх
Конъюктивные операторы AND
и OR
Операторы AND
и OR
используются для соединения нескольких условий при фильтрации данных.
AND
SELECT col1, col2, ...colN
FROM tableName
WHERE condition1 AND condition2 ...AND conditionN;
Возвращаемые записи должны удовлетворять всем указанным условиям.
Сделаем выборку полей userId
, userName
и age
активных пользователей старше 26 лет:
SELECT userId, userName, age
FROM users
WHERE status = active AND age > 26;
Результат:
OR
SELECT col1, col2, ...colN
FROM tableName
WHERE condition1 OR condition2 ...OR conditionN;
Возвращаемые записи должны удовлетворять хотя бы одному условию.
Сделаем выборку тех же полей неактивных пользователей или пользователей, младше 27 лет:
SELECT userId, userName, age
FROM users
WHERE status = inactive OR age < 27;
Результат:
↥ Наверх
Обновление полей
Для обновления полей используется инструкция UPDATE ... SET
. Эта инструкция, обычно, используется в сочетании с предложением WHERE
.
UPDATE tableName
SET col1 = val1, col2 = val2, ...colN = valN
[WHERE condition];
Обновим возраст пользователя с именем Igor
:
UPDATE users
SET age = 30
WHERE username = 'Igor';
Если в данном случае опустить WHERE
, то будет обновлен возраст всех пользователей.
↥ Наверх
Удаление записей
Для удаления записей используется инструкция DELETE
. Эта инструкция также, как правило, используется в сочетании с предложением WHERE
.
DELETE FROM tableName
[WHERE condition];
Удалим неактивных пользователей:
DELETE FROM users
WHERE status = 'inactive';
Если в данном случае опустить WHERE
, то из таблицы users
будут удалены все записи.
↥ Наверх
Предложения LIKE
и REGEX
LIKE
Предложение LIKE
используется для сравнения значений с помощью операторов с подстановочными знаками. Существует два вида таких операторов:
- проценты (
%
) - нижнее подчеркивание (
_
)
%
означает 0, 1 или более символов. _
означает точно 1 символ.
SELECT col1, col2, ...colN FROM tableName
WHERE col LIKE 'xxx%'
-- или
WHERE col LIKE '%xxx%'
-- или
WHERE col LIKE '%xxx'
-- или
WHERE col LIKE 'xxx_'
-- и т.д.
Примеры:
Сделаем выборку неактивных пользователей:
SELECT * FROM users
WHERE status LIKE 'in%';
Результат:
Сделаем выборку пользователей 30 лет и старше:
SELECT * FROM users
WHERE age LIKE '3_';
Результат:
REGEX
Предложение REGEX
позволяет определять регулярное выражение, которому должна соответствовать запись.
SELECT col1, col2, ...colN FROM tableName
WHERE colName REGEXP регулярное выражение;
В регулярное выражении могут использоваться следующие специальные символы:
^
— начало строки$
— конец строки.
— любой символ[символы]
— любой из указанных в скобках символов[начало-конец]
— любой символ из диапазона|
— разделяет шаблоны
Сделаем выборку пользователей с именами Igor
и Vika
:
SELECT * FROM users
WHERE userName REGEXP 'Igor|Vika';
Результат:
↥ Наверх
Предложение TOP
/LIMIT
/ROWNUM
Данные предложения позволяют извлекать указанное количество или процент записей с начала таблицы. Разные СУБД поддерживают разные предложения.
SELECT TOP number|percent col1, col2, ...colN
FROM tableName
[WHERE condition];
Сделаем выборку первых трех пользователей:
SELECT TOP 3 * FROM users;
Результат:
В mysql
:
SELECT * FROM users
LIMIT 3, [offset];
Параметр offset
(смещение) определяет количество пропускаемых записей. Например, так можно извлечь первых двух пользователей, начиная с третьего:
SELECT * FROM users
LIMIT 2, 2;
В oracle
:
SELECT * FROM users
WHERE ROWNUM <= 3;
↥ Наверх
Предложения ORDER BY
и GROUP BY
ORDER BY
Предложение ORDER BY
используется для сортировки данных по возрастанию (ASC
) или убыванию (DESC
). Многие СУБД по умолчанию выполняют сортировку по возрастанию.
SELECT col1, col2, ...colN
FROM tableName
[WHERE condition]
[ORDER BY col1, col2, ...colN] [ASC | DESC];
Обратите внимание: колонки для сортировки должны быть указаны в списке колонок для выборки.
Сделаем выборку пользователей, отсортировав их по городу и возрасту:
SELECT * FROM users
ORDER BY city, age;
Результат:
Теперь выполним сортировку по убыванию:
SELECT * FROM users
ORDER BY city, age DESC;
Определим собственный порядок сортировки по убыванию:
SELECT * FROM users
ORDER BY (CASE city
WHEN 'Ekaterinburg' THEN 1
WHEN 'Moscow' THEN 2
ELSE 100 END) ASC, city DESC;
GROUP BY
Предложение GROUP BY
используется совместно с инструкцией SELECT
для группировки записей. Оно указывается после WHERE
и перед ORDER BY
.
SELECT col1, col2, ...colN
FROM tableName
WHERE condition
GROUP BY col1, col2, ...colN
ORDER BY col1, col2, ...colN;
Сгруппируем активных пользователей по городам:
SELECT city, COUNT(city) AS amount FROM users
WHERE status = active
GROUP BY city
ORDER BY city;
Результат:
↥ Наверх
Ключевое слово DISTINCT
Ключевое слово DISTINCT
используется совместно с инструкцией SELECT
для удаления дубликатов и возврата только уникальных записей.
SELECT DISTINCT col1, col2, ...colN
FROM tableName
[WHERE condition];
Сделаем выборку городов проживания пользователей:
SELECT DISTINCT city
FROM users;
Результат:
↥ Наверх
Объединения
Объединения используются для комбинации записей двух и более таблиц.
Предположим, что кроме users
, у нас имеется таблица orders
с заказами пользователей следующего содержания:
Сделаем выборку полей userId
, userName
, age
и amount
из наших таблиц посредством их объединения:
SELECT userId, userName, age, amount
FROM users
WHERE users.userId = orders.userId;
Результат:
При объединении таблиц могут использоваться такие операторы, как =
, <
, >
, <>
, <=
, >=
, !=
, BETWEEN
, LIKE
и NOT
, однако наиболее распространенным является =
.
Существуют разные типы объединений:
INNER JOIN
— возвращает записи, имеющиеся в обеих таблицахLEFT JOIN
— возвращает записи из левой таблицы, даже если такие записи отсутствуют в правой таблицеRIGHT JOIN
— возвращает записи из правой таблицы, даже если такие записи отсутствуют в левой таблицеFULL JOIN
— возвращает все записи объединяемых таблицSELF JOIN
— используется для объединения таблицы с самой собойCARTESIAN JOIN
— возвращает декартово произведение набора записей объединяемых таблиц
↥ Наверх
Предложение UNION
Предложение/оператор UNION
используется для комбинации результатов двух и более инструкций SELECT
. При этом, возвращаются только уникальные записи.
В случае с UNION
, каждая инструкция SELECT
должна иметь:
- одинаковый набор колонок для выборки
- одинаковое количество выражений
- одинаковые типы данных колонок и
- одинаковый порядок колонок
Однако, они могут быть разной длины.
SELECT col1, col2, ...colN
FROM table1
[WHERE condition]
UNION
SELECT col1, col2, ...colN
FROM table2
[WHERE condition];
Объединим наши таблицы users
и orders
:
SELECT userId, userName, amount, date
FROM users
LEFT JOIN orders
ON users.useId = orders.userId
UNION
SELECT userId, userName, amount, date
FROM users
RIGHT JOIN orders
ON users.userId = orders.userId;
Результат:
↥ Наверх
Предложение UNION ALL
Предложение UNION ALL
также используется для объединения результатов двух и более инструкций SELECT
. При этом, возвращаются все записи, включая дубликаты.
SELECT col1, col2, ...colN
FROM table1
[WHERE condition]
UNION ALL
SELECT col1, col2, ...colN
FROM table2
[WHERE condition];
Существует еще два предложения, похожих на UNION
:
INTERSECT
— используется для комбинации результатов двух и болееSELECT
, но возвращаются только строки из первогоSELECT
, совпадающие со строками из второгоSELECT
EXCEPT
— возвращаются только строки из первогоSELECT
, отсутствующие во второмSELECT
↥ Наверх
Синонимы
Синонимы (aliases) позволяют временно изменять названия таблиц и колонок. «Временно» означает, что новое название используется только в текущем запросе, в БД название остается прежним.
Синтаксис синонима таблицы:
SELECT col1, col2, ...colN
FROM tableName AS aliasName
[WHERE condition];
Синтаксис синонима колонки:
SELECT colName AS aliasName
FROM tableName
[WHERE condition];
Пример использования синонимов таблиц:
SELECT U.userId, U.userName, U.age, O.amount
FROM users AS U, orders AS O
WHERE U.userId = O.userId;
Результат:
Пример использования синонимов колонок:
SELECT userId AS user_id, userName AS user_name, age AS user_age
FROM users
WHERE status = active;
Результат:
↥ Наверх
Индексы
Создание индексов
Индексы — это специальные поисковые таблицы (lookup tables), которые используются движком БД в целях более быстрого извлечения данных. Проще говоря, индекс — это указатель или ссылка на данные в таблице.
Индексы ускоряют работу инструкции SELECT
и предложения WHERE
, но замедляют работу инструкций UPDATE
и INSERT
. Индексы могут создаваться и удаляться, не оказывая никакого влияния на данные.
Для создания индекса используется инструкция CREATE INDEX
, позволяющая определять название индекса, индексируемые колонки и порядок индексации (по возрастанию или по убыванию).
К индексам можно применять ограничение UNIQUE
для того, чтобы обеспечить их уникальность.
Синтаксис создания индекса:
CREATE INDEX indexName ON tableName;
Синтаксис создания индекса для одной колонки:
CREATE INDEX indexName
ON tableName (colName);
Синтакис создания уникальных индексов (такие индексы используются не только для повышения производительности, но и для обеспечения согласованности данных):
CREATE UNIQUE INDEX indexName
ON tableName (colName);
Синтаксис создания индексов для нескольких колонок (композиционный индекс):
CREATE INDEX indexName
ON tableName (col1, col2, ...colN);
Решение о создании индексов для одной или нескольких колонок следует принимать на основе того, какие колонки будут часто использоваться в запросе WHERE
в качестве условия для сортировки строк.
Для ограничений PRIMARY KEY
и UNIQUE
автоматически создаются неявные индексы.
Удаление индексов
Для удаления индексов используется инструкция DROP INDEX
:
DROP INDEX indexName;
Несмотря на то, что индексы предназначены для повышения производительности БД, существуют ситуации, в которых их использования лучше избегать.
К таким ситуациям относится следующее:
- индексы не должны использоваться в маленьких таблицах
- в таблицах, которые часто и в большом объеме обновляются или перезаписываются
- в колонках, которые содержат большое количество нулевых значений
- в колонках, над которыми часто выполняются операции
↥ Наверх
Обновление таблицы
Команда ALTER TABLE
используется для добавления, удаления и модификации колонок существующей таблицы. Также эта команда используется для добавления и удаления ограничений.
Синтаксис:
-- добавление новой колонки
ALTER TABLE tableName ADD colName datatype;
-- удаление колонки
ALTER TABLE tableName DROP COLUMN colName;
-- изменение типа данных колонки
ALTER TABLE tableName MODIFY COLUMN colName newDatatype;
-- добавление ограничения `NOT NULL`
ALTER TABLE tableName MODIFY colName datatype NOT NULL;
-- добавление ограничения `UNIQUE`
ALTER TABLE tableName
ADD CONSTRAINT myUniqueConstraint UNIQUE (col1, col2, ...colN);
-- добавление ограничения `CHECK`
ALTER TABLE tableName
ADD CONSTRAINT myUniqueConstraint CHECK (condition);
-- добавление первичного ключа
ALTER TABLE tableName
ADD CONSTRAINT myPrimaryKey PRIMARY KEY (col1, col2, ...colN);
-- удаление ограничения
ALTER TABLE tableName
DROP CONSTRAINT myUniqueContsraint;
-- mysql
ALTER TABLE tableName
DROP INDEX myUniqueContsraint;
-- удаление первичного ключа
ALTER TABLE tableName
DROP CONSTRAINT myPrimaryKey;
-- mysql
ALTER TABLE tableName
DROP PRIMARY KEY;
Добавляем в таблицу users
новую колонку — пол пользователя:
ALTER TABLE users ADD sex char(1);
Удаляем эту колонку:
ALTER TABLE users DROP sex;
↥ Наверх
Очистка таблицы
Команда TRUNCATE TABLE
используется для очистки таблицы. Ее отличие от DROP TABLE
состоит в том, что сохраняется структура таблицы (DROP TABLE
полностью удаляет таблицу и все ее данные).
TRUNCATE TABLE tableName;
Очищаем таблицу users
:
TRUNCATE TABLE users;
Проверяем, что users
пустая:
SELECT * FROM users;
-- Empty set (0.00 sec)
↥ Наверх
Представления
Представление (view) — это не что иное, как инструкция, записанная в БД под определенным названием. Другими словами, представление — это композиция таблицы в форме предварительно определенного запроса.
Представления могут содержать все или только некоторые строки таблицы. Представление может быть создано на основе одной или нескольких таблиц (это зависит от запроса для создания представления).
Представления — это виртутальные таблицы, позволяющие делать следующее:
- структурировать данные способом, который пользователи находят наиболее естественным или интуитивно понятным
- ограничивать доступ к данным таким образом, что пользователь может просматривать и (иногда) модифицировать только то, что ему нужно и ничего более
- объединять данные из нескольких таблиц для формирования отчетов
Создание представления
Для создания представления используется инструкция CREATE VIEW
. Как было отмечено, представления могут создаваться на основе одной или нескольких таблиц, и даже на основе другого представления.
CREATE VIEW viewName AS
SELECT col1, col2, ...colN
FROM tableName
[WHERE condition];
Создаем представление для имен и возраста пользователей:
CREATE VIEW usersView AS
SELECT userName, age
FROM users;
Получаем данные с помощью представления:
SELECT * FROM usersView;
Результат:
WITH CHECK OPTION
WITH CHECK OPTION
— это настройка инструкции CREATE VIEW
. Она позволяет обеспечить соответствие всех UPDATE
и INSERT
условию, определенном в представлении.
Если условие не удовлетворяется, выбрасывается исключение.
CREATE VIEW usersView AS
SELECT userName, age
FROM users
WHERE age IS NOT NULL
WITH CHECK OPTION;
Обновление представления
Представление может быть обновлено при соблюдении следующих условий:
SELECT
не содержит ключевого словаDISTINCT
SELECT
не содержит агрегирующих функцийSELECT
не содержит функций установки значенийSELECT
не содержит операций установки значенийSELECT
не содержит предложенияORDER BY
FROM
не содержит больше одной таблицыWHERE
не содержит подзапросы- запрос не содержит
GROUP BY
илиHAVING
- вычисляемые колонки не обновляются
- все ненулевые колонки из базовой таблицы включены в представление в том же порядке, в каком они указаны в запросе
INSERT
Пример обновления возраста пользователя с именем Igor
в представлении:
UPDATE usersView
SET age = 31
WHERE userName = 'Igor';
Обратите внимание: обновление строки в представлении приводит к ее обновлению в базовой таблице.
В представление могут добавляться новые строки с помощью команды INSERT
. П