Производительность компилятора при работе с концептами в C++20
Привет, меня зовут Александр, я старший разработчик ПО в Центре разработки Orion Innovation. Хочу признаться, я люблю рассказывать про C++ и не только на различных митапах и конференциях. И вот я добрался до Хабра. На CppConf Russia Piter 2020 я рассказывал про концепты и после выступления получил очень много вопросов про производительность компилятора при работе с ними. Замеры производительности не были целью моего доклада: мне было известно, что концепты компилируются с примерно такой же скоростью, что и обычные метапрограммы, а до детального сравнения я смог добраться совершенно недавно. Спешу поделиться результатом!
Несколько слов о концептах
Концепты — переосмысление метапрограммирования, аналогичное constexpr. Если constexpr — это про вычисление выражений во время компиляции, будь то факториал, экспонента и так далее, то концепты — это про перегрузки, специализации, условия существования сущностей. В общем, про «чистое метапрограммирование». Иными словами, в C++20 появилась возможность писать конструкции без единой, привычной для нас треугольной скобки, тем самым получая возможность быстро и читаемо описать какую-либо перегрузку или специализацию:
// #1
void increment(auto & arg) requires requires { ++arg; };
// #2
void increment(auto &);
struct Incrementable { Incrementable & operator++() { return *this; } };
struct NonIncrementable {};
void later() {
Incrementable i;
NonIncrementable ni;
increment(i); // Вызывается #1
increment(ni); // Вызывается #2
}
О том, как всё это работает, есть море информации, например, отличный гайд «Концепты: упрощаем реализацию классов STD Utility» по мотивам выступления Андрея Давыдова на C++ Russia 2019. Ну, а мы сфокусируемся на том, какой ценой достигается подобный функционал, чтобы убедиться, что это не только просто, быстро и красиво, но ещё и эффективно.
Описание эксперимента
Итак, мы будем наблюдать за следующими показателями:
Время компиляции
Размер объектного файла
Количество символов в записи (или же количество кода), в некоторых случаях
Прежде чем мы начнём несколько важных уточнений:
Во-первых, при подсчёте количества символов в записи мы будем считать все не пустые.
Во-вторых, в данной статье мы посмотрим лишь на самые простые (буквально несколько строк) случаи, чтобы быть уверенными на 100%, что мы сравниваем абсолютно аналогичные фрагменты кода.
В-третьих, поскольку компилируемые примеры крайне просты, время компиляции выражается в десятках миллисекунд. Чтобы исключить погрешность, для времени компиляции мы будем использовать усреднённые значения за 100 запусков.
В замерах будут участвовать clang 12.0.0 и g++ 10.3.0, как с полной оптимизацией, так и без неё.
В качестве операционной системы выступит Ubuntu 16.04, запущенная на Windows 10 через WSL2. На всякий случай прилагаю характеристики ПК:
Характеристики ПК------------------
System Information
------------------
Operating System: Windows 10 Enterprise 64-bit (10.0, Build 19043) (19041.vb_release.191206-1406)
Language: Russian (Regional Setting: Russian)
System Manufacturer: Dell Inc.
System Model: Latitude 5491
BIOS: 1.12.0 (type: UEFI)
Processor: Intel(R) Core(TM) i5-8300H CPU @ 2.30GHz (8 CPUs), ~2.3GHz
Memory: 32768MB RAM
Available OS Memory: 32562MB RAM
Page File: 9995MB used, 27430MB available
------------------------
Disk & DVD/CD-ROM Drives
------------------------
Drive: C:
Free Space: 26.5 GB
Total Space: 243.0 GB
File System: NTFS
Model: SAMSUNG SSD PM871b M.2 2280 256GB
Эксперименты
После необходимых отступлений мы можем, наконец, начать эксперименты.
Эксперимент №1: Эволюция метапрограммирования
Для начала посмотрим на то, как компиляторы справляются с созданием перегрузки функции для инкрементируемых и неинкрементируемых типов данных аргумента. Компилируемый код для C++ 03, 17 и 20 представлены ниже. Один из показателей, а именно — объем кода, можно оценить уже сейчас: видно, что количество кода существенно сокращается по мере эволюции языка, уступая место читаемости и простоте.
Код// copied from boost
template
struct enable_if { typedef T type; };
template
struct enable_if {};
namespace is_inc {
typedef char (&yes)[1]; typedef char (&no)[2];
struct tag {};
struct any { template <class T> any(T const&); };
tag operator++(any const &);
template<typename T>
static yes test(T const &);
static no test(tag);
template<typename _T> struct IsInc
{
static _T & type_value;
static const bool value = sizeof(yes) == sizeof(test(++type_value));
};
}
template
struct IsInc : public is_inc::IsInc {};
template
typename enable_if::value>::type increment(Ty &);
template
typename enable_if::value>::type increment(Ty &);
struct Incrementable { Incrementable & operator++() { return *this; } };
struct NonIncrementable {};
void later() {
Incrementable i;
NonIncrementable ni;
increment(i);
increment(ni);
}
#include
template>
struct IsInc : std::false_type {};
template
struct IsInc() )>>
: std::true_type
{};
template
std::enable_if_t::value> increment(Ty &);
template
std::enable_if_t::value> increment(Ty &);
struct Incrementable { Incrementable & operator++() { return *this; } };
struct NonIncrementable {};
void later() {
Incrementable i;
NonIncrementable ni;
increment(i);
increment(ni);
}
void increment(auto & arg) requires requires { ++arg; };
void increment(auto &);
struct Incrementable { Incrementable & operator++() { return *this; } };
struct NonIncrementable {};
void later() {
Incrementable i;
NonIncrementable ni;
increment(i);
increment(ni);
}
Давайте взглянем на результаты:
Файл | Компиляция | Время, мс | Размер объектного файла, байт | Количество символов, шт | |
incrementable_03.cpp | clang | O0 | 43,02 | 1304 | 782 |
incrementable_17.cpp | clang | O0 | 67,46 | 1320 | 472 |
incrementable_20.cpp | clang | O0 | 43,42 | 1304 | 230 |
incrementable_03.cpp | clang | O3 | 47,21 | 1296 | 782 |
incrementable_17.cpp | clang | O3 | 77,77 | 1304 | 472 |
incrementable_20.cpp | clang | O3 | 45,70 | 1288 | 230 |
incrementable_03.cpp | gcc | O0 | 19,89 | 1568 | 782 |
incrementable_17.cpp | gcc | O0 | 34,71 | 1568 | 472 |
incrementable_20.cpp | gcc | O0 | 17,62 | 1480 | 230 |
incrementable_03.cpp | gcc | O3 | 18,44 | 1552 | 782 |
incrementable_17.cpp | gcc | O3 | 38,94 | 1552 | 472 |
incrementable_20.cpp | gcc | O3 | 18,57 | 1464 | 230 |
Как уже отмечалось ранее, количество кода существенно уменьшается по мере развития языка: c 782 до 472 и затем до 230. Разница почти в 3,5 раза, если сравнить С++20 и С++03 (на самом деле даже больше, т.к. порядка 150‒170 символов во всех примерах — тестирующий код). Размеры объектного файла также постепенно уменьшаются. Что же со временем компиляции? Странно, но время компиляции 03 и 20 примерно равно, а вот в С++17 — в два раза больше. Давайте взглянем на код наших примеров: помимо всего прочего, в глаза бросается #include
в случае C++17. Давайте реализуем declval
, enable_if
и void_t
и проверим:
template
struct enable_if { typedef T type; };
template
struct enable_if {};
template
using enable_if_t = typename enable_if::type;
template
using void_t = void;
template
T && declval() noexcept;
template>
struct IsInc {
constexpr static bool value = false;
};
template
struct IsInc() )>>
{
constexpr static bool value = true;
};
template
enable_if_t::value> increment(Ty &);
template
enable_if_t::value> increment(Ty &);
struct Incrementable { Incrementable & operator++() { return *this; } };
struct NonIncrementable {};
void later() {
Incrementable i;
NonIncrementable ni;
increment(i);
increment(ni);
}
И давайте обновим нашу таблицу:
Файл | Компиляция | Время, мс | Размер объектного файла, байт | Количество символов, шт | |
incrementable_03.cpp | clang | O0 | 43,02 | 1304 | 782 |
incrementable_17_no_tt.cpp | clang | O0 | 44,498 | 1320 | 714 |
incrementable_20.cpp | clang | O0 | 43,419 | 1304 | 230 |
incrementable_03.cpp | clang | O3 | 47,205 | 1296 | 782 |
incrementable_17_no_tt.cpp | clang | O3 | 47,327 | 1312 | 714 |
incrementable_20.cpp | clang | O3 | 45,704 | 1288 | 230 |
incrementable_03.cpp | gcc | O0 | 19,885 | 1568 | 782 |
incrementable_17_no_tt.cpp | gcc | O0 | 21,163 | 1584 | 714 |
incrementable_20.cpp | gcc | O0 | 17,619 | 1480 | 230 |
incrementable_03.cpp | gcc | O3 | 18,442 | 1552 | 782 |
incrementable_17_no_tt.cpp | gcc | O3 | 19,057 | 1568 | 714 |
incrementable_20.cpp | gcc | O3 | 18,566 | 1464 | 230 |
Время компиляции на 17 стандарте нормализовалось и стало практически равно времени компиляции 03 и 20, однако количество кода стало близко к самому тяжёлому, базовому варианту. Так что, если у вас есть под рукой C++20 и нужно написать какую-то простую мета-перегрузку, смело можно использовать концепты. Это читабельнее, компилируется примерно с такой же скоростью, а результат компиляции занимает меньше места.
Эксперимент №2: Ограничения для методов
Давайте взглянем на еще одну особенность: ограничение для функции или метода (в том числе и для конструкторов и деструкторов) на примере типа OptionalLike
, имеющего деструктор по умолчанию в случае, если помещаемый объект тривиален, а иначе — деструктор, выполняющий деинициализацию корректно. Код представлен ниже:
#include
#include
template
struct OptionalLike {
~OptionalLike() {
/* Calls d-tor manually */
}
};
template
struct OptionalLike::value>>
{
~OptionalLike() = default;
};
void later() {
OptionalLike oli;
OptionalLike ols;
}
#include
#include
template
struct OptionalLike
{
~OptionalLike() {
/* Calls d-tor manually */
}
~OptionalLike() requires (std::is_trivially_destructible::value) = default;
};
void later() {
OptionalLike oli;
OptionalLike ols;
}
Давайте взглянем на результаты:
Файл | Компиляция | Время, мс | Размер объектного файла, байт | Количество символов, шт | |
optional_like_17.cpp | clang | O0 | 487,62 | 1424 | 319 |
optional_like_20.cpp | clang | O0 | 616,8 | 1816 | 253 |
optional_like_17.cpp | clang | O3 | 490,07 | 944 | 319 |
optional_like_20.cpp | clang | O3 | 627,64 | 1024 | 253 |
optional_like_17.cpp | gcc | O0 | 202,29 | 1968 | 319 |
optional_like_20.cpp | gcc | O0 | 505,82 | 1968 | 253 |
optional_like_17.cpp | gcc | O3 | 205,55 | 1200 | 319 |
optional_like_20.cpp | gcc | O3 | 524,54 | 1200 | 253 |
Мы видим, что новый вариант выглядит более читабельным и лаконичным (253 символа против 319 у классического), однако платим за это временем компиляции: оба компилятора как с оптимизацией, так и без показали худшее время компиляции в случае с концептами. GCC аж в 2‒2,5 раза медленнее. При этом размер объектного файла у gcc не изменяется вовсе, а в случае clang — больше для концептов. Классический компромисс: либо меньше кода, но дольше компиляция, либо больше кода, но быстрее компиляция.
Эксперимент №3: Влияние использования концептов на время компиляции
Мы знаем, что накладывать ограничения на тип можно используя именованные наборы требований, они же концепты. Также можно указать требования непосредственно в момент объявления шаблонной сущности. Давайте посмотрим, есть ли разница с точки зрения компилятора. Компилировать будем следующие фрагменты:
Кодtemplate
void foo() requires (sizeof(T) >= 4) { }
template
void foo() {}
void later() {
foo();
foo();
}
template
concept IsBig = sizeof(T) >= 4;
template
void foo() requires IsBig { }
template
void foo() {}
void later() {
foo();
foo();
}
Сразу взглянем на результаты:
Файл | Компиляция | Время, мс | Размер объектного файла, байт | |
inline.cpp | clang | O0 | 38,666 | 1736 |
concept.cpp | clang | O0 | 39,868 | 1736 |
concept.cpp | clang | O3 | 42,578 | 1040 |
inline.cpp | clang | O3 | 43,610 | 1040 |
inline.cpp | gcc | O0 | 14,598 | 1976 |
concept.cpp | gcc | O0 | 14,640 | 1976 |
concept.cpp | gcc | O3 | 14,872 | 1224 |
inline.cpp | gcc | O3 | 14,951 | 1224 |
Как мы можем заметить, размеры получившихся объектных файлов идентичны, а показатели времени компиляции практически совпадают. Так что при выборе концепт или inline-требование можно не задумываться о производительности компилятора.
Эксперимент №4: Варианты ограничения функции
Теперь посмотрим на варианты наложения ограничения на шаблонные параметры на примере функций. Ограничить функцию можно аж четырьмя способами:
Имя концепта вместо
typename
Requires clause после
template<>
Имя концепта рядом с
auto
Trailing requires clause
Давайте узнаем, какой же из предложенных способов самый оптимальный с точки зрения компиляции. Компилируемый код представлен ниже:
Кодtemplate
concept IsBig = sizeof(T) >= 4;
template
void foo(T const &) { }
template
void foo(T const &) {}
void later() {
foo('a');
foo(1);
}
template
concept IsBig = sizeof(T) >= 4;
template
requires IsBig
void foo(T const &) { }
template
void foo(T const &) {}
void later() {
foo('a');
foo(1);
}
template
concept IsBig = sizeof(T) >= 4;
template
void foo(IsBig auto const &) { }
template
void foo(auto const &) {}
void later() {
foo('a');
foo(1);
}
template
concept IsBig = sizeof(T) >= 4;
template
void foo(T const &) requires IsBig { }
template
void foo(T const &) {}
void later() {
foo('a');
foo(1);
}
А вот и результаты:
Файл | Компиляция | Время, мс | Размер объектного файла, байт | |
function_with_auto.cpp | clang | O0 | 40,878 | 1760 |
function_after_template.cpp | clang | O0 | 41,947 | 1760 |
function_requires_clause.cpp | clang | O0 | 42,551 | 1760 |
function_instead_of_typename.cpp | clang | O0 | 46,893 | 1760 |
function_with_auto.cpp | clang | O3 | 43,928 | 1024 |
function_requires_clause.cpp | clang | O3 | 45,176 | 1032 |
function_after_template.cpp | clang | O3 | 45,275 | 1032 |
function_instead_of_typename.cpp | clang | O3 | 50,42 | 1032 |
function_requires_clause.cpp | gcc | O0 | 16,561 | 2008 |
function_with_auto.cpp | gcc | O0 | 16,692 | 2008 |
function_after_template.cpp | gcc | O0 | 17,032 | 2008 |
function_instead_of_typename.cpp | gcc | O0 | 17,802 | 2016 |
function_requires_clause.cpp | gcc | O3 | 16,233 | 1208 |
function_with_auto.cpp | gcc | O3 | 16,711 | 1208 |
function_after_template.cpp | gcc | O3 | 17,216 | 1208 |
function_instead_of_typename.cpp | gcc | O3 | 18,315 | 1216 |
Как мы видим, время компиляции отличается незначительно, однако мы можем заметить следующее:
Вариант с использованием имени концепта вместо
typename
оказался самым медленным во всех случаях.Варианты trailing requires clause или использование концепта рядом с
auto
оказались самыми быстрыми.Варианты, где присутствует
template<>
на 5‒10% медленнее остальных.Размеры объектных файлов изменяются незначительно, однако вариант с именем концепта вместо
typename
оказался самым объемным в случае gcc, а вариант с auto оказался наименее объемным в случае clang.
Эксперимент №5: Влияние сложности концепта на время компиляции
Последнее, что мы рассмотрим в рамках данной статьи, и, наверное, самое интересное: влияние сложности концепта на время компиляции. Давайте возьмём и скомпилируем следующие примеры, где сложность используемого концепта (количество проверок или условий) возрастает от первого к последнему.
Кодtemplate
concept ConceptA = sizeof(T) >= 1;
template
concept TestedConcept = ConceptA;
void foo(TestedConcept auto const &) {}
void foo(auto const &) {}
void later() {
int i { 0 };
int * ip = &i;
foo(i);
foo(ip);
}
template
concept ConceptA = sizeof(T) >= 1;
template
concept ConceptB = requires(T i, int x) {
{ i++ } noexcept -> ConceptA;
{ ++i } noexcept -> ConceptA;
{ i-- } noexcept -> ConceptA;
{ --i } noexcept -> ConceptA;
{ i + i } noexcept -> ConceptA;
{ i - i } noexcept -> ConceptA;
{ i += i } noexcept -> ConceptA;
{ i -= i } noexcept -> ConceptA;
{ i * i } noexcept -> ConceptA;
{ i / i } noexcept -> ConceptA;
{ i % i } noexcept -> ConceptA;
{ i *= i } noexcept -> ConceptA;
{ i /= i } noexcept -> ConceptA;
{ i %= i } noexcept -> ConceptA;
{ i | i } noexcept -> ConceptA;
{ i & i } noexcept -> ConceptA;
{ i |= i } noexcept -> ConceptA;
{ i &= i } noexcept -> ConceptA;
{ ~i } noexcept -> ConceptA;
{ i ^ i } noexcept -> ConceptA;
{ i << x } noexcept -> ConceptA;
{ i >> x } noexcept -> ConceptA;
{ i ^= i } noexcept -> ConceptA;
{ i <<= x } noexcept -> ConceptA;
{ i >>= x } noexcept -> ConceptA;
};
template
concept ConceptC = requires(T i, int x) {
{ i++ } noexcept -> ConceptB;
{ ++i } noexcept -> ConceptB;
{ i-- } noexcept -> ConceptB;
{ --i } noexcept -> ConceptB;
{ i + i } noexcept -> ConceptB;
{ i - i } noexcept -> ConceptB;
{ i += i } noexcept -> ConceptB;
{ i -= i } noexcept -> ConceptB;
{ i * i } noexcept -> ConceptB;
{ i / i } noexcept -> ConceptB;
{ i % i } noexcept -> ConceptB;
{ i *= i } noexcept -> ConceptB;
{ i /= i } noexcept -> ConceptB;
{ i %= i } noexcept -> ConceptB;
{ i | i } noexcept -> ConceptB;
{ i & i } noexcept -> ConceptB;
{ i |= i } noexcept -> ConceptB;
{ i &= i } noexcept -> ConceptB;
{ ~i } noexcept -> ConceptB;
{ i ^ i } noexcept -> ConceptB;
{ i << x } noexcept -> ConceptB;
{ i >> x } noexcept -> ConceptB;
{ i ^= i } noexcept -> ConceptB;
{ i <<= x } noexcept -> ConceptB;
{ i >>= x } noexcept -> ConceptB;
};
template
concept ConceptD = requires(T i, int x) {
{ i++ } noexcept -> ConceptC;
{ ++i } noexcept -> ConceptC;
{ i-- } noexcept -> ConceptC;
{ --i } noexcept -> ConceptC;
{ i + i } noexcept -> ConceptC;
{ i - i } noexcept -> ConceptC;
{ i += i } noexcept -> ConceptC;
{ i -= i } noexcept -> ConceptC;
{ i * i } noexcept -> ConceptC;
{ i / i } noexcept -> ConceptC;
{ i % i } noexcept -> ConceptC;
{ i *= i } noexcept -> ConceptC;
{ i /= i } noexcept -> ConceptC;
{ i %= i } noexcept -> ConceptC;
{ i | i } noexcept -> ConceptC;
{ i & i } noexcept -> ConceptC;
{ i |= i } noexcept -> ConceptC;
{ i &= i } noexcept -> ConceptC;
{ ~i } noexcept -> ConceptC;
{ i ^ i } noexcept -> ConceptC;
{ i << x } noexcept -> ConceptC;
{ i >> x } noexcept -> ConceptC;
{ i ^= i } noexcept -> ConceptC;
{ i <<= x } noexcept -> ConceptC;
{ i >>= x } noexcept -> ConceptC;
};
template
concept TestedConcept = ConceptA && ConceptB && ConceptC && ConceptD;
void foo(TestedConcept auto const &) {}
void foo(auto const &) {}
void later() {
int i { 0 };
int * ip = &i;
foo(i);
foo(ip);
}
template
concept ConceptA = sizeof(T) >= 1;
template
concept ConceptB = requires(T i, int x) {
{ i++ } noexcept -> ConceptA;
{ ++i } noexcept -> ConceptA;
{ i-- } noexcept -> ConceptA;
{ --i } noexcept -> ConceptA;
{ i + i } noexcept -> ConceptA;
{ i - i } noexcept -> ConceptA;
{ i += i } noexcept -> ConceptA;
{ i -= i } noexcept -> ConceptA;
{ i * i } noexcept -> ConceptA;
{ i / i } noexcept -> ConceptA;
{ i % i } noexcept -> ConceptA;
{ i *= i } noexcept -> ConceptA;
{ i /= i } noexcept -> ConceptA;
{ i %= i } noexcept -> ConceptA;
{ i | i } noexcept -> ConceptA;
{ i & i } noexcept -> ConceptA;
{ i |= i } noexcept -> ConceptA;
{ i &= i } noexcept -> ConceptA;
{ ~i } noexcept -> ConceptA;
{ i ^ i } noexcept -> ConceptA;
{ i << x } noexcept -> ConceptA;
{ i >> x } noexcept -> ConceptA;
{ i ^= i } noexcept -> ConceptA;
{ i <<= x } noexcept -> ConceptA;
{ i >>= x } noexcept -> ConceptA;
};
template
concept ConceptC = requires(T i, int x) {
{ i++ } noexcept -> ConceptB;
{ ++i } noexcept -> ConceptB;
{ i-- } noexcept -> ConceptB;
{ --i } noexcept -> ConceptB;
{ i + i } noexcept -> ConceptB;
{ i - i } noexcept -> ConceptB;
{ i += i } noexcept -> ConceptB;
{ i -= i } noexcept -> ConceptB;
{ i * i } noexcept -> ConceptB;
{ i / i } noexcept -> ConceptB;
{ i % i } noexcept -> ConceptB;
{ i *= i } noexcept -> ConceptB;
{ i /= i } noexcept -> ConceptB;
{ i %= i } noexcept -> ConceptB;
{ i | i } noexcept -> ConceptB;
{ i & i } noexcept -> ConceptB;
{ i |= i } noexcept -> ConceptB;
{ i &= i } noexcept -> ConceptB;
{ ~i } noexcept -> ConceptB;
{ i ^ i } noexcept -> ConceptB;
{ i << x } noexcept -> ConceptB;
{ i >> x } noexcept -> ConceptB;
{ i ^= i } noexcept -> ConceptB;
{ i <<= x } noexcept -> ConceptB;
{ i >>= x } noexcept -> ConceptB;
};
template
concept ConceptD = requires(T i, int x) {
{ i++ } noexcept -> ConceptC;
{ ++i } noexcept -> ConceptC;
{ i-- } noexcept -> ConceptC;
{ --i } noexcept -> ConceptC;
{ i + i } noexcept -> ConceptC;
{ i - i } noexcept -> ConceptC;
{ i += i } noexcept -> ConceptC;
{ i -= i } noexcept -> ConceptC;
{ i * i } noexcept -> ConceptC;
{ i / i } noexcept -> ConceptC;
{ i % i } noexcept -> ConceptC;
{ i *= i } noexcept -> ConceptC;
{ i /= i } noexcept -> ConceptC;
{ i %= i } noexcept -> ConceptC;
{ i | i } noexcept -> ConceptC;
{ i & i } noexcept -> ConceptC;
{ i |= i } noexcept -> ConceptC;
{ i &= i } noexcept -> ConceptC;
{ ~i } noexcept -> ConceptC;
{ i ^ i } noexcept -> ConceptC;
{ i << x } noexcept -> ConceptC;
{ i >> x } noexcept -> ConceptC;
{ i ^= i } noexcept -> ConceptC;
{ i <<= x } noexcept -> ConceptC;
{ i >>= x } noexcept -> ConceptC;
};
template
concept ConceptE = requires(T i, int x) {
{ i++ } noexcept -> ConceptD;
{ ++i } noexcept -> ConceptD;
{ i-- } noexcept -> ConceptD;
{ --i } noexcept -> ConceptD;
{ i + i } noexcept -> ConceptD;
{ i - i } noexcept -> ConceptD;
{ i += i } noexcept -> ConceptD;
{ i -= i } noexcept -> ConceptD;
{ i * i } noexcept -> ConceptD;
{ i / i } noexcept -> ConceptD;
{ i % i } noexcept -> ConceptD;
{ i *= i } noexcept -> ConceptD;
{ i /= i } noexcept -> ConceptD;
{ i %= i } noexcept -> ConceptD;
{ i | i } noexcept -> ConceptD;
{ i & i } noexcept -> ConceptD;
{ i |= i } noexcept -> ConceptD;
{ i &= i } noexcept -> ConceptD;
{ ~i } noexcept -> ConceptD;
{ i ^ i } noexcept -> ConceptD;
{ i << x } noexcept -> ConceptD;
{ i >> x } noexcept -> ConceptD;
{ i ^= i } noexcept -> ConceptD;
{ i <<= x } noexcept -> ConceptD;
{ i >>= x } noexcept -> ConceptD;
};
template
concept ConceptF = requires(T i, int x) {
{ i++ } noexcept -> ConceptE;
{ ++i } noexcept -> ConceptE;
{ i-- } noexcept -> ConceptE;
{ --i } noexcept -> ConceptE;
{ i + i } noexcept -> ConceptE;
{ i - i } noexcept -> ConceptE;
{ i += i } noexcept -> ConceptE;
{ i -= i } noexcept -> ConceptE;
{ i * i } noexcept -> ConceptE;
{ i / i } noexcept -> ConceptE;
{ i % i } noexcept -> ConceptE;
{ i *= i } noexcept -> ConceptE;
{ i /= i } noexcept -> ConceptE;
{ i %= i } noexcept -> ConceptE;
{ i | i } noexcept -> ConceptE;
{ i & i } noexcept -> ConceptE;
{ i |= i } noexcept -> ConceptE;
{ i &= i } noexcept -> ConceptE;
{ ~i } noexcept -> ConceptE;
{ i ^ i } noexcept -> ConceptE;
{ i << x } noexcept -> ConceptE;
{ i >> x } noexcept -> ConceptE;
{ i ^= i } noexcept -> ConceptE;
{ i <<= x } noexcept -> ConceptE;
{ i >>= x } noexcept -> ConceptE;
};
template
concept ConceptG = requires(T i, int x) {
{ i++ } noexcept -> ConceptF;
{ ++i } noexcept -> ConceptF;
{ i-- } noexcept -> ConceptF;
{ --i } noexcept -> ConceptF;
{ i + i } noexcept -> ConceptF;
{ i - i } noexcept -> ConceptF;
{ i += i } noexcept -> ConceptF;
{ i -= i } noexcept -> ConceptF;
{ i * i } noexcept -> ConceptF;
{ i / i } noexcept -> ConceptF;
{ i % i } noexcept -> ConceptF;
{ i *= i } noexcept -> ConceptF;
{ i /= i } noexcept -> ConceptF;
{ i %= i } noexcept -> ConceptF;
{ i | i } noexcept -> ConceptF;
{ i & i } noexcept -> ConceptF;
{ i |= i } noexcept -> ConceptF;
{ i &= i } noexcept -> ConceptF;
{ ~i } noexcept -> ConceptF;
{ i ^ i } noexcept -> ConceptF;
{ i << x } noexcept -> ConceptF;
{ i >> x } noexcept -> ConceptF;
{ i ^= i } noexcept -> ConceptF;
{ i <<= x } noexcept -> ConceptF;
{ i >>= x } noexcept -> ConceptF;
};
template
concept TestedConcept = ConceptA && ConceptB && ConceptC && ConceptD &&
ConceptE && ConceptF && ConceptG;
void foo(TestedConcept auto const &) {}
void foo(auto const &) {}
void later() {
int i { 0 };
int * ip = &i;
foo(i);
foo(ip);
}
Давайте взглянем на результат:
Файл | Компиляция | Время, мс | Количество символов, шт | |
concept_complexity_1.cpp | clang | O0 | 37,441 | 201 |
concept_complexity_2.cpp | clang | O0 | 38,211 | 2244 |
concept_complexity_3.cpp | clang | O0 | 39,989 | 4287 |
concept_complexity_1.cpp | clang | O3 | 40,062 | 201 |
concept_complexity_2.cpp | clang | O3 | 40,659 | 2244 |
concept_complexity_3.cpp | clang | O3 | 43,314 | 4287 |
concept_complexity_1.cpp | gcc | O0 | 15,352 | 201 |
concept_complexity_2.cpp | gcc | O0 | 16,077 | 2244 |
concept_complexity_3.cpp | gcc | O0 | 18,091 | 4287 |
concept_complexity_1.cpp | gcc | O3 | 15,243 | 201 |
concept_complexity_2.cpp | gcc | O3 | 17,552 | 2244 |
concept_complexity_3.cpp | gcc | O3 | 18,51 | 4287 |
Чего и следовало ожидать, в общем случае существенное увеличение сложности концепта (обратите внимание, что концепты в примерах рекурсивные, и каждый последующий включает многократные отсылки к предыдущим) приводит к увеличению времени компиляции лишь на 5‒15%.
Заключение
В результате вышеописанных экспериментов мы можем сделать следующие выводы:
Концепты позволяют создавать более читабельный код, который компилируется в меньший объектный файл, по сравнению с классическим метапрограммированием.
Несмотря на это, код, содержащий концепты/constraint«ы зачастую компилируется дольше, иногда довольно значительно, как это было в случае ограничения для методов.
Время компиляции прямо пропорционально сложности концептов/constraint’ов.
Post Scriptum
Во-первых, к статье прилагаю ссылку на гитхаб, пройдя по которой вы можете найти скрипты для запуска тестов, а также используемые в статье фрагменты кода и повторить некоторые (а может и все) тесты локально.
Ну, а во-вторых, мне бы очень хотелось увидеть, как ведут себя компиляторы с более сложными конструкциями. Если вы знаете/придумали подходящие примеры, смело пишите о них в комментариях, и я с радостью произведу замеры.