Инициализация в современном C++
Общеизвестно, что семантика инициализации — одна из наиболее сложных частей C++. Существует множество видов инициализации, описываемых разным синтаксисом, и все они взаимодействуют сложным и вызывающим вопросы способом. C++11 принес концепцию «универсальной инициализации». К сожалению, она привнесла еще более сложные правила, и в свою очередь, их перекрыли в C++14, C++17 и снова поменяют в C++20.
Под катом — видео и перевод доклада Тимура Домлера (Timur Doumler) с конференции C++ Russia. Тимур вначале подводит исторические итоги эволюции инициализации в С++, дает системный обзор текущего варианта правила инициализации, типичных проблем и сюрпризов, объясняет, как использовать все эти правила эффективно, и, наконец, рассказывает о свежих предложениях в стандарт, которые могут сделать семантику инициализации C++20 немного более удобной. Далее повествование — от его лица.
Table of Contents
Гифка, которую вы сейчас видите, отлично доносит основную мысль доклада. Я нашёл её на просторах интернета где-то полгода тому назад, и выложил у себя в твиттере. В комментариях к ней кто-то сказал, что не хватает ещё трёх типов инициализации. Началось обсуждение, в ходе которого мне предложили сделать об этом доклад. Так всё и началось.
Про инициализацию уже рассказывал Николай Йоссутис. В его докладе был слайд, на котором перечислялись 19 различных способов инициализировать int:
int i1; //undefined value
int i2 = 42; //note: inits with 42
int i3(42); //inits with 42
int i4 = int(); //inits with 42
int i5{42}; //inits with 42
int i6 = {42}; //inits with 42
int i7{}; //inits with 0
int i8 = {}; //inits with 0
auto i9 = 42; //inits with 42
auto i10{42}; //C++11: std::initializer_list, C++14: int
auto i11 = {42}; //inits std::initializer_list with 42
auto i12 = int{42}; //inits int with 42
int i13(); //declares a function
int i14(7, 9); //compile-time error
int i15 = (7, 9); //OK, inits int with 9 (comma operator)
int i16 = int(7, 9); //compile-time error
int i17(7, 9); //compile-time error
auto i18 = (7, 9); //OK, inits int with 9 (comma operator)
auto i19 = int(7, 9); //compile-time error
Мне кажется, это уникальная ситуация для языка программирования. Инициализация переменной — одно из простейших действий, но в С++ сделать это совсем не просто. Вряд ли в этом языке есть какая-либо другая область, в которой за последние годы было бы столько же отчётов об отклонениях от стандарта, исправлений и изменений. Правила инициализации меняются от стандарта к стандарту, и в интернете есть бесчисленное количество постов о том, как запутана инициализация в C++. Поэтому сделать её систематический обзор — задача нетривиальная.
Я буду излагать материал в хронологическом порядке: вначале мы поговорим о том, что было унаследовано от С, потом о С++98, затем о С++03, С++11, С++14 и С++17. Мы обсудим распространённые ошибки, и я дам свои рекомендации относительно правильной инициализации. Также я расскажу о нововведениях в С++20. В самом конце доклада будет представлена обзорная таблица.
В С++ очень многое унаследовано от С, поэтому с него мы и начнём. В С есть несколько способов инициализации переменных. Их можно вообще не инициализировать, и это называется инициализация по умолчанию. На мой взгляд, это неудачное название. Дело в том, что никакого значения по умолчанию переменной не присваивается, она просто не инициализируется. Если обратиться к неинициализированной переменной в C++ и в С, возникает неопределённое поведение:
int main() {
int i;
return i; // undefined behaviour
}
То же касается пользовательских типов: если в некотором struct
есть неинициализированные поля, то при обращении к ним также возникает неопределённое поведение:
struct Widget {
int i;
int j;
};
int main() {
Widget widget;
return widget.i; // неопределенное поведение
}
В С++ было добавлено множество новых конструкций: классы, конструкторы, public, private, методы, но ничто из этого не влияет на только что описанное поведение. Если в классе некоторый элемент не инициализирован, то при обращении к нему возникает неопределённое поведение:
class Widget {
public:
Widget() {}
int get_i() const noexcept { return i; }
int get_j() const noexcept { return j; }
private:
int i;
int j;
};
int main() {
Widget widget;
return widget.get_i(); // Undefined behaviour!
}
Никакого волшебного способа инициализировать по умолчанию элемент класса в С++ нет. Это интересный момент, и в течение первых нескольких лет моей карьеры с С++ я этого не знал. Ни компилятор, ни IDE, которой я тогда пользовался, об этом никак не напоминали. Мои коллеги не обращали внимания на эту особенность при проверке кода. Я почти уверен, что из-за неё в моём коде, написанном в эти годы, есть довольно странные баги. Мне казалось очевидным, что классы должны инициализировать свои переменные.
В C++98 можно инициализировать переменные при помощи member initializer list. Но такое решение проблемы не оптимальное, поскольку это необходимо делать в каждом конструкторе, и об этом легко забыть. Кроме того, инициализация идёт в порядке, в котором переменные объявлены, а не в порядке member initializer list:
// C++98: member initialiser list
class Widget {
public:
Widget() : i(0), j(0) {} // member initialiser list
int get_i() const noexcept { return i; }
int get_j() const noexcept { return j; }
private:
int i;
int j;
};
int main() {
Widget widget;
return widget.get_i();
}
В C++11 были добавлены инициализаторы элементов по умолчанию (direct member initializers), которыми пользоваться значительно удобнее. Они позволяют инициализировать все переменные одновременно, и это даёт уверенность, что все элементы инициализированы:
// C++11: default member initialisers
class Widget {
public:
Widget() {}
int get_i() const noexcept { return i; }
int get_j() const noexcept { return j; }
private:
int i = 0; // default member initialisers
int j = 0;
};
int main() {
Widget widget;
return widget.get_i();
}
Моя первая рекомендация: когда можете, всегда используйте DMI (direct member initializers). Их можно использовать как со встроенными типами (float
и int
), так и с объектами. Привычка инициализировать элементы заставляет подходить к этому вопросу более осознанно.
Итак, первый унаследованный от С способ инициализации — инициализация по умолчанию, и ей пользоваться не следует. Второй способ — копирующая инициализация. В этом случае мы указываем переменную и через знак равенства — её значение:
// copy initialization
int main() {
int i = 2;
}
Копирующая инициализация также используется, когда аргумент передаётся в функцию по значению, или когда происходит возврат объекта из функции по значению:
// copy initialization
int square(int i) {
return i * i;
}
Знак равенства может создать впечатление, что происходит присвоение значения, но это не так. Копирующая инициализация — это не присвоение значения. В этом докладе вообще ничего не будет про присвоение.
Другое важное свойство копирующей инициализации: если типы значений не совпадают, то выполняется последовательность преобразования (conversion sequence). У последовательности преобразования есть определенные правила, например, она не вызывает explicit конструкторов, поскольку они не являются преобразующими конструкторами. Поэтому, если выполнить копирующую инициализацию для объекта, конструктор которого отмечен как explicit, происходит ошибка компиляции:
struct Widget {
explicit Widget(int) {}
};
Widget w1 = 1; // ERROR
Более того, если есть другой конструктор, который не является explicit, но при этом хуже подходит по типу, то копирующая инициализация вызовет его, проигнорировав explicit конструктор:
struct Widget {
explicit Widget(int) {}
Widget(double) {}
};
Widget w1 = 1; // вызывает Widget(double)
Третий тип инициализации, о котором я хотел бы рассказать — агрегатная инициализация. Она выполняется, когда массив инициализируется рядом значений в фигурных скобках:
int i[4] = {0, 1, 2, 3};
Если при этом не указать размер массива, то он выводится из количества значений, заключённых в скобки:
int j[] = {0, 1, 2, 3}; // array size deduction
Эта же инициализация используется для агрегатных (aggregate) классов, то есть таких классов, которые являются просто набором публичных элементов (в определении агрегатных классов есть ещё несколько правил, но сейчас мы не будем на них останавливаться):
struct Widget {
int i;
float j;
};
Widget widget = {1, 3.14159};
Этот синтаксис работал ещё в С и С++98, причём, начиная с С++11, в нём можно пропускать знак равенства:
Widget widget{1, 3.14159};
Агрегатная инициализация на самом деле использует копирующую инициализацию для каждого элемента. Поэтому, если попытаться использовать агрегатную инициализацию (как со знаком равенства, так и без него) для нескольких объектов с explicit конструкторами, то для каждого объекта выполняется копирующая инициализация и происходит ошибка компиляции:
struct Widget {
explicit Widget(int) {}
};
struct Thingy {
Widget w1, w2;
};
int main() {
Thingy thingy = {3, 4}; // ERROR
Thingy thingy {3, 4}; // ERROR
}
А если для этих объектов есть другой конструктор, не-explicit, то вызывается он, даже если он хуже подходит по типу:
struct Widget {
explicit Widget(int) {}
Widget(double) {}
};
struct Thingy {
Widget w1, w2;
};
int main() {
Thingy thingy = {3, 4}; // вызывает Widget(double)
Thingy thingy {3, 4}; // вызывает Widget(double)
}
Рассмотрим ещё одно свойство агрегатной инициализации. Вопрос: какое значение возвращает эта программа?
struct Widget {
int i;
int j;
};
int main() {
Widget widget = {1};
return widget.j;
}
Совершенно верно, нуль. Если при агрегатной инициализации пропустить некоторые элементы в массиве значений, то соответствующим переменным присваивается значение нуль. Это очень полезное свойство, потому что благодаря нему никогда не может быть неинициализированных элементов. Оно работает с агрегатными классами и с массивами:
// все элементы инициализируются нулями
int[100] = {};
Другое важное свойство агрегатной инициализации — пропуск скобок (brace elision). Как вы думаете, какое значение возвращает эта программа? В ней есть Widget
, который является агрегатом двух значений int
, и Thingy
, агрегат Widget
и int
. Что мы получим, если передадим ей два инициализирующих значения: {1, 2}
?
struct Widget {
int i;
int j;
};
struct Thingy {
Widget w;
int k;
};
int main() {
Thingy t = {1, 2};
return t.k; // что мы получим?
}
Ответ: нуль. Здесь мы имеем дело с подагрегатом (subaggregate), то есть с вложенным агрегатным классом. Такие классы можно инициализировать, используя вложенные скобки, но одну из этих пар скобок можно пропустить. В этом случае выполняется рекурсивный обход субагрегата, и {1, 2}
оказывается эквивалентно {{1, 2}, 0}
. Надо признать, это свойство не вполне очевидное.
Наконец, от С также унаследована статическая инициализация: статические переменные всегда инициализируются. Это может быть сделано несколькими способами. Статическую переменную можно инициализировать выражением-константой. В этом случае инициализация происходит во время компиляции. Если же переменной не присвоить никакого значения, то она инициализируется значением нуль:
static int i = 3; // инициализация константой
statit int j; // инициализация нулем
int main() {
return i + j;
}
Эта программа возвращает 3, несмотря на то, что j
не инициализировано. Если же переменная инициализируется не константой, а объектом, могут возникнуть проблемы.
Вот пример из реальной библиотеки, над которой я работал:
static Colour red = {255, 0, 0};
В ней был класс Colour, и основные цвета (red, green, blue) были определены как статические объекты. Это допустимое действие, но как только появляется другой статический объект, в инициализаторе которого используется red
, появляется неопределённость, поскольку нет жёсткого порядка, в котором инициализируются переменные. Ваше приложение может обратиться к неинициализированной переменной, и тогда оно упадёт. К счастью, в С++11 стало возможным использовать конструктор constexpr
, и тогда мы имеем дело с инициализацией константой. В этом случае никаких проблем с порядком инициализации уже не возникает.
Итак, от языка C унаследованы четыре типа инициализации: инициализация по умолчанию, копирующая, агрегатная и статическая инициализации.
Перейдём теперь к С++98. Пожалуй, наиболее важная возможность, отличающая С++ от С — это конструкторы. Вот пример вызова конструктора:
Widget widget(1, 2);
int(3);
При помощи этого же синтаксиса можно инициализировать встроенные типы вроде int
и float
. Этот синтаксис называется прямой инициализацией. Она выполняется всегда, когда у нас есть аргумент в круглых скобках.
Для встроенных типов (int
, bool
, float
) никакого отличия от копирующей инициализации здесь нет. Если же речь идёт о пользовательских типах, то, в отличие от копирующей инициализации, при прямой инициализации можно передавать несколько аргументов. Собственно, ради этого прямую инициализацию и придумали.
Кроме того, при прямой инициализации не выполняется последовательность преобразования. Вместо этого происходит вызов конструктора при помощи разрешения перегрузки (overload resolution). У прямой инициализации тот же синтаксис, что и у вызова функции, и используется та же логика, что и в других функциях С++.
Поэтому в ситуации с explicit конструктором прямая инициализация работает нормально, хотя копирующая инициализация выдаёт ошибку:
struct Widget {
explicit Widget(int) {}
};
Widget w1 = 1; // ошибка
Widget w2(1); // а так можно
В ситуации же с двумя конструкторами, один из которых explicit, а второй хуже подходит по типу, при прямой инициализации вызывается первый, а при копирующей — второй. В такой ситуации изменение синтаксиса приведёт к вызову другого конструктора — об этом часто забывают:
struct Widget {
explicit Widget(int) {}
Widget(double) {}
};
Widget w1 = 1; // вызывает Widget(double)
Widget w2(1); // вызывает Widget(int)
Прямая инициализация применяется всегда, когда используются круглые скобки, в том числе когда используется нотация вызова конструктора для инициализации временного объекта, а также в выражениях new
с инициализатором в скобках и в выражениях cast
:
useWidget(Widget(1, 2)); // вызов конструктора
auto* widget_ptr = new Widget(2, 3); // new-expression with (args)
static_cast(thingy); // cast
Этот синтаксис существует столько, сколько существует сам С++, и у него есть важный недостаток, который упомянул Николай в программном докладе: the most vexing parse. Это значит, что всё, что компилятор может прочитать как объявление (declaration), он читает именно как объявление.
Рассмотрим пример, в котором есть класс Widget
и класс Thingy
, и конструктор Thingy
, который получает Widget
:
struct Widget {};
struct Thingy {
Thingy(Widget) {}
};
int main () {
Thingy thingy(Widget());
}
На первый взгляд кажется, что при инициализации Thingy
ему передаётся созданный по умолчанию Widget
, но на самом деле здесь происходит объявление функции. Этот код объявляет функцию, которая получает на вход другую функцию, которая ничего не получает на вход и возвращает Widget
, а первая функция возвращает Thingy
. Код скомпилируется без ошибок, но вряд ли мы добивались именно такого поведения.
Перейдём к следующей версии — С++03. Принято считать, что существенных изменений в этой версии не произошло, но это не так. В С++03 появилась инициализация значением (value initialization), при которой пишутся пустые круглые скобки:
int main() {
return int(); // UB в C++98, 0 начиная с C++03
}
В С++98 здесь возникает неопределенное поведение, потому что происходит инициализация по умолчанию, а начиная с С++03 эта программа возвращает нуль.
Правило такое: если существует определённый пользователем конструктор по умолчанию, инициализация значением вызывает этот конструктор, в противном случае возвращается нуль.
Рассмотрим подробнее ситуацию с пользовательским конструктором:
struct Widget {
int i;
};
Widget get_widget() {
return Widget(); // value initialization
}
int main() {
return get_widget().i;
}
В этой программе функция инициализирует значение для нового Widget
и возвращает его. Мы вызываем эту функцию и обращаемся к элементу i
объекта Widget
. Начиная с C++03 возвращаемое значение здесь нуль, поскольку нет пользовательского конструктора по умолчанию. А если такой конструктор существует, но не инициализирует i
, то мы получим неопределённое поведение:
struct Widget {
Widget() {} // пользовательский конструктор
int i;
};
Widget get_widget() {
return Widget(); // value initialization
}
int main() {
return get_widget().i; // значение не инициализировано, происходит UB
}
Стоит заметить, что «пользовательский» не значит «определённый пользователем». Это значит, что пользователь должен предоставить тело конструктора, т. е. фигурные скобки. Если же в примере выше заменить тело конструктора на = default
(эта возможность была добавлена в С++11), смысл программы изменяется. Теперь мы имеем конструктор, определённый пользователем (user-defined), но не предоставленный пользователем (user-provided), поэтому программа возвращает нуль:
struct Widget {
Widget() = default; // user-defined, но не user-provided
int i;
};
Widget get_widget() {
return Widget(); // value initialization
}
int main() {
return get_widget().i; // возвращает 0
}
Теперь попробуем вынести Widget() = default
за рамки класса. Смысл программы снова изменился: Widget() = default
считается предоставленным пользователем конструктором, если он находится вне класса. Программа снова возвращает неопределённое поведение.
struct Widget {
Widget();
int i;
};
Widget::Widget() = default; // вне класса, считается user-provided
Widget get_widget() {
return Widget(); // value initialization
}
int main() {
return get_widget().i; // снова значение не инициализировано, UB
}
Тут есть определённая логика: конструктор, определённый вне класса, может быть внутри другой единицы трансляции. Компилятор может не увидеть этот конструктор, поскольку он может быть в другом файле .cpp
. Поэтому делать какие-либо выводы о таком конструкторе компилятор не может, и он не может отличить конструктор с телом от конструктора с = default
.
В версии С++11 было много очень важных изменений. В частности, была введена универсальная (uniform) инициализация, которую я предпочитаю называть «unicorn initialization» («инициализация-единорог»), потому что она просто волшебная. Давайте разберёмся, зачем она появилась.
Как вы уже заметили, в С++ очень много различных синтаксисов инициализации с разным поведением. Множество неудобств вызывала проблема vexing parse с круглыми скобками. Ещё разработчикам не нравилось, что агрегатную инициализацию можно было использовать только с массивами, но не с контейнерами вроде std::vector
. Вместо неё приходилось выполнять .reserve
и .push_back
, или пользоваться всякими жуткими библиотеками:
// вот так было нельзя, а хотелось:
std::vector vec = {0, 1, 2, 3, 4};
// приходилось писать так:
std::vector vec;
vec.reserve(5);
vec.push_back(0);
vec.push_back(1);
vec.push_back(2);
vec.push_back(3);
vec.push_back(4);
Все эти проблемы создатели языка попытались решить, введя синтаксис с фигурными скобками, но без знака равенства. Предполагалось, что это будет единый синтаксис для всех типов, в котором используются фигурные скобки и не возникает проблемы vexing parse. В большинстве случаев этот синтаксис выполняет свою задачу.
Эта новая инициализация называется инициализация списком, и она бывает двух типов: прямая и копирования. В первом случае используются просто фигурные скобки, во втором — фигурные скобки со знаком равенства:
// direct-list-initialization
Widget widget{1, 2};
// copy-list-initialization
Widget widget = {1, 2};
Используемый для иницализации список называется braced-init-list. Важно, что этот список не является объектом, у него нет типа. Переход на С++11 с более ранних версий не создаёт никаких проблем с агрегатными типами, так что это изменение не является критическим. Но теперь у списка в фигурных скобках появились новые возможности. Хоть у него и нет типа, он может быть скрыто преобразован в std::initializer_list
, это такой специальный новый тип. И если есть конструктор, принимающий на вход std::initializer_list
, то вызывается именно этот конструктор:
template
class vector {
//...
vector(std::initializer_list init); // конструктор с initializer_list
};
std::vector vec{0, 1, 2, 3, 4}; // вызывает этот^ конструктор
Мне кажется, что со стороны комитета С++ std::initializer_list
был не самым удачным решением. От него больше вреда, чем пользы.
Начнём с того, что std::initializer_list
— это вектор фиксированного размера с элементами const
. То есть это тип, у него есть функции begin
и end
, которые возвращают итераторы, есть собственный тип итератора, и чтобы его использовать, нужно включать специальный заголовок. Поскольку элементы std::initializer_list
являются const
, его нельзя перемещать, поэтому, если T
в коде выше является типом move-only, код не будет выполняться.
Далее, std::initializer_list
является объектом. Используя его, мы, фактически, создаём и передаём объекты. Как правило, компилятор может это оптимизировать, но с точки зрения семантики мы всё равно имеем дело с лишними объектами.
Несколько месяцев назад в твиттере был опрос: если бы можно было отправиться в прошлое и убрать что-либо из C++, что бы вы убрали? Больше всего голосов получил именно initializer_list
.
https://twitter.com/shafikyaghmour/status/1058031143935561728
Джейсон Тёрнер недавно выступал с полуторачасовым докладом о том, как можно исправить initializer_list
. Если вы хотите более подробно познакомиться с этой темой, я очень рекомендую этот доклад.
Давайе разберёмся, как работает новый синтаксис. Он вызывает конструкторы, которые принимают на вход initializer_list
, и эти вызовы создают много проблем по сравнению с прямой инициализацией в старом синтаксисе. Часто приводят следующий пример:
std::vector v(3, 0); // вектор содержит 0, 0, 0
std::vector v{3, 0}; // вектор содержит 3, 0
Если вызвать vector
с двумя аргументами int
и использовать прямую инициализацию, то выполняется вызов конструктора, который первым аргументом принимает размер вектора, а вторым — значение элемента. На выходе получается вектор из трёх нулей. Если же вместо круглых скобок написать фигурные, то используется initializer_list
и на выходе получается вектор из двух элементов, 3 и 0.
Есть примеры ещё более странного поведения этого синтаксиса:
std::string s(48, 'a'); // "aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa"
std::string s{48, 'a'}; // "0a"
В первой строке создаётся строка из 48 символов «а», а во второй строка »0а». Это происходит потому, что конструктор string
принимает на вход initializer_list
из символов. 48 является целочисленным значением, поэтому оно преобразуется в символ. В ASCII число 48 — код символа »0». Это очень странно, потому что есть конструктор, принимающий именно такие аргументы, int
и char
. Но вместо вызова этого конструктора происходит совершенно неочевидное преобразование. В итоге получается код, который чаще всего ведёт себя не так, как мы ожидаем.
Ещё больше трудностей возникает при использовании шаблонов. Как вы думаете, что возвращает эта программа? Какой здесь размер вектора?
template
auto test() {
return std::vector{N};
}
int main () {
return test().size();
}
Мы получим вектор с тремя строками, то есть ответ — 3. Но если string
заменить на int
, ответ будет 1, потому что для std::vector
будет использован initializer_list
. В зависимости от шаблонного параметра вызывается либо конструктор initializer_list
, либо другой конструктор. А если вместо string
или int
использовать float
, я и вовсе не знаю, что выйдет. Предсказать поведение такого кода очень сложно, и это создаёт множество неудобств. Например, мы не можем написать emplace функцию, которая работала бы для агрегатных типов с синтаксисом фигурных скобок. В общем, агрегатная инициализиация и синтаксис {}
не работают с шаблонами.
Теперь давайте разберёмся, что именно делает инициализация списком.
Для агрегатных типов при такой инициализации выполняется агрегатная
инициализация.
Для встроенных типов — прямая инициализация ({a}
) или
копирующая инициализация (= {a}
);
А для классов выполняется такая последовательность:
- Вначале «жадно» выполняется вызов конструктора, который принимает
std::initializer_list
.
Если для этого вызова необходимо сделать неочевидные преобразования — они выполняются. - Если подходящего конструктора нет, выполняется обычный
вызов конструктора()
при помощи разрешения перегрузки.
Для второго шага есть пара исключений.
Исключение 1: при использовании = {a}
, когда в списке один элемент a
,
может быть использована инициализация копированием.
Исключение 2: пустые фигурные скобки, {}
.
Пусть у нас будет тип с конструктором по умолчанию и конструктором, который принимает initializer_list
.
Что происходит при вызове Widget
?
template Typename
struct Widget {
Widget();
Widget(std::initializer_list);
};
int main() {
Widget widget{}; // какой конструктор будет вызван?
}
Мы ожидаем, что произойдёт вызов конструктора, принимающего initializer_list
, поскольку мы передали ему пустой initializer_list
в фигурных скобках. На самом деле тут вызывается конструктор по умолчанию. И только когда такого конструктора нет, вызывается конструктор, принимающий initializer_list
. Если и такого конструктора нет, выполняется инициализация значением. К сожалению, все эти правила необходимо помнить.
Разберём подробнее инициализацию значением при использовании {}
. Здесь, опять-таки, нужно помнить, что при Widget() = default
и Widget() {}
наблюдается разное поведение — об этом мы уже говорили.
Widget() = default
:
struct Widget {
Widget() = default;
int i;
};
int main() {
Widget widget{}; // инициализация значением (нулем), не происходит vexing parse
return widget.i; // возвращает 0
}
Widget() {}
:
struct Widget {
Widget() {}; // user-provided конструктор
int i;
};
int main() {
Widget widget{}; // инициализация значением, вызывается дефолтный конструктор
return widget.i; // не инициализирована, возникает UB
}
У инициализации списком есть полезное свойство: не допускаются преобразования, сужающие диапазон значений (narrowing conversions). Если для инициализации int
использовать double
, это является сужающим преобразованием, и такой код не компилируется:
int main() {
int i{2.0}; // ошибка!
}
То же самое происходит, если агрегатный объект инициализировать списком элементов double
. Это нововведение C++11, и оно вызывает больше всего ошибок при обновлении кода, написанного на более старых версиях языка. Это создаёт много работы при поддержке больших объёмов унаследованного кода:
struct Widget {
int i;
int j;
};
int main() {
Widget widget = {1.0, 0.0}; // ошибка в С++11 в отличие от C++98/03
}
Далее, при инициализации списком можно использовать вложенные фигурные скобки, но, в отличие от агрегатной инициализации, с ними не работает пропуск скобок (brace elision). С одной стороны, использовать вложенные фигурные скобки бывает очень полезно, они вносят ясность. Например, у нас есть map
. Тогда внешние фигурные скобки инициализируют этот map
, а внутренние фигурные скобки — его элементы:
std::map my_map {{"abc", 0}, {"def", 1}};
Но бывают случаи, когда от этой конструкции только вред. Давайте рассмотрим такой случай:
std::vector v1 {"abc", "def"}; // OK
std::vector v2 {{"abc", "def"}}; // ??
Напомню, это не агрегатная инициализация, это инициализация списком с initializer_list
. В первой строке мы используем initializer_list
из двух строк, поэтому в результате, очевидно, получается вектор из двух строк. А если заключить эти скобки в ещё одну пару фигурных скобок, получается неопределённое поведение. Попробуем разобраться, почему.
Внешний initializer_list
имеет только один элемент — внутренний initializer_list
, так что мы получим вектор с одной строкой. Эта строка инициализируется внутренним списком, в котором два const char*
. Оказывается, у string
есть конструктор, принимающий на вход итераторы char
для начала и конца. Так что эти две строки преобразуются в итераторы. Далее выполняется чтение с начала, оно доходит до неинициализированной памяти, и программа падает.
Мораль:
- читайте списки с фигурными скобками снаружи вовнутрь;
- без агрегатного типа пропуск скобок не работает.
Идём дальше. Передача и возврат braced-init-list также является инициализацией копированием списка. Это очень полезное свойство:
Widget f1() {
return {3, 0}; // copy-list инициализация возвращаемого значения
}
void f2(Widget);
f2({3, 0}); // copy-list инициализация аргумента
Если происходит возврат по значению, то используется инициализация копированием, поэтому при возврате braced-init-list используется инициализация копированием списка. А если передать braced-init-list функции, это также приведёт к инициализации копированием списка.
Конечно, это приводит к некоторым затруднениям в случае со вложенными скобками. На StackOverflow недавно был замечательный пост, в котором рассматривался один и тот же вызов функции с разными уровнями вложенности. Выяснилось, что результаты на всех уровнях разные. Я не буду вдаваться в подробности, потому что там всё очень сложно, но сам этот факт показателен:
#include
struct A {
A() {}
A(const A&) {}
};
struct B {
B(const A&) {}
};
void f(const A&) { std::cout << "A" << std::endl; }
void f(const B&) { std::cout << "B" << std::endl; }
int main() {
A a;
f( {a} ); // A
f( {{a}} ); // ambiguous
f( {{{a}}} ); // B
f({{{{a}}}}); // no matching function
}
Итак, мы прошли все версии до C++11 включительно. Мы обсудили все инициализации прошлых версий, плюс инициализацию списком, которая часто работает по совсем не очевидным правилам. Поговорим теперь о C++14. В нём были исправлены некоторые проблемы, доставшиеся от прошлых версий.
Например, в С++11 у агрегатных классов не могло быть direct member initializers, что вызывало совершенно ненужные затруднения. Выше я уже говорил о том, что direct member initializers очень полезны. Начиная с С++14, у агрегатных классов могут быть direct member initializers:
struct Widget {
int i = 0;
int j = 0;
};
Widget widget{1, 2}; // работает начиная с C++14
Второе улучшение Николай уже упоминал в программном докладе, оно связано с auto
. Если в С++11 после auto
следовал braced-init-list, это всегда приводило к выведению типа std::initializer_list
:
int i = 3; // int
int i(3); // int
int i{3}; // int
int i = {3}; // int
auto i = 3; // int
auto i(3); // int
auto i{3}; // В С++11 — std::initializer_list
auto i = {3}; // В С++11 — std::initializer_list
Такое поведение нежелательно: когда пишут auto i{3}
, чаще всего имеют ввиду int
, а не std::initializer_list
. В С++14 это поведение изменили, и auto i{3}
теперь читается как int
. Если же в фигурных скобках в этом примере несколько значений, то такой код не компилируется. Впрочем, auto i = {3}
всегда читается как std::initializer_list
. Как видим, здесь всё равно остаётся непоследовательность: при прямой инициализации списка получается int
, а при копирующей инициализации — initializer_list
.
auto i = 3; // int
auto i(3); // int
auto i{3}; // в С++14 — int, но работает только для списка из одного элемента
auto i = {3}; // так и осталось std::initializer_list
Наконец, в C++14 была решена проблема со статической инициализацией, но она была значительно менее важной, чем те, о которых я сейчас рассказал, и останавливаться на ней мы не будем. Если есть желание, об этом можно почитать самостоятельно.
Несмотря на все эти фиксы, в С++14 осталось много проблем с инициализацией списком:
Не сразу понятно, вызывается ли конструктор, принимающий
std::initializer_list
.Сам
std::initializer_list
не работает с move-only типами.Синтаксис практичеcки бесполезен для шаблонов, поэтому
emplace
илиmake_unique
нельзя использовать для агрегатных типов.Есть некоторые неочевидные правила, о которых мы уже говорили:
- пустые фигурные скобки ведут себя иначе, чем не-пустые;
- вложенные фигурные скобки ведут себя неочевидным образом;
- auto работает не всегда очевидным образом.
Наконец, я еще не рассказал, что инициализация списка совсем не работает с макросами.
Пример про макросы: assert(Widget(2,3))
выполняется, а assert(Widget{2,3})
ломает препроцессор. Дело в том, что у макросов есть специальное правило, которое правильно читает запятую внутри круглых скобок, но оно не было обновлено для фигурных скобок. Поэтому запятая в этом примере рассматривается как конец первого аргумента макроса, хотя скобки ещё не закрыты. Это приводит к сбою.
Я могу предложить несколько советов относительно того, как правильно инициализировать значения в С++.
Для простых типов вроде int
используйте инициализацию копированием, т. е. знак равенства и значение — так делается в большинстве языков программирования, к этому все давно привыкли и это наиболее простой вариант.
Фигурные скобки хороши в других ситуациях: для агрегатной инициализации, для вызова конструкторов, принимающих std::initializer_list
, и для direct member initializers. В последнем случае мы не можем использовать синтаксис прямой инициализации, поэтому там лучше всего подходят фигурные скобки.
Кроме того, фигурными скобками удобно пользоваться для передачи и возвращения врéменных объектов. При помощи двух пустых фигурных скобок можно быстро сделать инициализацию значения временного объекта.
struct Point {
int x = 0;
int y = 0;
};
setPosition(Point{2, 3});
takeWidget(Widget{});
Можно даже пропустить имя типа и использовать braced-init-list — это работает только с фигурными скобками.
setPosition({2, 3});
takeWidget({});
Но если необходимо просто вызвать конструктор, то лично я предпочитаю использовать прямую инициализацию, то есть классический синтаксис. Я прекрасно понимаю, что в этом со мной многие не согласятся — Николай говорил, что предпочитает для этого использовать фигурные скобки. Мне кажется, что круглые скобки более очевидны, поскольку тогда синтаксис такой же, как при вызове функции, и сразу ясно, что выполняется разрешение перегрузки. Все правила здесь очевидны, не надо думать, есть тут или нет initializer_list
. Мне этот подход кажется более простым и ясным: когда смотришь на такой код, сразу ясно, что он делает.
Ещё раз списком:
= value
для простых типов= {args}
и= {}© Habrahabr.ru