[Перевод] C++ vtables. Часть 2 (Virtual Inheritance + Compiler-Generated Code)
Перевод статьи подготовлен специально для студентов курса «Разработчик С++». Интересно развиваться в данном направлении? Смотрите запись мастер-класса «Практика использования Google Test Framework»!
Часть 3 — Виртуальное наследование
В первой и второй части этой статьи мы говорили о том, как vtables работают в простейших случаях, а затем в множественном наследовании. Виртуальное наследование усложняет ситуацию еще больше.
Как вы, возможно, помните, виртуальное наследование означает, что в конкретном классе есть только один экземпляр базового класса. Например:
class ios ...
class istream : virtual public ios ...
class ostream : virtual public ios ...
class iostream : public istream, public ostream
Если бы не ключевое слово virtual
, указанное выше, iostream
фактически имел бы два экземпляра ios
, которые могли бы вызывать головные боли при синхронизации и просто были бы неэффективными.
Чтобы понять виртуальное наследование, мы рассмотрим следующий фрагмент кода:
#include
using namespace std;
class Grandparent {
public:
virtual void grandparent_foo() {}
int grandparent_data;
};
class Parent1 : virtual public Grandparent {
public:
virtual void parent1_foo() {}
int parent1_data;
};
class Parent2 : virtual public Grandparent {
public:
virtual void parent2_foo() {}
int parent2_data;
};
class Child : public Parent1, public Parent2 {
public:
virtual void child_foo() {}
int child_data;
};
int main() {
Child child;
}
Давайте исследуем child
. Я начну с дампинга большого количества памяти именно там, где начинается vtable Child
, как мы это делали в предыдущих частях, а затем проанализирую результаты. Я предлагаю быстро взглянуть на результат здесь и вернуться к нему, когда я раскрою детали ниже.
(gdb) p child
$1 = { = { = {_vptr$Grandparent = 0x400998 , grandparent_data = 0}, _vptr$Parent1 = 0x400950 , parent1_data = 0}, = {_vptr$Parent2 = 0x400978 , parent2_data = 4195888}, child_data = 0}
(gdb) x/600xb 0x400938
0x400938 : 0x20 0x00 0x00 0x00 0x00 0x00 0x00 0x00
0x400940 : 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00
0x400948 : 0x00 0x0b 0x40 0x00 0x00 0x00 0x00 0x00
0x400950 : 0x70 0x08 0x40 0x00 0x00 0x00 0x00 0x00
0x400958 : 0xa0 0x08 0x40 0x00 0x00 0x00 0x00 0x00
0x400960 : 0x10 0x00 0x00 0x00 0x00 0x00 0x00 0x00
0x400968 : 0xf0 0xff 0xff 0xff 0xff 0xff 0xff 0xff
0x400970 : 0x00 0x0b 0x40 0x00 0x00 0x00 0x00 0x00
0x400978 : 0x90 0x08 0x40 0x00 0x00 0x00 0x00 0x00
0x400980 : 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00
0x400988 : 0xe0 0xff 0xff 0xff 0xff 0xff 0xff 0xff
0x400990 : 0x00 0x0b 0x40 0x00 0x00 0x00 0x00 0x00
0x400998 : 0x80 0x08 0x40 0x00 0x00 0x00 0x00 0x00
0x4009a0 : 0x50 0x09 0x40 0x00 0x00 0x00 0x00 0x00
0x4009a8 : 0xf8 0x09 0x40 0x00 0x00 0x00 0x00 0x00
0x4009b0 : 0x18 0x0a 0x40 0x00 0x00 0x00 0x00 0x00
0x4009b8 : 0x98 0x0a 0x40 0x00 0x00 0x00 0x00 0x00
0x4009c0 : 0xb8 0x0a 0x40 0x00 0x00 0x00 0x00 0x00
0x4009c8 : 0x98 0x09 0x40 0x00 0x00 0x00 0x00 0x00
0x4009d0 : 0x78 0x09 0x40 0x00 0x00 0x00 0x00 0x00
0x4009d8: 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00
0x4009e0 : 0x20 0x00 0x00 0x00 0x00 0x00 0x00 0x00
0x4009e8 : 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00
0x4009f0 : 0x50 0x0a 0x40 0x00 0x00 0x00 0x00 0x00
0x4009f8 : 0x70 0x08 0x40 0x00 0x00 0x00 0x00 0x00
0x400a00 : 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00
0x400a08 : 0xe0 0xff 0xff 0xff 0xff 0xff 0xff 0xff
0x400a10 : 0x50 0x0a 0x40 0x00 0x00 0x00 0x00 0x00
0x400a18 : 0x80 0x08 0x40 0x00 0x00 0x00 0x00 0x00
0x400a20 : 0x37 0x50 0x61 0x72 0x65 0x6e 0x74 0x31
0x400a28 : 0x00 0x31 0x31 0x47 0x72 0x61 0x6e 0x64
0x400a30 : 0x70 0x61 0x72 0x65 0x6e 0x74 0x00 0x00
0x400a38 : 0x50 0x10 0x60 0x00 0x00 0x00 0x00 0x00
0x400a40 : 0x29 0x0a 0x40 0x00 0x00 0x00 0x00 0x00
0x400a48: 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00
0x400a50 : 0xa0 0x10 0x60 0x00 0x00 0x00 0x00 0x00
0x400a58 : 0x20 0x0a 0x40 0x00 0x00 0x00 0x00 0x00
0x400a60 : 0x00 0x00 0x00 0x00 0x01 0x00 0x00 0x00
0x400a68 : 0x38 0x0a 0x40 0x00 0x00 0x00 0x00 0x00
0x400a70 : 0x03 0xe8 0xff 0xff 0xff 0xff 0xff 0xff
0x400a78: 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00
0x400a80 : 0x10 0x00 0x00 0x00 0x00 0x00 0x00 0x00
0x400a88 : 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00
0x400a90 : 0xd0 0x0a 0x40 0x00 0x00 0x00 0x00 0x00
0x400a98 : 0x90 0x08 0x40 0x00 0x00 0x00 0x00 0x00
0x400aa0 : 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00
0x400aa8 : 0xf0 0xff 0xff 0xff 0xff 0xff 0xff 0xff
0x400ab0 : 0xd0 0x0a 0x40 0x00 0x00 0x00 0x00 0x00
0x400ab8 : 0x80 0x08 0x40 0x00 0x00 0x00 0x00 0x00
0x400ac0 : 0x37 0x50 0x61 0x72 0x65 0x6e 0x74 0x32
0x400ac8 : 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00
0x400ad0 : 0xa0 0x10 0x60 0x00 0x00 0x00 0x00 0x00
0x400ad8 : 0xc0 0x0a 0x40 0x00 0x00 0x00 0x00 0x00
0x400ae0 : 0x00 0x00 0x00 0x00 0x01 0x00 0x00 0x00
0x400ae8 : 0x38 0x0a 0x40 0x00 0x00 0x00 0x00 0x00
0x400af0 : 0x03 0xe8 0xff 0xff 0xff 0xff 0xff 0xff
0x400af8 : 0x35 0x43 0x68 0x69 0x6c 0x64 0x00 0x00
0x400b00 : 0xa0 0x10 0x60 0x00 0x00 0x00 0x00 0x00
0x400b08 : 0xf8 0x0a 0x40 0x00 0x00 0x00 0x00 0x00
0x400b10 : 0x02 0x00 0x00 0x00 0x02 0x00 0x00 0x00
0x400b18 : 0x50 0x0a 0x40 0x00 0x00 0x00 0x00 0x00
0x400b20 : 0x02 0x00 0x00 0x00 0x00 0x00 0x00 0x00
0x400b28 : 0xd0 0x0a 0x40 0x00 0x00 0x00 0x00 0x00
0x400b30 : 0x02 0x10 0x00 0x00 0x00 0x00 0x00 0x00
0x400b38 : 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00
0x400b40 : 0x38 0x0a 0x40 0x00 0x00 0x00 0x00 0x00
0x400b48 : 0x80 0x08 0x40 0x00 0x00 0x00 0x00 0x00
Вау, здесь много информации. Сразу же всплывают два новых вопроса: что такое VTT
и что такое construction vtable for X-in-Child
? Мы ответим на них достаточно скоро.
Давайте начнем со структуры памяти Child
:
Действительно, у Child
есть только 1 экземпляр Grandparent. Нетривиальная вещь заключается в том, что он последний в памяти, хотя он и является высшим в иерархии.
Вот структура vtable
:
Выше появилась новая концепция — virtual-base offset
. Скоро мы поймем, что он там делает.
Далее давайте исследуем эти странно выглядящие construction vtables
. Вот construction vtable for Parent1-in-Child
:
На данный момент я думаю, что было бы более понятным описать процесс, нежели наваливать на вас больше таблиц со случайными числами. Итак:
Представьте, что вы Child
. Вас просят сконструировать себя в новом участке памяти. Поскольку вы наследуете Grandparent
напрямую (именно это означает виртуальное наследование), сначала вы будете напрямую вызывать его конструктор (если бы это не было виртуальное наследование, вы вызывали бы конструктор Parent1
, который, в свою очередь, вызвал бы конструктор Grandparent
). Вы устанавливаете this += 32
байта, так как именно здесь находятся данные Grandparent
, и вызываете конструктор. Очень просто.
Затем наступает время сконструировать Parent1
. Parent1
может с уверенностью предполагать, что к тому времени, когда он конструирует себя, Grandparent
уже был создан, поэтому он может, например, получить доступ к данным и методам Grandparent
. Но подождите, как он может знать, где найти эти данные? Они ведь не в одном месте с переменными Parent1
!
На сцену выходит construction table for Parent1-in-Child
. Эта таблица предназначена для указания Parent1
, где найти фрагменты данных, к которым он может получить доступ. this
указывает на данные Parent1
. virtual-base offset
указывает, где можно найти данные Grandparent: Перешагните на 32 байта вперед от this, и вы найдете память Grandparent
. Поняли? virtual-base offset аналогичен top_offset, но для виртуальных классов.
Теперь, когда мы это понимаем, конструирование Parent2
в основном такое же, только с использованием construction table for Parent2-in-Child
. И действительно, Parent2-in-Child
имеет virtual-base offset
в 16 байтов.
Дайте информации немного впитаться. Вы готовы продолжить? Хорошо.
Теперь давайте вернемся к VTT
. Вот структура VTT
:
VTT
расшифровывается как virtual-table table
(таблицу виртуальных таблиц), что означает, что это таблица vtable-ов. Это таблица трансляции, которая знает, например, вызывается ли конструктор Parent1
для отдельного объекта, для объекта Parent1-in-Child
или для Parent1-in-SomeOtherObject
. Она всегда появляется сразу после vtable
, чтобы компилятор знал, где ее найти. Поэтому нет необходимости хранить другой указатель в самих объектах.
Фух… много деталей, но я думаю, что мы охватили все, что я хотел охватить. В четвертой части мы поговорим о деталях vtables
более высокого уровня. Не пропускайте, так как это, вероятно, самая важная часть в этой статье!
Часть 4 — Код, сгенерированный компилятором
К этому моменту из этой статьи мы узнали, как записи vtables
и typeinfo
помещаются в наши двоичные файлы и как их использует компилятор. Теперь мы поймем часть работы, которую компилятор выполняет для нас автоматически.
Конструкторы
Для конструктора любого класса генерируется следующий код:
- Вызов конструктов родителей, если они есть;
- Установка указателей vtable, если они есть;
- Инициализация членов в соответствии со списком инициализаторов;
- Выполнение кода внутри скобок конструктора.
Все вышеперечисленное может происходить без явного кода:
- Родительские конструкторы по умолчанию запускаются автоматически, если не указано иное;
- Члены инициализируются по умолчанию, если у них нет значения по умолчанию или записи в списке инициализатора;
- Весь конструктор может быть помечен = default;
- Только назначение vtable всегда скрыто.
Вот пример:
#include
#include
using namespace std;
class Parent {
public:
Parent() { Foo(); }
virtual ~Parent() = default;
virtual void Foo() { cout << "Parent" << endl; }
int i = 0;
};
class Child : public Parent {
public:
Child() : j(1) { Foo(); }
void Foo() override { cout << "Child" << endl; }
int j;
};
class Grandchild : public Child {
public:
Grandchild() { Foo(); s = "hello"; }
void Foo() override { cout << "Grandchild" << endl; }
string s;
};
int main() {
Grandchild g;
}
Давайте напишем псевдокод для конструктора каждого класса:
Учитывая это, неудивительно, что в контексте конструктора класса vtable указывает на vtable этого самого класса, а не на его конкретный класс. Это означает, что виртуальные вызовы разрешаются так, как будто доступных наследников нет. Таким образом, вывод
Parent
Child
Grandchild
А как насчет чисто виртуальных функций? Если они не реализованы (да, вы можете реализовать чисто виртуальные функции, но зачем вам это надо?), Вы, вероятно, (и мы надеемся) проследуете прямиком к segfault. Некоторые компиляторы пренебрегают ошибку, что круто.
Деструкторы
Как вы можете себе представить, деструкторы ведут себя так же, как конструкторы, только в обратном порядке.
Вот быстрое упражнение для размышления: почему деструкторы изменяют указатель vtable, чтобы он указывал на собственный класс, а не оставлял указатель на конкретный класс? Ответ: поскольку к моменту запуска деструктора любой наследующий класс уже был уничтожен. Вызов методов такого класса — это не то, что вы хотите делать.
Неявное приведение
Как мы видели во второй и третей части, указатель на дочерний объект не обязательно равен родительскому указателю того же экземпляра (как в случае множественного наследования).
Тем не менее, для вас (разработчика) нет дополнительной работы по вызову функции, которая получает указатель родителя. Это потому, что компилятор неявно сдвигает this
, когда вы апкастите указатели и ссылки на родительские классы.
Динамическое приведение (RTTI)
При динамическом приведении используются таблицы typeinfo
, которые мы исследовали в первой части. Они делают это во время выполнения, просматривая запись typeinfo
за один указатель до того, на что указывает указатель vtable
, и используют класс оттуда, чтобы проверить, возможно ли приведение.
Это объясняет стоимость dynamic_cast при частом использовании.
Указатели на методы
Я планирую написать полный пост об указателях на методы в будущем. До этого я хотел бы подчеркнуть, что указатель на метод, указывающий на виртуальную функцию, будет фактически вызывать переопределенный метод (в отличие от указателей на функции, не являющиеся членами).
// TODO: добавить ссылку, когда пост будет готов
Проверьте себя!
Теперь вы сможете объяснить себе, почему следующий фрагмент кода ведет себя так, как он себя ведет:
#include
using namespace std;
class FooInterface {
public:
virtual ~FooInterface() = default;
virtual void Foo() = 0;
};
class BarInterface {
public:
virtual ~BarInterface() = default;
virtual void Bar() = 0;
};
class Concrete : public FooInterface, public BarInterface {
public:
void Foo() override { cout << "Foo()" << endl; }
void Bar() override { cout << "Bar()" << endl; }
};
int main() {
Concrete c;
c.Foo();
c.Bar();
FooInterface* foo = &c;
foo->Foo();
BarInterface* bar = (BarInterface*)(foo);
bar->Bar(); // Выводит "Foo()" - WTF?
}
На этом я заканчиваю свою статью из четырех частей. Я надеюсь, что вы узнали что-то новое, так же как и я.