[Перевод] C++ vtables. Часть 2 (Virtual Inheritance + Compiler-Generated Code)

Перевод статьи подготовлен специально для студентов курса «Разработчик С++». Интересно развиваться в данном направлении? Смотрите запись мастер-класса «Практика использования Google Test Framework»!

tkdp8nfahc7sglqks8sl_tazk1o.png


Часть 3 — Виртуальное наследование

В первой и второй части этой статьи мы говорили о том, как vtables работают в простейших случаях, а затем в множественном наследовании. Виртуальное наследование усложняет ситуацию еще больше.

Как вы, возможно, помните, виртуальное наследование означает, что в конкретном классе есть только один экземпляр базового класса. Например:

class ios ...
class istream : virtual public ios ...
class ostream : virtual public ios ...
class iostream : public istream, public ostream

Если бы не ключевое слово virtual, указанное выше, iostream фактически имел бы два экземпляра ios, которые могли бы вызывать головные боли при синхронизации и просто были бы неэффективными.

Чтобы понять виртуальное наследование, мы рассмотрим следующий фрагмент кода:

#include 
using namespace std;

class Grandparent {
 public:
  virtual void grandparent_foo() {}
  int grandparent_data;
};

class Parent1 : virtual public Grandparent {
 public:
  virtual void parent1_foo() {}
  int parent1_data;
};

class Parent2 : virtual public Grandparent {
 public:
  virtual void parent2_foo() {}
  int parent2_data;
};

class Child : public Parent1, public Parent2 {
 public:
  virtual void child_foo() {}
  int child_data;
};

int main() {
  Child child;
}

Давайте исследуем child. Я начну с дампинга большого количества памяти именно там, где начинается vtable Child, как мы это делали в предыдущих частях, а затем проанализирую результаты. Я предлагаю быстро взглянуть на результат здесь и вернуться к нему, когда я раскрою детали ниже.

(gdb) p child
$1 = { = { = {_vptr$Grandparent = 0x400998 , grandparent_data = 0}, _vptr$Parent1 = 0x400950 , parent1_data = 0},  = {_vptr$Parent2 = 0x400978 , parent2_data = 4195888}, child_data = 0}
(gdb) x/600xb 0x400938
0x400938 :    0x20    0x00    0x00    0x00    0x00    0x00    0x00    0x00
0x400940 :  0x00    0x00    0x00    0x00    0x00    0x00    0x00    0x00
0x400948 : 0x00    0x0b    0x40    0x00    0x00    0x00    0x00    0x00
0x400950 : 0x70    0x08    0x40    0x00    0x00    0x00    0x00    0x00
0x400958 : 0xa0    0x08    0x40    0x00    0x00    0x00    0x00    0x00
0x400960 : 0x10    0x00    0x00    0x00    0x00    0x00    0x00    0x00
0x400968 : 0xf0    0xff    0xff    0xff    0xff    0xff    0xff    0xff
0x400970 : 0x00    0x0b    0x40    0x00    0x00    0x00    0x00    0x00
0x400978 : 0x90    0x08    0x40    0x00    0x00    0x00    0x00    0x00
0x400980 : 0x00    0x00    0x00    0x00    0x00    0x00    0x00    0x00
0x400988 : 0xe0    0xff    0xff    0xff    0xff    0xff    0xff    0xff
0x400990 : 0x00    0x0b    0x40    0x00    0x00    0x00    0x00    0x00
0x400998 : 0x80    0x08    0x40    0x00    0x00    0x00    0x00    0x00
0x4009a0 :   0x50    0x09    0x40    0x00    0x00    0x00    0x00    0x00
0x4009a8 : 0xf8    0x09    0x40    0x00    0x00    0x00    0x00    0x00
0x4009b0 :    0x18    0x0a    0x40    0x00    0x00    0x00    0x00    0x00
0x4009b8 :    0x98    0x0a    0x40    0x00    0x00    0x00    0x00    0x00
0x4009c0 :    0xb8    0x0a    0x40    0x00    0x00    0x00    0x00    0x00
0x4009c8 :    0x98    0x09    0x40    0x00    0x00    0x00    0x00    0x00
0x4009d0 :    0x78    0x09    0x40    0x00    0x00    0x00    0x00    0x00
0x4009d8:   0x00    0x00    0x00    0x00    0x00    0x00    0x00    0x00
0x4009e0 :    0x20    0x00    0x00    0x00    0x00    0x00    0x00    0x00
0x4009e8 :  0x00    0x00    0x00    0x00    0x00    0x00    0x00    0x00
0x4009f0 : 0x50    0x0a    0x40    0x00    0x00    0x00    0x00    0x00
0x4009f8 : 0x70    0x08    0x40    0x00    0x00    0x00    0x00    0x00
0x400a00 : 0x00    0x00    0x00    0x00    0x00    0x00    0x00    0x00
0x400a08 : 0xe0    0xff    0xff    0xff    0xff    0xff    0xff    0xff
0x400a10 : 0x50    0x0a    0x40    0x00    0x00    0x00    0x00    0x00
0x400a18 : 0x80    0x08    0x40    0x00    0x00    0x00    0x00    0x00
0x400a20 :   0x37    0x50    0x61    0x72    0x65    0x6e    0x74    0x31
0x400a28 : 0x00    0x31    0x31    0x47    0x72    0x61    0x6e    0x64
0x400a30 : 0x70    0x61    0x72    0x65    0x6e    0x74    0x00    0x00
0x400a38 :    0x50    0x10    0x60    0x00    0x00    0x00    0x00    0x00
0x400a40 :  0x29    0x0a    0x40    0x00    0x00    0x00    0x00    0x00
0x400a48:   0x00    0x00    0x00    0x00    0x00    0x00    0x00    0x00
0x400a50 :    0xa0    0x10    0x60    0x00    0x00    0x00    0x00    0x00
0x400a58 :  0x20    0x0a    0x40    0x00    0x00    0x00    0x00    0x00
0x400a60 : 0x00    0x00    0x00    0x00    0x01    0x00    0x00    0x00
0x400a68 : 0x38    0x0a    0x40    0x00    0x00    0x00    0x00    0x00
0x400a70 : 0x03    0xe8    0xff    0xff    0xff    0xff    0xff    0xff
0x400a78:   0x00    0x00    0x00    0x00    0x00    0x00    0x00    0x00
0x400a80 :    0x10    0x00    0x00    0x00    0x00    0x00    0x00    0x00
0x400a88 :  0x00    0x00    0x00    0x00    0x00    0x00    0x00    0x00
0x400a90 : 0xd0    0x0a    0x40    0x00    0x00    0x00    0x00    0x00
0x400a98 : 0x90    0x08    0x40    0x00    0x00    0x00    0x00    0x00
0x400aa0 : 0x00    0x00    0x00    0x00    0x00    0x00    0x00    0x00
0x400aa8 : 0xf0    0xff    0xff    0xff    0xff    0xff    0xff    0xff
0x400ab0 : 0xd0    0x0a    0x40    0x00    0x00    0x00    0x00    0x00
0x400ab8 : 0x80    0x08    0x40    0x00    0x00    0x00    0x00    0x00
0x400ac0 :   0x37    0x50    0x61    0x72    0x65    0x6e    0x74    0x32
0x400ac8 : 0x00    0x00    0x00    0x00    0x00    0x00    0x00    0x00
0x400ad0 :    0xa0    0x10    0x60    0x00    0x00    0x00    0x00    0x00
0x400ad8 :  0xc0    0x0a    0x40    0x00    0x00    0x00    0x00    0x00
0x400ae0 : 0x00    0x00    0x00    0x00    0x01    0x00    0x00    0x00
0x400ae8 : 0x38    0x0a    0x40    0x00    0x00    0x00    0x00    0x00
0x400af0 : 0x03    0xe8    0xff    0xff    0xff    0xff    0xff    0xff
0x400af8 : 0x35    0x43    0x68    0x69    0x6c    0x64    0x00    0x00
0x400b00 :  0xa0    0x10    0x60    0x00    0x00    0x00    0x00    0x00
0x400b08 :    0xf8    0x0a    0x40    0x00    0x00    0x00    0x00    0x00
0x400b10 :   0x02    0x00    0x00    0x00    0x02    0x00    0x00    0x00
0x400b18 :   0x50    0x0a    0x40    0x00    0x00    0x00    0x00    0x00
0x400b20 :   0x02    0x00    0x00    0x00    0x00    0x00    0x00    0x00
0x400b28 :   0xd0    0x0a    0x40    0x00    0x00    0x00    0x00    0x00
0x400b30 :   0x02    0x10    0x00    0x00    0x00    0x00    0x00    0x00
0x400b38 :  0x00    0x00    0x00    0x00    0x00    0x00    0x00    0x00
0x400b40 :    0x38    0x0a    0x40    0x00    0x00    0x00    0x00    0x00
0x400b48 :   0x80    0x08    0x40    0x00    0x00    0x00    0x00    0x00

Вау, здесь много информации. Сразу же всплывают два новых вопроса: что такое VTT и что такое construction vtable for X-in-Child? Мы ответим на них достаточно скоро.
Давайте начнем со структуры памяти Child:

Действительно, у Child есть только 1 экземпляр Grandparent. Нетривиальная вещь заключается в том, что он последний в памяти, хотя он и является высшим в иерархии.
Вот структура vtable:

Выше появилась новая концепция — virtual-base offset. Скоро мы поймем, что он там делает.
Далее давайте исследуем эти странно выглядящие construction vtables. Вот construction vtable for Parent1-in-Child:

На данный момент я думаю, что было бы более понятным описать процесс, нежели наваливать на вас больше таблиц со случайными числами. Итак:

Представьте, что вы Child. Вас просят сконструировать себя в новом участке памяти. Поскольку вы наследуете Grandparent напрямую (именно это означает виртуальное наследование), сначала вы будете напрямую вызывать его конструктор (если бы это не было виртуальное наследование, вы вызывали бы конструктор Parent1, который, в свою очередь, вызвал бы конструктор Grandparent). Вы устанавливаете this += 32 байта, так как именно здесь находятся данные Grandparent, и вызываете конструктор. Очень просто.

Затем наступает время сконструировать Parent1. Parent1 может с уверенностью предполагать, что к тому времени, когда он конструирует себя, Grandparent уже был создан, поэтому он может, например, получить доступ к данным и методам Grandparent. Но подождите, как он может знать, где найти эти данные? Они ведь не в одном месте с переменными Parent1!

На сцену выходит construction table for Parent1-in-Child. Эта таблица предназначена для указания Parent1, где найти фрагменты данных, к которым он может получить доступ. this указывает на данные Parent1. virtual-base offset указывает, где можно найти данные Grandparent: Перешагните на 32 байта вперед от this, и вы найдете память Grandparent. Поняли? virtual-base offset аналогичен top_offset, но для виртуальных классов.

Теперь, когда мы это понимаем, конструирование Parent2 в основном такое же, только с использованием construction table for Parent2-in-Child. И действительно, Parent2-in-Child имеет virtual-base offset в 16 байтов.

Дайте информации немного впитаться. Вы готовы продолжить? Хорошо.
Теперь давайте вернемся к VTT. Вот структура VTT:

VTT расшифровывается как virtual-table table (таблицу виртуальных таблиц), что означает, что это таблица vtable-ов. Это таблица трансляции, которая знает, например, вызывается ли конструктор Parent1 для отдельного объекта, для объекта Parent1-in-Child или для Parent1-in-SomeOtherObject. Она всегда появляется сразу после vtable, чтобы компилятор знал, где ее найти. Поэтому нет необходимости хранить другой указатель в самих объектах.

Фух… много деталей, но я думаю, что мы охватили все, что я хотел охватить. В четвертой части мы поговорим о деталях vtables более высокого уровня. Не пропускайте, так как это, вероятно, самая важная часть в этой статье!


Часть 4 — Код, сгенерированный компилятором

К этому моменту из этой статьи мы узнали, как записи vtables и typeinfo помещаются в наши двоичные файлы и как их использует компилятор. Теперь мы поймем часть работы, которую компилятор выполняет для нас автоматически.


Конструкторы

Для конструктора любого класса генерируется следующий код:


  • Вызов конструктов родителей, если они есть;
  • Установка указателей vtable, если они есть;
  • Инициализация членов в соответствии со списком инициализаторов;
  • Выполнение кода внутри скобок конструктора.

Все вышеперечисленное может происходить без явного кода:


  • Родительские конструкторы по умолчанию запускаются автоматически, если не указано иное;
  • Члены инициализируются по умолчанию, если у них нет значения по умолчанию или записи в списке инициализатора;
  • Весь конструктор может быть помечен = default;
  • Только назначение vtable всегда скрыто.

Вот пример:

#include 
#include 
using namespace std;

class Parent {
public:
    Parent() { Foo(); }
    virtual ~Parent() = default;
    virtual void Foo() { cout << "Parent" << endl; }
    int i = 0;
};

class Child : public Parent {
public:
    Child() : j(1) { Foo(); }
    void Foo() override { cout << "Child" << endl; }
    int j;
};

class Grandchild : public Child {
public:
    Grandchild() { Foo(); s = "hello"; }
    void Foo() override { cout << "Grandchild" << endl; }
    string s;
};

int main() {
    Grandchild g;
}

Давайте напишем псевдокод для конструктора каждого класса:

Учитывая это, неудивительно, что в контексте конструктора класса vtable указывает на vtable этого самого класса, а не на его конкретный класс. Это означает, что виртуальные вызовы разрешаются так, как будто доступных наследников нет. Таким образом, вывод

Parent
Child
Grandchild

А как насчет чисто виртуальных функций? Если они не реализованы (да, вы можете реализовать чисто виртуальные функции, но зачем вам это надо?), Вы, вероятно, (и мы надеемся) проследуете прямиком к segfault. Некоторые компиляторы пренебрегают ошибку, что круто.


Деструкторы

Как вы можете себе представить, деструкторы ведут себя так же, как конструкторы, только в обратном порядке.

Вот быстрое упражнение для размышления: почему деструкторы изменяют указатель vtable, чтобы он указывал на собственный класс, а не оставлял указатель на конкретный класс? Ответ: поскольку к моменту запуска деструктора любой наследующий класс уже был уничтожен. Вызов методов такого класса — это не то, что вы хотите делать.


Неявное приведение

Как мы видели во второй и третей части, указатель на дочерний объект не обязательно равен родительскому указателю того же экземпляра (как в случае множественного наследования).

Тем не менее, для вас (разработчика) нет дополнительной работы по вызову функции, которая получает указатель родителя. Это потому, что компилятор неявно сдвигает this, когда вы апкастите указатели и ссылки на родительские классы.


Динамическое приведение (RTTI)

При динамическом приведении используются таблицы typeinfo, которые мы исследовали в первой части. Они делают это во время выполнения, просматривая запись typeinfo за один указатель до того, на что указывает указатель vtable, и используют класс оттуда, чтобы проверить, возможно ли приведение.

Это объясняет стоимость dynamic_cast при частом использовании.


Указатели на методы

Я планирую написать полный пост об указателях на методы в будущем. До этого я хотел бы подчеркнуть, что указатель на метод, указывающий на виртуальную функцию, будет фактически вызывать переопределенный метод (в отличие от указателей на функции, не являющиеся членами).

// TODO: добавить ссылку, когда пост будет готов


Проверьте себя!

Теперь вы сможете объяснить себе, почему следующий фрагмент кода ведет себя так, как он себя ведет:

#include 
using namespace std;

class FooInterface {
public:
    virtual ~FooInterface() = default;
    virtual void Foo() = 0;
};

class BarInterface {
public:
    virtual ~BarInterface() = default;

    virtual void Bar() = 0;
};

class Concrete : public FooInterface, public BarInterface {
public:
    void Foo() override { cout << "Foo()" << endl; }
    void Bar() override { cout << "Bar()" << endl; }
};

int main() {
    Concrete c;
    c.Foo();
    c.Bar();

    FooInterface* foo = &c;
    foo->Foo();

    BarInterface* bar = (BarInterface*)(foo);
    bar->Bar(); // Выводит "Foo()" - WTF?
}

На этом я заканчиваю свою статью из четырех частей. Я надеюсь, что вы узнали что-то новое, так же как и я.

© Habrahabr.ru