Расширяем кругозор: Garbage Collector в V8

Всем привет, Хабрчане! Во время подготовки к очередному тех-собесу, я задался вопросом:, а как в V8 работает Garbage Collector, что такое Heap и Stack, про которые я неоднократно слышал? После прочтения нескольких англоязычных и русскоязычных ресурсов понял, что одни копают очень глубоко, а другие дают лишь минимальную базу. Я решил сделать что-то среднее и с агрегировать все эти знания в одну статью, плавно погружая читателя в тему.

Кстати, я начинающий Node.js разработчик и это моя первая статья, прошу не судить строго :)

Погружаемся!

3ae000cd820ad38d91e342f7dfe7b55a.jpg

Начнем с базы

Принцип сборки мусора довольно прост: если на сегмент в памяти никто не ссылается, например на объект, можно считать, что он (объект) не используется, и очистить его. Такой принцип ещё называют «принципом достижимости».

Основной алгоритм сборки мусора называется mark-and-sweep. Этот алгоритм может быть объединен также и с алгоритмом mark-compact. Вместе они работают следующим образом:

  1. Сборщик мусора отмечает все корневые объекты.

  2. Далее помечаются все объекты, на которые ссылаются эти корни.

  3. Процесс повторяется для всех достижимых объектов.

  4. После этого непомеченные объекты считаются недостижимыми и удаляются.

  5. Происходит перемещение (дефрагментация) оставшихся объектов. Это уменьшит фрагментацию и повысит производительность выделения памяти для новых объектов.

mark-and-sweep + mark-compact

mark-and-sweep + mark-compact

Существует ещё несколько алгоритмов сборки мусора. Некоторые из наиболее распространенных алгоритмов включают:

  1. Serial Garbage Collector

  2. Parallel Garbage Collector

  3. Concurrent Mark and Sweep (CMS)

  4. Garbage First (G1)

Копаем глубже

Как в памяти V8 распределяются переменные, функции и объекты? V8 использует схему, основанную на концепции Java Virtual Machine (JVM) и делит память на сегменты:

V8 memory schema

172135050e6b34ff46cc0ebc7c1960ec.png
  • Code Segment: выполняемый на данный момент код.

  • Stack (статическое выделение памяти): содержит все примитивные типы данных (вроде int, bool, string) с указателями на функции, объекты, а также информация о вызовах методов.

  • Heap (динамическое выделение памяти): сегмент памяти, предназначенный для хранения ссылочных типов данных, вроде объектов, массивов и функций. Это самый большой блок области памяти и именно здесь происходит сборка мусора.

Подробнее про каждый сегмент

Stack:

Это область памяти, выделенная для каждого процесса в V8. Здесь, как говорилось ранее, хранятся статические данные, включая фреймы методов/функций, примитивные значения и указатели на объекты. Стек работает по принципу LIFO (Last In, First Out), то есть последний добавленный элемент будет первым извлеченным.

Heap — самый большой блок области памяти, под капотом он делиться на:

Heap schema

ca4d3112badc8412d9452527de48e580.png
  • Young generation — место, где «живут» новые объекты, и большинство из них недолговечны. Это пространство небольшое и состоит из двух полу-пространств (from-space, to-space).

  • Old generation — место, куда перемещаются объекты, которые пережили два цикла сборки мусора в Young generation блоке. Это пространство управляется основным алгоритмом сборки мусора mark-and-sweepOld generation можно поделить ещё на два подпространства:

    • Old pointer space — cодержит объекты, которые пережили два цикла сборки мусора, и имеют указатели на другие объекты.

    • Old data space — содержит исключительно объекты, которые имеют данные (без ссылок) и строки, числа, массивы.

  • Large object space — тут хранятся объекты, размер которых превышает размер других пространств. Большие объекты никогда не удаляются сборщиком мусора.

  • Code-space — Здесь Just In Time (JIT) компилятор сохраняет скомпилированные блоки кода. Это единственное пространство с исполняемой памятью.

  • Cell space, property cell space, and map space — тут хранятся сервисные объекты, которые упрощают сборку мусора.

Заключение

Я надеюсь, что эта статья была полезной и интересной. Буду рад любым замечаниям и вопросам. Спасибо за внимание!

Вдохновлялся:

  1. A tour of V8: Garbage Collection

  2. Visualizing memory management in V8 Engine (JavaScript, NodeJS, Deno, WebAssembly)

  3. Устройство и работа JVM (Java Virtual Machine)

  4. Эффективная работа с памятью в Node.js

Мой репозиторий «Расширяем кругозор: Node.js и JavaScript», где я записываю интересные ответы на вопросы и познаю дзен V8.

© Habrahabr.ru