Релиз набора компиляторов LLVM 12.0

После шести месяцев разработки представлен релиз проекта LLVM 12.0 — GCC-совместимого инструментария (компиляторы, оптимизаторы и генераторы кода), компилирующего программы в промежуточный биткод RISC-подобных виртуальных инструкций (низкоуровневая виртуальная машина с многоуровневой системой оптимизаций). Сгенерированный псевдокод может быть преобразован при помощи JIT-компилятора в машинные инструкции непосредственно в момент выполнения программы.

Улучшения в Clang 12.0:

  • Реализована и включена по умолчанию поддержка предложенных в стандарте C++20 атрибутов «likely» и «unlikely», позволяющих информировать оптимизатор о вероятности срабатывания условной конструкции (например,»[[likely]] if (random > 0) {»).

  • Добавлена поддержка процессоров AMD Zen 3 (-march=znver3), Intel Alder Lake (-march=alderlake) и Intel Sapphire Rapids (-march=sapphirerapids).
  • Добавлена поддержка флагов »-march=x86–64-v[234]» для выбора уровней архитектуры x86–64: v2 — охватывает расширения SSE4.2, SSSE3, POPCNT и CMPXCHG16B; v3 — AVX2 и MOVBE; v4 — AVX-512.

  • Добавлена поддержка процессоров Arm Cortex-A78C (cortex-a78c), Arm Cortex-R82 (cortex-r82), Arm Neoverse V1 (neoverse-v1), Arm Neoverse N2 (neoverse-n2) и Fujitsu A64FX (a64fx). Например, для включения оптимизаций для CPU Neoverse-V1 можно указать »-mcpu=neoverse-v1».

  • Для архитектуры AArch64 добавлены новые флаги компилятора »-moutline-atomics» и »-mno-outline-atomics», предназначенные для включения и отключения вспомогательных функций с реализацией атомарных операций, таких как »__aarch64_cas8_relax». Подобные функции во время выполнения определяют наличие поддержки расширений LSE (Large System Extensions) и используют предоставляемые атомарные процессорные инструкции или откатываются на использование инструкций LL/SC (Load-link/store-conditional) для синхронизации.

  • Добавлена опция »-fbinutils-version» для выбора целевой версии набора binutils для обеспечения совместимости со старым поведением компоновщика и ассемблера.

  • Для исполняемых файлов ELF при указании флага »-gz» по умолчанию включено сжатие отладочной информации с использованием библиотеки zlib (gz=zlib). Для компоновки результирующих объектных файлов требуется lld или GNU binutils 2.26+. Для восстановления совместимости со старыми версиями binutils можно указать »-gz=zlib-gnu».

  • Указатель 'this' теперь обрабатывается с проверками nonnull и dereferenceable (N). Для удаления атрибута nonnull, при необходимости использования значений NULL, можно использовать опцию »-fdelete-null-pointer-checks».

  • На платформе Linux для архитектур AArch64 и PowerPC включён режим »-fasynchronous-unwind-tables» для генерации «раскрученных» (unwind) таблиц вызовов, как в GCC.

  • В »#pragma clang loop vectorize_width» добавлена возможность указания «fixed» (по умолчанию) и «scalable» для выбора метода векторизации. Режим «scalable», независимый от длины вектора, является экспериментальным и может использоваться на оборудовании с поддержкой масштабируемой векторизации.

  • Улучшена поддержка платформы Windows: Подготовлены официальные бинарные сборки для Windows на системах Arm64, включающие компилятор Clang, компоновщик LLD и runtime-библиотеки compiler-rt. При сборке для целевых платформ MinGW реализовано добавление суффикса .exe, даже при выполнении кросс-компиляции.

  • Расширены возможности, связанные с поддержкой OpenCL, OpenMP и CUDA. Добавлены опции »-cl-std=CL3.0» и »-cl-std=CL1.0» для выбора вариантов макросов для OpenCL 3.0 и OpenCL 1.0. Расширены средства диагностики.

  • Добавлена поддержка инструкций HRESET, UINTR и AVXVNNI, реализованных в некоторых процессорах на базе архитектуры x86.

  • На системах x86 включена поддержка опции »-mtune=‹cpu›», активирующей микроархитектурные оптимизации, независимо от значения »-march=‹cpu›».

  • В статическом анализаторе улучшена обработка некоторых POSIX-функций и значительно улучшено определение результата условных операций при наличии в сравнении нескольких символьных значений. Добавлены новые проверки: fuchia.HandleChecker (определяет дескрипторы в структурах), webkit.UncountedLambdaCapturesChecker webkit и alpha.webkit.UncountedLocalVarsChecker (учитывают особенности работы с указателями в коде движка WebKit).

  • Разрешено использование встроенных функций __builtin_bitreverse*, __builtin_rotateleft*, __builtin_rotateright*, _mm_popcnt*, _bit_scan_forward, __bsfd, __bsfq, __bit_scan_reverse, __bsrd, __bsrq, __bswap, __bswapd, __bswap64, __bswapq, _castf*, __rol* и __ror* в выражениях, используемых в контексте констант.

  • В утилиту clang-format добавлена опция BitFieldColonSpacing для выбора расстановки пробелов вокруг идентификаторов, столбцов и определений полей.
  • В кеширующем сервере clangd (Clang Server) на платформе Linux значительно сокращено потребление памяти при длительной работе (обеспечен периодический вызов malloc_trim для отдачи свободных страниц памяти операционной системе).




Основные новшества LLVM 12.0:

  • Прекращена поддержка написанного на языке Python сборочного инструментария llvm-build, вместо которого проект полностью перешёл на использование сборочной системы CMake.
  • В бэкенде для архитектуры AArch64 улучшена поддержка платформы Windows: обеспечена корректная генерация ассемблерного вывода для целевых систем Windows, оптимизирована генерация данных о «раскрутке» (unwind) вызовов (размер подобных данных сократился на 60%), добавлена возможность создания unwind-данных для Windows при помощи ассемблерных директив .seh_*.
  • В бэкенде для архитектуры PowerPC реализованы новые оптимизации циклов и inline-развёртывания, расширения поддержка процессоров Power10, добавлена поддержка инструкций MMA для манипуляций с матрацами, улучшена поддержка операционной системы AIX.

  • В бэкенде для архитектуры x86 добавлена поддержка процессоров AMD Zen 3, Intel Alder Lake и Intel Sapphire Rapids, а также процессорных инструкций HRESET, UINTR и AVXVNNI. Прекращена поддержка расширений MPX (Memory Protection Extensions) для проверки указателей на соблюдение границ областей памяти. Указанная технология не получила распространения и уже удалена из GCC и clang. В ассемблер добавлена поддержка префиксов {disp32} и {disp8} и суффиксов .d32 и .d8 для управления размером смещения операндов и переходов. Добавлен новый атрибут «tune-cpu» для управления включением микроархитектурных оптимизаций.

  • В детектор проблем при работе с целыми числами (integer sanitizer,»-fsanitize=integer») добавлен новый режим »-fsanitize=unsigned-shift-base» для выявления переполнений беззнаковых целых чисел после битового сдвига влево.

  • В различных детекторы (asan, cfi, lsan, msan, tsan, ubsan) добавлена поддержка Linux-дистрибутивов с стандартной библиотекой Musl.

  • Расширены возможности компоновщика LLD. Улучшена поддержка формата ELF, в том числе добавлены опции »--dependency-file»,»--error-handling-script»,»--lto-pseudo-probe-for-profiling»,»--no-lto-whole-program-visibility». Улучшена поддержка MinGW. Для формата Mach-O (macOS) реализована поддержка архитектур arm64, arm и i386, оптимизаций на этапе связывания (LTO) и раскрутки стека при обработке исключений.

  • В Libc++ реализованы новые возможности стандарта C++20 и началась разработка возможностей спецификации C++2b. Добавлена поддержка сборки с отключением поддержки локализации (»-DLIBCXX_ENABLE_LOCALIZATION=OFF») и устройств генерации псевдо-случайных чисел (»-DLIBCXX_ENABLE_RANDOM_DEVICE=OFF»).



Источник: http://www.opennet.ru/opennews/art.shtml? num=54977

© OpenNet