libunicode 0.8.0

17 февраля состоялся выпуск 0.8.0 библиотеки для языка C++ (стандарт C++20) libunicode. Проект разрабатывается командой разработчиков эмулятора терминала Contour и распространяется по лицензии Apache 2.0.
Возможности библиотеки:
поддержка стандартов Unicode 17.0:
- API для получения свойств Юникод;
- SIMD-оптимизация некоторых функций (с использованием
std::simdилиstd::experimental::simdпри их наличии); - оптимизированное конвертирование UTF8 <-> UTF32;
- эквивалент функции
wcwidth(int unicode::width(char32_t)); - сегментирование текста по графемам, символам, эмодзи и письменностям;
- преобразование регистра и сравнение строк;
- высокоуровневый API сегментирования текста, подходящий для реализации шейпинга текста.
- покрытие тестами большинства возможностей библиотеки (ширина символа и сегментирование).
В комплект поставки также входит консольная утилита unicode-query для получения подробной информации о строках.
Список изменений:
- добавлены функции:
char32_t simple_uppercase(char32_t codepoint)
char32_t simple_lowercase(char32_t codepoint)
char32_t simple_titlecase(char32_t codepoint)
char32_t simple_casefold(char32_t codepoint)
case_mapping_result full_uppercase(char32_t codepoint)
case_mapping_result full_lowercase(char32_t codepoint)
case_mapping_result full_titlecase(char32_t codepoint)
case_mapping_result full_casefold(char32_t codepoint)
std::u32string to_uppercase(std::u32string_view text)
std::u32string to_lowercase(std::u32string_view text)
std::u32string to_titlecase(std::u32string_view text)
std::u32string casefold(std::u32string_view text)
std::string to_uppercase(std::string_view text)
std::string to_lowercase(std::string_view text)
std::string to_titlecase(std::string_view text)
std::string casefold(std::string_view text)
int casefold_compare(std::u32string_view a, std::u32string_view b)
int casefold_compare(std::string_view a, std::string_view b)
bool casefold_equals(std::u32string_view a, std::u32string_view b)
bool casefold_equals(std::string_view a, std::string_view b)
bool is_cased(char32_t codepoint)
bool is_case_ignorable(char32_t codepoint)
bool changes_when_uppercased(char32_t codepoint)
bool changes_when_lowercased(char32_t codepoint)
bool changes_when_titlecased(char32_t codepoint)
bool changes_when_casefolded(char32_t codepoint)
- добавлена поддержка Emscripten;
- некоторым функциям тестирования добавлен префикс
is_.
>>> Подробности на GitHub
