Unicode доминирует в web

За последние два года доля страниц, использующих только специальные кодировки, существенно уменьшилась в пользу универсального формата UTF-8 Unicode. Например, доля страниц, использующих только ASCII и Latin-1, теперь составляет менее 20% каждая. Следует отметить, что эти результаты применимы к веб-страницам, которые проиндексированы Google. Unicode позволяет использовать несколько шрифтов в одном документе, а так же поддерживает иероглифы, математические символы, символы азиатских языков. Формат UTF-8, отводит на кодирование одного символа от 1 до 4 байт, а 1-байтовые символы соответствуют аналогичным ASCII кодам.


©  Root.UA