Мощная система-на-чипе MediaTek Helio X20. Десять вычислительных ядер в трёх кластерах

Требования к современным смартфонам высокого уровня — флагманам линеек разных производителей, можно описать довольно просто. От подобных топовых моделей требуется не только применение системы-на-чипе (system-on-chip, SoC), обеспечивающей высочайшую производительность и продвинутые мультимедийные возможности, в том числе и поддержку камер высокого разрешения и качества, но и ёмкая батарея и высокая энергоэффективность, достаточные для того, чтобы смартфон мог проработать без подзарядки в активном режиме использования хотя бы один день.

image Смартфоны с такими свойствами являются флагманами многих компаний, среди них можно выделить таких ярких представителей, как Apple iPhone 6 Plus, Samsung Galaxy S6 Edge, LG G4 и другие. Но дальнейший рост ёмкости аккумуляторных батарей в смартфонах сдерживается даже при постоянном увеличении экранов топовых моделей. Несмотря на то, что оснащение дорогих смартфонов дисплеями всё большего размера является признанным рыночным трендом (средний размер экрана в топовых моделях в 2010–2011 годах был менее 4 дюймов, в 2012–2014 он вырос до 5 дюймов, а в 2015 составляет уже 5 дюймов и даже более), ёмкость батарей ограничивается в основном желанием производителей сделать смартфоны максимально тонкими.

46f6d535d02449adb0379afe81a1b671.jpg
Как видите на графике, размеры экранов и их энергопотребление растут, зато ёмкость батарей на протяжении вот уже нескольких лет почти не меняется, и это ограничение только усугубится в ближайшие годы, когда размеры дисплеев и их разрешение вырастут ещё больше. Соответственно, производители хотят переломить тренд с другой стороны, оснастив смартфоны более экономичными системами-на-чипе, которые обеспечат и высокую производительность и длительное время автономной работы.

Лидеры рынка постоянно стараются снижать (или хотя бы держать в рамках) общее энергопотребление смартфонов, применяя как более новые технологические процессы для производства систем-на-чипе, так и новые архитектурные решения. Некоторые из них давно известны, можно отметить и динамическое изменение частоты и рабочего напряжения ядер CPU, и применение наборов из вычислительных ядер разной мощности, вроде big.LITTLE, и некоторые другие методы.

Но на текущий момент из архитектуры big.LITTLE выжаты уже почти возможности, она достигла своего предела и не может помочь улучшить энергоэффективность ещё больше, как этого требуют реалии рынка. Производителям смартфонов нужны новые решения, которые обеспечат меньшее потребление энергии при большей вычислительной производительности в рамках возможностей нынешних полупроводниковых производств.

Компания MediaTek давно применяет подобные big.LITTLE решения в виде многоядерных SoC, состоящих из двух кластеров с вычислительными ядрами разной специализации: несколько CPU-ядер в их составе предназначены для требовательных задач, а остальные — для приложений с низкой вычислительной нагрузкой. Так, одной из нескольких подобных систем-на-чипе стала модель Helio X10, анонсированная компанией ещё в прошлом году.

На основе чипа Helio X10 вышло несколько моделей от известных производителей: HTC One M9+, HTC One E9+ и Meizu MX5, и это — только начало. В Helio X10 применяется два кластера с конфигурацией 4+4 процессорных ядра, но в дальнейшем компания MediaTek пошла дальше, выпустив первую в мире систему-на-чипе уже с тремя кластерами CPU-ядер, которую мы сейчас рассмотрим подробнее.

Архитектура Tri-cluster


Для своей следующей топовой системы-на-чипе компания MediaTek выбрала развитие процессорной архитектуры с несколькими кластерами. Напомним, подобное разделение позволяет использовать более подходящие CPU-ядра в задачах с различными требованиями к вычислительной производительности. Так, высокопроизводительные вычислительные ядра обеспечивают очень высокую производительность, но при высоком потреблении энергии, а менее производительные отличаются весьма низким потреблением энергии, но не могут обеспечить требовательные к скорости вычислений задачи.

Чаще всего в уже традиционном дизайне из двух кластеров в младшем из них применяются такие относительно простые архитектурно и весьма энергоэффективные ядра как Cortex-A53, а высокопроизводительный кластер составлен из больших CPU-ядер вроде Cortex-A57 или Cortex-A72. В некоторых случаях применяются также ядра Cortex-A53, но специально оптимизированные для достижения высокой рабочей частоты, по сравнению с кластером меньшего энергопотребления, как было сделано в предыдущих чипах MediaTek.

Недостаток такого подхода заключается в том, что средние по требовательности задачи будут исполняться или на «больших» ядрах или на «маленьких», но всегда недостаточно эффективно — первые всё равно будут потреблять много энергии даже на низких частотах, а вторые не всегда могут обеспечить требуемую производительность. Эта проблема наглядно иллюстрируется следующим графиком:

4cf9588e60d74c27926e6efaace29a0d.jpg

Теоретически, можно было бы поставить во второй кластер также «большие» ядра, просто работающие на меньшей тактовой частоте, но они займут слишком много места на чипе и такое решение также не будет достаточно эффективным. В случае же архитектуры big.LITTLE с двумя разными кластерами по мощности CPU-ядер получается так, что более мощные ядра будут работать на полной скорости тогда, когда было бы достаточно и средней производительности.

Соответственно, инженеры MediaTek ввели третий кластер, сделав промежуточную «передачу» в дополнение к двум крайним, если привести аналогию в виде автомобильных коробок передач. С точки зрения теории решение логичное, ведь чем больше передач в коробке, тем более подходящие передаточные числа можно подобрать для движущегося автомобиля, обеспечив тем самым меньший расход топлива. Получается, что каждый кластер из трёх имеющихся будет лучше подходить под свои задачи, улучшая ту самую энергоэффективность: лёгкие задачи (интерфейс, почта, музыка), средние задачи (приложения, соцсети, нетребовательные игры), тяжёлые задачи (3D-игры, тесты, мультимедийные приложения).

Остаётся вопрос управления, ведь задачи нужно правильно и быстро раздать разным ядрам. Для управления распределением задач между ядрами разных кластеров, в чипах компании MediaTek используется технология CorePilot — специальный планировщик задач. Судя по энергоэффективности предыдущих систем-на-чипе этой компании, даже в предыдущих версиях этот планировщик справлялся со своими задачами очень неплохо, а уж в новой версии 3.0 он должен обеспечивать ещё большую эффективность.

Helio X20 — первая система-на-чипе с трёхкластерным дизайном


Компания MediaTek анонсировала свою новую систему-на-чипе, предназначенную для топовых смартфонов и планшетов, ещё в мае текущего года. Новинка получила название Helio X20, продолжив линейку высокопроизводительных чипов Helio компании, которая появилась чуть раньше. Модель X20 стала второй системой-на-чипе в данной линейке, и первой, получившей такое новое имя изначально (Helio X10 раньше назывался просто как MT6795).

157e08837865b438a7807212b426f7c4.png


MediaTek выпустила новинку, имеющую аж 10 универсальных вычислительных ядер, которая стала первым подобным решением, имеющим трёхкластерный дизайн. Три раздела с CPU-ядрами состоят из четырёх вычислительных ядер Cortex-A53, работающих на частоте 1.4 ГГц и обеспечивающих самую лучшую энергоэффективность, ещё четырёх сбалансированных по энергоэффективности ядер Cortex-A53 с частотой 2.0 ГГц, и пары 2.5-гигагерцевых Cortex-A72 в высокопроизводительном кластере.

a1dba8d82b9651356c150f671a0bccbc.png

CPU-ядра из разных кластеров соединены между собой специальной шиной MediaTek Coherence System Interconnect (MCSI) и имеют доступ к памяти по 128-битной AXI Memory Bus. Шина MCSI очень важна для обеспечения работы столь сложной системы, от её возможностей зависит эффективность работы всего чипа. Компания ARM несколько месяцев назад анонсировала подобную шину CoreLink CCI-500, способную объединить до четырёх CPU-кластеров. Вероятно, в MediaTek взяли за основу эту шину, а может и разработали собственный интерфейс, если он способен обеспечить лучшие задержки при передаче данных.

Главное в архитектуре Helio X20 — новый средний кластер. Младший кластер с наименьшей производительностью продолжает использоваться в нетребовательных задачах с высокой продолжительностью, а высокопроизводительный — в самых жадных до скорости вычислений. Средний же предлагает ту самую золотую середину, обеспечивающую сравнительно высокую производительность вычислений при небольшом потреблении энергии, по сравнению с кластером из пары больших Cortex-A72 ядер. И таких «средних» задач довольно много:

088d6be4b7e087bc6270c9dd49f8dc65.png

Ну, а самый главный вопрос — какой прирост энергоэффективности и продолжительности автономной работы даёт подобное решение? Как выясняется, разница между big.LITTLE и Tri-cluster по эффективности именно из-за появления дополнительного среднего кластера довольно приличная — новинка от MediaTek обеспечивает меньшее потребление энергии практически во всех возможных задачах:

c131395ceae6e32ce8fec07a5e6a3838.png


Больше всего экономии наблюдается в режиме простоя при банальной отрисовке главного экрана, при типичной работе с электронной почтой, голосовом общении и чтении ленты Facebook — около 40–50% преимущества в потреблении энергии, по сравнению с двухкластерной системой-на-чипе при прочих равных условиях.

Но даже в более требовательных к питанию задачах, вроде начального запуска приложения Facebook и других тяжелых задачах, в не слишком требовательных играх и в процессе видеозаписи, налицо некоторое преимущество от добавления третьего «среднего» кластера CPU-ядер, составляющее порядка 20–30%. Как раз примерно на столько же меньше энергии потребляет трёхкластерный Helio X20 и в среднем.

Для ещё большей экономии энергии, новая система-на-чипе от MediaTek содержит специальное ядро-компаньон Cortex-M4, работающее на тактовой частоте в 364 МГц, имеющее SRAM-память объёмом в 512 КБ и прямой доступ к DRAM, и при этом обладающее крайне низким потреблением энергии, так как ядро получает питание по отдельной линии очень низкого напряжения.

Это специализированное ядро ARM-архитектуры обслуживает задачи декодирования аудиоданных (в частности, в формате MP3), улучшении качества речи и её распознавания, а также работает в режиме микроконтроллера сенсорного экрана, что снимает эту нагрузку с основных CPU-ядер. То есть, при выключенном экране и проигрывании музыки в системе-на-чипе Helio X20 будет работать исключительно это вспомогательное ядро, что лишь улучшает его общую энергоэффективность.

Технические характеристики Helio X20


Система-на-чипе Helio X20 имеет внутреннее кодовое наименование MediaTek MT6797 (Helio X10 — MT6795), и в отличие от Helio X10, производимой на фабриках компании TSMC при помощи технологического процесса 28 нм HPM, производство новинки производится уже по 20 нм техпроцессу, что должно обеспечить дополнительное снижение энергопотребления. Рассмотрим спецификации системы-на-чипе Helio X20, сравнив её с предыдущей моделью:

55c89200168abaf0862afb4e58e329f9.png

Самое главное отличие между парой SoC в том, что более новый чип имеет три кластера, состоящих из десяти различных CPU-ядер, а предыдущая модель системы-на-чипе довольствуется восемью менее мощными ядрами Cortex-A53, работающими на частоте лишь до 2 ГГц.
Соответственно и производительность CPU-ядер отличается в разы, особенно в тех задачах, где используется один поток. Так, в известном тестовом пакете GeekBench 3 в однопоточном режиме (Single Thread) новый Helio X20 показал скорость вычислений на 70% выше, чем X10, а в многопоточном (Multi Thread) — на 15% выше. Да и общая производительность системы в бенчмарке Antutu между двумя системами-на-чипе MediaTek выросла на 40% — отличный результат для новинки.

Helio X20 поддерживает двухканальную начиповую (package on package — PoP) LPDDR3-память, работающую на частоте 933 МГц — против 800 МГц у X10. Вероятно, для чипа, ограниченного поддержкой разрешений экрана до 2560×1600 пикселей, пропускной способности пары каналов LPDDR3-памяти будет вполне достаточно.

Обработкой изображения с модулей камер занимается двойной сигнальный процессор ISP, обеспечивающий обсчёт 32-мегапиксельных изображений с частотой 24 FPS и 25-мегапиксельных при 30 кадрах в секунду (у X10 — до 21 мегапикселей при 30 FPS). Возможно подключение одной 32-мегапиксельной камеры или пары 13-мегапиксельных. Поддерживаются запись 4K-видео в HDR и продвинутые методы аппаратной постобработки: denoise/demosaic/sharpness.

Новая система-на-чипе обеспечивает декодирование видео в разрешении 4K в форматах H.264, H.265 и VP9 при 30 кадрах в секунду, поддерживается декодирование данных с 10-бит на цвет. Кодирование видео возможно в 4K-разрешении и частоте кадров 30 FPS в формате H.265 в том числе в HDR. Возможности по работе с видеоданными мало изменились по сравнению с Helio X10, зато обеспечивается снижение потребления энергии на 30% и 40% для декодирования и кодирования, соответственно.

В системе-на-чипе Helio X20 применяется новое графическое ядро (GPU) модели Mali-T880 MP4 от компании ARM, работающее на частоте в 700 МГц. Оно обеспечивает на 40% большую 3D-производительность при таком же снижении потребления энергии, по сравнению с ядром PowerVR G6200 от Imagination Technologies, применяемом в Helio X10 и работающим на той же частоте.

Helio X20 является первой системой-на-чипе, в которой применяется видеоядро серии Mali T800, и этот GPU имеет достаточно высокую производительность для решений компании, которые ранее не отличались применением сверхмощных GPU. В популярном 3D-бенчмарке GFXBench 3.0 в тесте 1080p T-Rex Offscreen новое решение показывает прирост производительности в 30% по сравнению с PowerVR G6200, а в 1080p Manhattan Offscreen улучшение и вовсе достигает 45%.

Информация может выводиться на дисплей разрешением WQXGA (2560×1600) при частоте кадров 60 FPS или в FullHD (1920×1080) при 120 FPS. Вариант с большей частотой обновления информации на экране при соответствующей аппаратной поддержке со стороны дисплея обеспечивает большую чёткость изображения в условиях быстрого изменения картинки на экране, например, в играх и при прокручивании текста в браузере.

2ddbf469b5ec55ec91c30ebda835b791.jpg


Несколько лет назад одним из явных недостатков систем-на-чипе компании MediaTek была недостаточно широкая поддержка стандартов мобильных сетей связи. Но инженеры компании постоянно навёрстывают отставание от лидеров индустрии, выпуская всё более продвинутые модемы, в том числе встроенные.

Интегрированный в Helio X20 модем является примером такого подхода и обеспечивает работу мобильных сетей по всему миру. В этой системе-на-чипе наконец-то появилась поддержка стандарта CDMA2000, важного для завоевания североамериканского рынка смартфонов и планшетов — до сих пор на этом рынке пока что царствует компания Qualcomm, лидирующая по поддержке технологий мобильных сетей.

Модемная часть в составе системы-на-чипе X20 поддерживает также и сети LTE R11 категории 6 с поддержкой агрегации несущих 2×20 МГц, и обеспечивает скорость до 300 мегабит/с на приём и 50 мегабит/с на передачу данных. Важно, что новый модем потребляет на 30% энергии меньше, чем применяемый в составе Helio X10. У лучших решений конкурентов есть встроенный модем LTE Категории 7 и внешний чип LTE Категории 10, но они обойдутся явно дороже решения MediaTek.

Из беспроводных сетей новым чипом поддерживаются стандарты Wi-Fi 802.11ac с передачей данных на скорости до 280 мегабит/с, с поддержкой систем позиционирования GPS, ГЛОНАСС и Beidou. Причём вся эта поддержка встроена в систему-на-чипе, в отличие от применения внешнего чипа MT6630 в составе Helio X10, который обходится дороже.

Богатые мультимедийные возможности


Кроме того, что Helio X20 обеспечивает заметно лучшие производительность и энергоэффективность, а также некоторые новые возможности, система-на-чипе отличается улучшенными программно-аппаратными технологиями по работе с мультимедийными данными. Мы уже упоминали о сдвоенном блоке обработки сигналов с камеры ISP, который может обеспечивать работу одной камеры с разрешением в 32 мегапикселя при частоте кадров 24 FPS, или пары 13-мегапиксельных камер при 30 FPS.

Также в новом SoC сделаны модификации, направленные на ускоренный отклик и улучшение качества автофокусировки. Теперь задержка между двумя кадрами при съёмке составляет менее чем 0.2 секунды, поддерживается несколько режимов автофокусировки: постоянная, лазерная и контрастная. Для получения изображений лучшего качества есть возможность применения постобработки при помощи новых аппаратных блоков: система шумопонижения, алгоритм de-mosaic и увеличение резкости в реальном времени.

Из других технологий продвинутой обработки изображений отметим: аппаратную поддержку конфигураций из пары камер для создания стереоизображения, поддержку ZigZag HDR для записи HDR-видео в 4K-разрешении, сложный алгоритм шумопонижения для видеоданных на основе информации из нескольких кадров, аппаратный движок для определения лиц (face detection) и т.д.

2e10ed3b6cfb9b9933b7ad9ffb3876c1.jpg

Одним из примеров аппаратной постобработки является имитация глубины резкости (depth of field) в реальном времени, аналогично изображению зеркальных фотоаппаратов с большими матрицами. Этот эффект давно стал достаточно распространённым в мобильных устройствах, но он всегда делался при помощи программной постобработки, а новая система-на-чипе Helio X20 является первым мобильным решением с предпросмотром эффекта имитации глубины резкости в реальном времени.

Пожалуй, одним из самых важных факторов при видеосъёмке является качественная стабилизация. В случае смартфонов, чаще всего лишённых аппаратных средств стабилизации в виде штативов и стедикамов, таковым методом становится программная стабилизация изображения, устраняющая артефакты движения в кадре. В системе-на-чипе Helio X20 для улучшения видеоданных используются продвинутые технологии стабилизации изображения, использующие данные с гироскопов для обеспечения лучшего результата.

Конкурентоспособность решения верхнего ценового сегмента


Подведём итоги. В Helio X20 применяется инновационный дизайн из трёх кластеров с десятью 64-битными CPU-ядрами различного назначения, два самых мощных из которых способны работать на частоте до 2.5 ГГц, есть новое графическое ядро от ARM — на 40% более производительное, по сравнению с GPU в составе Helio X10, интегрированный в систему-на-чипе сотовый модем третьего поколения с поддержкой сетей LTE категории 6 и CDMA2000, позволяющий работать в мобильных сетях во всём мире, богатые мультимедийные возможности: поддержка 120 Гц дисплеев и многомегапиксельных камер с продвинутой постобработкой в реальном времени и многое другое.

Всё это делает Helio X20 отличным конкурентом даже для решений такого гранда индустрии, как компания Qualcomm. Сравнивать различные системы-на-чипе непросто, но Helio X20 по многим характеристикам явно лучше, чем Snapdragon 620 (MSM8976). Чип MediaTek производится по 20 нм техпроцессу на TSMC, поэтому при прочих равных имеет меньшее энергопотребление при более высокой производительности в распространенных задачах, а производительность графического ядра в новинке MediaTek также должна быть выше, чем у Snapdragon 620. Плюс к этому, X20 дает некоторые возможности, которых нет у Snapdragon, в том числе поддержку 120 МГц дисплеев, аппаратное декодирование 10-битных видеоданных, 32-мегапиксельные камеры и т.п.

Единственное, что сложно оценить — разницу в производительности для столь разных конфигураций CPU. У Helio X20 самих по себе процессорных ядер больше, зато у Snapgradon 620 более мощных A72 четыре штуки против пары у чипа MediaTek, хотя и работающих на более высокой частоте. Вообще, частота CPU-ядер старшего кластера в 2.5 ГГц весьма впечатляет, ведь она достигнута при помощи 20 нм техпроцесса от TSMC, при том, что компания ARM такие частоты для Cortex-A72 планировала лишь с учётом 14/16 нм FinFET техпроцессов.

Исходя из условий, на практике быстрее может быть как система-на-чипе MediaTek, так и Qualcomm, всё будет зависеть от типа нагрузки. Но решение MediaTek точно должно быть экономичнее. На данный момент, результаты нового SoC компании отлично выглядят в таких распространённых бенчмарках, как GeekBench 3 и Antutu, заметно опережая распространённые системы-на-чипе Snapdragon 810 и Exynos 7420 в них по скорости.

9ebb8be06da48bce720993a7b95cdaa2.png

177b788516a5f2713585f58bfd2d7c93.png

e73cca10304aa1c789d3a0db7509da4e.png

Да и с потреблением питания у новой системы-на-чипе компании MediaTek всё в порядке — при активной работе модемной части она потребляет в среднем на 30% меньше энергии, чем Helio X10, и примерно на 40% меньше энергии в мультимедийных задачах. Если использовать более подробные сравнения, то в «режиме полёта» X20 потребляет на 18% меньше энергии, при отрисовке «рабочего стола» — на 24%, при проигрывании MP3 на 55%, в процессе видеозаписи в формате H.265 в 4K-разрешении при 30 FPS — на 37%, при проигрывании видеоролика в формате H.265 (также 4K при 30 FPS) — на 28%, в несложных играх экономия составляет до 40%, а при передаче данных по мобильной LTE сети — 30–40%.

Даже по сравнению с гораздо менее производительным решением MT6755, которое располагается в линейке компании на ступень ниже, новая система-на-чипе Helio X20 потребляет в среднем на 6–9% меньше энергии при прочих равных условиях: отрисовка рабочего стола — на 4% меньше, проигрывание MP3-файла — на 26% меньше, при видеозаписи и проигрывании видеоданных в формате H.264 потребление нового SoC на 5–6% меньше, а в играх и при передаче данных — на 5–10%.

На сегодняшний день, по совокупности технических характеристик и параметров система-на-чипе Helio X20 выглядит лучше многих сильных конкурентов в своей нише, включая такие известные модели мобильных систем-на-чипе, как Snapdragon 620 и 810. Как минимум «на бумаге» Helio X20 выглядит весьма впечатляюще, и будет интересно посмотреть, как трёхкластерный дизайн будет работать на практике.

Остаётся прояснить последний момент — время, когда смартфоны на основе системы-на-чипе Helio X20 должны появиться на рынке. Ожидается, что первые сэмплы SoC появятся к концу текущего года, а готовые продукты на основе этого чипа поступят в продажу в первом квартале следующего года — к этому времени производители смартфонов планируют закончить все стадии подготовки промышленного производства.
То, что новая топовая система-на-чипе у MediaTek получилась удачной, показывает и интерес нескольких известных производителей смартфонов, которые собираются использовать десятиядерный процессор Helio X20 в своих будущих устройствах. Вероятно, в их составе будут компании HTC, Meizu, Lenovo, Sony, LG, Xiaomi и другие.

Спасибо за внимание!

© Geektimes