Нaряду с нoвым прoцeссoрным ядрoм Cortex-A77 кoмпaния ARM прeдстaвилa грaфичeский прoцeссoр, прeднaзнaчeнный с целью мoбильныx oднoкристaльныx систeм слeдующeгo пoкoлeния. Mali-G77, кoтoрый нe слeдуeт путaть с нoвым прoцeссoрoм дисплeя Mali-D77, знaмeнуeт сoбoй пeрexoд с aрxитeктуры ARM Bifrost и нa Valhall.
ARM дeклaрируeт сущeствeнный понижение графической производительности Mali-G77 — в 40 % по сравнению с современным поколением Mali-G76. Сие достигнуто как вслед за счёт техпроцесса, где-то и архитектурных улучшений. Mali-G77 может заключать от 7 до 16 ядер (в перспективе знать масштабирование от 1 поперед 32), причём каждое изо них почти такого но размера, как у G76. Усматривается, высокопроизводительные смартфоны, знать, будут оснащаться тем но количеством ядер ГП.
В играх впору ожидать повышения быстродействия на уровне ото 20 до 40 %, в зависимости через типа графических нагрузок. Клеймящий по результатам популярного теста Manhattan GFXBench, существенное важность нового графического процессора по-над текущим поколением заставит озаботиться и конкурирующую компанию Qualcomm о значительном улучшении производительности графики Adreno.
Сообразно словам ARM, сама числом себе новая искусство Mali-G77 обеспечивает в среднем 30-процентное бонификация энергоэффективности или производительности. На втором месте поколение скалярной архитектуры ARM Valhall позволяет графическому процессору сразу исполнять 16 команд ради цикл на CU в области сравнению с восемью в Bifrost (Mali-G76). Посредь других новшеств: тотально аппаратно управляемое динамическое распланирование команд и совершенно небывалый набор команд с сохранением обратной совместимости с Bifrost. Добавлена и поддержка формата сжатия ARM AFBC1.3 и кое-кто новшества (FP16 render targets, layered rendering и vertex shader outputs).
В Bifrost CU содержали 3 отметка исполнения команд, отдельный из которых включал кеш инструкций, медиум и блок управления Warp. Сделка по этим трём движкам позволяло исполнять 24 инструкции FMA с 32-битной точностью расчётов с плавающей запятой (FP32). В Valhall с головы CU обладает лишь одним движком исполнения команд, разделённым в кругу двумя вычислительными модулями, способными приготовлять по 16 команд Warp следовать такт, то пожирать обеспечивается общая пропускная жилка в 32 инструкции FMA FP32 получай CU. Благодаря этим архитектурным изменениям, подле параллельных расчётах Mali-G77 может исполнять на треть свыше математических расчётов согласно сравнению с Mali-G76.
И без этого (того) того, каждый с этих вычислительных модулей CU заключает два новых математических функциональных блока. Новейший модуль преобразования (CVT) обрабатывает основные целочисленные, логические, ветвящиеся и инструкции преобразования. Блочок специальных функций (SFU) ускоряет операции умножения аж чисел, деления, квадратного корня, логарифмов и других сложных целочисленных функций.
В стандартном блоке FMA уминать несколько настроек, поддерживающих действие 16 инструкций FP32 из-за цикл, 32 — FP16 иначе говоря 64 — INT8 Dot Product. Сии оптимизации могут защитить повышение производительности в приложениях машинного обучения в значение до 60 %.
Другое ключевое реформа в Mali-G77 — сие удвоение производительности текстурного модуля, кой теперь обрабатывает 4 билинейных текселя по (по грибы) такт по сравнению с двумя прежде, 2 трилинейных текселя вслед за такт, обеспечивая паче быструю фильтрацию FP16 и FP32.
ARM внесла и лавка других изменений, в результате что Mali-G77 и Valhall обещают значительное увеличение производительности для игровых нагрузок и задач машинного обучения. Имеет принципиальное значение отметить, что энергопотребление и плац чипа сохранены держи уровне Bifrost, будто обещает выпуск мобильных устройств с больше высокой пиковой производительностью не принимая во внимание повышения требований к электропотреблению, теплоотводу и размеру.
Литература: