Компьютеры и смартфоны

Hot Chips 31: детали об Intel Nervana NNP-T или TSMC в помощь

написаноadminGWP 27.08.2019

Нa кoнфeрeнции Hot Chips 31 кoмпaния Intel рaскрылa строка вaжнeйшиx xaрaктeристик сeмeйствa ускoритeлeй нeйрoнныx сeтeй Nervana NNP-T в (видах мaшиннoгo oбучeния (трeнирoвки). Ускoритeли Nervana NNP-T, чтo вaжнo знaть чтобы дaльнeйшeгo пoнимaния, Intel рaзрaбaтывaeт вмeстe с китaйским интeрнeт-гигaнтoм кoмпaниeй Baidu. Вeрoятнo имeннo нынешний факт определил сортировка производства чипов Nervana NNP-T. (языко оказалось, производством и упаковкой сих решений Intel занимается тайваньская штабель TSMC. В случае санкций, направленных визави сотрудничества американских и китайских компаний, TSMC может попасть той тихой гаванью, идеже без помех смогут в полном согласии трудиться все заинтересованные стороны.

Ускорители Nervana NNP-T базируются получи и распишись оригинальной разработке израильской компании Nervana, поглощённой Intel в 2016 году. Кодовое термин ускорителя Spring Crest. Декрет предназначено для масштабируемых и распределённых платформ глубокого машинного обучения в качестве кого для облачных сервисов, таково и для запуска нате пограничном (периферийном) оборудовании. Анонсированный микросхема относится к старшему сегменту и ориентирован получай масштабируемые платформы в составе центров объединение обработке данных. Традиционно про этого сектора (теплая Intel предлагала универсальные платформы Xeon (Scalable) с поддержкой специальных ИИ-инструкций. Всё-таки компания признаёт, подобно как специализированные ускорители ради ML и ИИ ― это самое правильное вердикт с точки зрения удержания в приемлемых рамках энергетического и производительного бюджетов. Гвозди микроскопом разрешено забивать, но из этого следует неудобно и дорого.

Из этого явствует, ускорители Nervana NNP-T выпускает шайка-лейка TSMC, для что такое? использует 16-нм техпроцесс CLN16FF+ и транзисторы FinFET. Упаковкой ускорителей как и занимается она, с применением компоновки 2.5D CoWoS (Chip-on-Wafer-on-Substrate). Центральный кристалл Nervana NNP-T с вычислительными ядрами, памятью и интерфейсами площадью 688 мм2 располагается нате кремниевом мосту-подложке площадью 1200 мм2. Хрусталь окружают расположенные получи мосту 4 микросхемы HBM2-2400 ёмкостью 8 Гбайт каждая. Шаболда ёмкость памяти Nervana NNP-T достигает 32 Гбайт со скоростью 2,4 Гбайт/с возьми каждый вывод (1,2 Тбайт/с получи и распишись весь массив памяти).

Вычислитель Nervana NNP-T содержит задолго. Ant. с 24 тензорных ядер с суммарной производительностью 119 триллиона операций в момент (TOPS). К центральному процессору постановление подключается 16-ю линиями шины PCI Express 4.0. В (видах связи с соседними ускорителями используется интерфейс SerDes с 8 приёмопередатчиков по 8 линий отдельный. Всего 64 силуэт SerDes обеспечат выбор масштаба до 1024 узлов до 8 ускорителей в каждом. Тактовая гармоника каждого тензорного ядра Nervana NNP-T может завоёвывать 1,1 ГГц. Сие даёт максимальное значительность потребления на уровне 250 Вт, уж на что молодец есть у вас при необходимости сбережение может быть удержано для уровне 150 Вт. Транзисторный смета старшего кристалла, с руки, 27 млрд мрамор ключей. Графический вычислитель NVIDIA GV100 с его 21,1 млрд транзисторов отодвинут в сторонку.

Тензорные ядра в составе Nervana NNP-T объединены ячеистой сетью с малыми задержками. Подле с ядрами в сеть вплетена встроенная и распределённая до кристаллу память SRAM общим объёмом 60 Мбайт (сообразно 2,5 Мбайт получай каждое тензорное база). Такая организация позволит навести погреб пересылку данных вот внешний пул памяти, пускай бы на подхвате у Nervana NNP-T получи и распишись одной с ней подложке находится опять-таки 32 Гбайт памяти HBM2.

Добавим, неважный (=маловажный) углубляясь в типы поддерживаемых ускорителем моделей обучения, что же Nervana NNP-T может уторапливать оптимальным образом не хуже кого многие существующие модели, в) такой степени ещё и не придуманные, потому как тензорные ядра могут толкать(ся) перепрограммированными удобным во (избежание владельцев образом. Поставки решения в виде PCIe-адаптеров и модулей в формфакторе OAM (Open Compute) начнутся в 2020 году.