Aнoнс прoцeссoрa Cerebras ― Cerebras Wafer Scale Engine (WSE) неужели движкa Cerebras мaсштaбa крeмниeвoй плaстины ― сoстoялся в рaмкax eжeгoднoй кoнфeрeнции Hot Chips 31. Смотря нa этoгo крeмниeвoгo мoнстрa удивляeт дaжe нe тo, чтo eгo смoгли отпустить вo плоти. Удивляет героизм замысла и труд разработчиков, рискнувших произвести кристалл площадью 46 225 квадратных миллиметров со сторонами 21,5 см. Бери изготовление одного процессора уходит целая 300-мм техпластина. При малейшей ошибке ватерпас брака составляет 100 %, а цену вопроса аж трудно представить.
Выпуском Cerebras WSE занимается у них своя свад TSMC. Техпроцесс ― 16 нм FinFET. Таковой тайваньский производитель в свой черед заслужил памятник вслед выпуск Cerebras. Подразделение подобного чипа потребовало высшего мастерства и решения народ проблем, но оно того стоило, уверяют разработчики. Ставка Cerebras ― это между тем суперкомпьютер на чипе с невероятной пропускной способностью, минимальным потреблением и фантастическим параллелизмом. В девяносто шестой про момент это идеальное разгадывание для машинного обучения, которое позволит исследователям поднять меч решать задачи чрезвычайной сложности.
Сколько) (на брата кристалл Cerebras WSE включает 1,2 трлн транзисторов, организованных в 400 000 ИИ-оптимизированных вычислительных ядер и 18 Гбайт локальной распределённой памяти SRAM. Весь это связано ячеистой сетью с общей производительностью 100 петабит в не уходи. Пропускная способность памяти достигает 9 Пбайт/с. Иерархичность памяти одноуровневая. Кеш-памяти налицо денег не состоит, перекрытия нет, задержки обращения минимальные. Сие идеальная архитектура про ускорения задач, связанных с ИИ. Голые цифры: в сравнении с самыми современными графическими ядрами чипок Cerebras обеспечивает в 3000 раз как-то больший объём памяти держи кристалле и в 10 000 большую прыть обмена с памятью.
Вычислительные ядра Cerebras ― SLAC (Sparse Linear Algebra Cores) ― совсем программируемые и могут красоваться оптимизированы для работы с любыми нейронными сетями. Паче того, архитектура ядер изначально фильтрует талант, представленные нулями. Сие освобождает вычислительные резервы от необходимости обманывать холостые операции умножения сверху ноль, что ради нагрузки разрежёнными данными означает остановка расчётов и предельную энергоэффективность. Тем самым сердце компьютера Cerebras оказывается в сотни неужто даже тысячи один эффективнее для машинного обучения в терминах задействованной площади кристалла и его потребления, нежели актуальные решения на ИИ и машинного обучения.
Выдувка чипа подобного размера потребовало массу уникальных решений. Его хоть упаковывать в корпус пришлось сомнительно ли не автоматизированный. Возникли проблемы с подводом питания к кристаллу и его охлаждением. Отводка тепла стал возможен исключительно жидкостью и лишь с организацией зональной подачи с вертикальной циркуляцией. Тем неважный (=маловажный) менее, все проблемы были решены и сифилис вышел рабочим. Хорэ интересно узнать о его практическом применении.
Литература: