Cerebras дебютируют с большим чипом для ускорения процессов искусственного интеллекта

Cerebras дебютируют с большим чипом для ускорения процессов искусственного интеллекта

Источник · Перевод автора

В понедельник разработчик стартап-чипов Cerebras объявил о прорыве в разработке высокоскоростных процессоров, который ускорит развитие технологий искусственного интеллекта.

Cerebras представили самый большой из когда-либо созданных компьютерных чипов. Новый чип, получивший название «Wafer-Scale Engine» (WSE) – произносится как «мудрый», – это сердцебиение машины глубокого обучения компании, созданной для питания систем искусственного интеллекта.

WSE обращает вспять тенденцию индустрии микросхем, заключающуюся в упаковке большей вычислительной мощности в чипы меньшего размера. Его массивный размер составляет восемь с половиной дюймов с каждой стороны. Для сравнения, большинство фишек умещается на кончике пальца и не превышает сантиметра с каждой стороны.

Поверхность нового чипа содержит 400 000 маленьких компьютеров, известных как «ядра», с 1,2 триллионами транзисторов. Самый большой графический процессор (GPU) составляет 815 мм2 и имеет 21,1 миллиарда транзисторов.

Чип уже используется некоторыми клиентами, и компания принимает заказы, сказал представитель Cerebras в комментариях, предоставленных TechNewsWorld представителем компании Кимом Зиземером (Kim Ziesemer).

«Размер чипа очень важен для ИИ, так как большие чипы обрабатывают информацию быстрее, вырабатывая ответы за меньшее время», – отметил представитель. На разработку новой технологии чипа у Cerebras ушло три года.

Лучше тренировать ИИ

Сокращение времени нейронных сетей для изучения или обучения позволяет исследователям проверять больше идей, использовать больше данных и решать новые проблемы. Google, Facebook, OpenAI, Tencent, Baidu и многие другие утверждают, что фундаментальное ограничение современного ИИ состоит в том, что обучение моделей занимает слишком много времени, пояснил представитель Cerebras, отметив, что «сокращение времени обучения, таким образом, устраняет серьезное препятствие для общеотраслевого прогресса».

Ускорение обучения с использованием технологии WSE позволяет исследователям обучать тысячи моделей за то время, которое раньше требовалось для обучения одной модели. Кроме того, WSE позволяет новые и разные модели.

Эти преимущества являются результатом очень большой вселенной обучаемых алгоритмов. Подмножество, которое работает на графических процессорах, очень мало. WSE позволяет исследовать новые и разные алгоритмы.

По словам представителя Cerebras, обучение существующих моделей за короткий промежуток времени и обучение новых моделей выполнению ранее невозможных задач кардинально изменит этап вывода искусственного интеллекта.

Понимание терминологии

Чтобы представить ожидаемые прогрессивные результаты в перспективе, важно понять три понятия о нейронных сетях:

  • Тренировка – это обучение;
  • Логический вывод – это применение обучения к задачам; а также
  • Логический вывод использует обучение для классификации.

Например, сначала вы должны научить алгоритм, как выглядят животные. Это тренировка. Тогда вы можете показать ему картинку, и она сможет распознать гиену. Это вывод.

Обеспечение значительно более быстрого обучения и новых и улучшенных моделей навсегда меняет вывод. Исследователи смогут упаковать больше выводов в меньшие вычисления и дать возможность более энергоэффективным вычислениям делать исключительные выводы.

Этот процесс особенно важен, так как большинство выводов делается на машинах, которые используют батареи или которые каким-либо другим образом ограничены по мощности. Таким образом, более качественное обучение и новые модели позволяют получать более эффективные выводы с телефонов, GoPros, часов, камер, автомобилей, камер видеонаблюдения / CCTV, сельскохозяйственного оборудования, производственного оборудования, персональных цифровых помощников, слуховых аппаратов, водоочистителей и тысяч других устройств по словам Cerebras.

Cerebras Wafer Scale Engine несомненно, является огромным подвигом для развития технологий искусственного интеллекта, отметил Крис Янн (Chris Jann), генеральный директор Medicus IT.

«Это сильный показатель того, что мы привержены развитию искусственного интеллекта, и поэтому присутствие ИИ в нашей жизни будет увеличиваться», – сказал он TechNewsWorld. «Я ожидаю, что эта отрасль будет продолжать расти в геометрической прогрессии, так как каждая новая разработка ИИ продолжает увеличивать свой спрос».

Размер WSE имеет значение

Чип Cerebras в 57 раз больше ведущего чипа от Nvidia, «V100», который доминирует в современном ИИ. Новый чип имеет больше схем памяти, чем любой другой чип: 18 гигабайт, что в 3000 раз больше, чем у Nvidia, согласно Cerebras.

Компании по производству микросхем давно искали прорыв в создании одной микросхемы размером с кремниевую пластину. Cerebras, по-видимому, первыми добились успеха с коммерчески жизнеспособным продуктом.

Cerebras получил около 200 миллионов долларов США от известных венчурных капиталистов, чтобы посеять это достижение.

Новый чип подстегнет переосмысление искусственного интеллекта, предположил генеральный директор Cerebras Эндрю Фельдман (Andrew Feldman). Он обеспечивает скорость параллельной обработки, которая понадобится Google и другим пользователям для создания нейронных сетей беспрецедентного размера.

Трудно сказать, какое влияние окажет такая компания, как Cerebras или ее чипы, на долгосрочную перспективу, считает Чарльз Кинг (Charles King), главный аналитик Pund-IT.

«Это отчасти потому, что их технология принципиально новая – это означает, что им нужно найти готовых партнеров и разработчиков, не говоря уже о покупателях, чтобы подписаться на поездку», – сказал он TechNewsWorld.

Быстрое расширение ИИ

Тем не менее, по словам Лиана Джи Су (Lian Jye Su), главного аналитика ABI Research, рынок облачных ИИ-чипсетов быстро расширяется, и в отрасли наблюдается появление широкого спектра вариантов использования, основанных на различных моделях ИИ.

«Чтобы учесть разнообразие вариантов использования, многим разработчикам и конечным пользователям необходимо определить собственный баланс стоимости инфраструктуры, бюджета мощности, гибкости и масштабируемости чипсета, а также экосистемы разработчика», – сказал он TechNewsWorld.

Во многих случаях разработчики и конечные пользователи применяют гибридный подход при определении правильного набора наборов микросхем для облачного искусственного интеллекта. Су отметил, что Cerebras WSE имеет все возможности для обслуживания этого сегмента.

Что предлагает WSE

Новая технология Cerebras решает две основные проблемы в задачах глубокого обучения: вычислительная мощность и передача данных. Его большой размер кремния обеспечивает больше памяти и процессорных ядер, в то время как запатентованная структура передачи данных ускоряет передачу данных, пояснил Су.

С помощью WSE Cerebras Systems может сосредоточиться на создании экосистемы с помощью своего программного стека Cerebras и стать ключевым игроком в индустрии чипсетов для искусственного интеллекта, отметил Су.

Процесс ИИ включает в себя следующее:

  • встроенные программные средства Cerebras для проектирования; а также
  • создание избыточных цепей для обхода дефектов в кремниевом производстве с целью обеспечения 400 000 рабочих оптимизированных ядер, как миниатюрный Интернет, который продолжает работать при выходе из строя отдельных серверных компьютеров;
  • перемещение данных новыми способами для лучшего обучения нейронной сети, которая требует, чтобы тысячи операций выполнялись параллельно в каждый момент времени.

Проблема, которую решает более крупная микросхема WSE, заключается в том, что компьютеры с несколькими микросхемами замедляются при передаче данных между микросхемами по более медленным проводам, соединяющим их на печатной плате.

Пластины были изготовлены в партнерстве с Taiwan Semiconductor Manufacturing, крупнейшим в мире производителем микросхем, но Cerebras обладает исключительными правами на интеллектуальную собственность, которая делает этот процесс возможным.

Доступно сейчас, но …

Cerebras не будет продавать чип самостоятельно. Вместо этого компания будет упаковывать его как часть компьютерного устройства, разработанного Cerebras.

Сложная система водяного охлаждения – ирригационная сеть – необходима для противодействия экстремальной жаре, которую генерирует новая микросхема, работающая при мощности 15 киловатт.

По словам Фельдмана, компьютер Cerebras будет в 150 раз мощнее, чем сервер с несколькими чипами Nvidia, при меньшем потреблении энергии и части физического пространства, необходимого для серверной стойки. Это сделает задачи нейронного обучения, которые стоят десятки тысяч долларов, чтобы работать в облачных вычислительных средствах на порядок дешевле.