NVIDIA представила новое поколение ИИ-ускорителей на базе архитектуры Turing

22.09.2018 NVIDIA представила новое поколение ИИ-ускорителей на базе архитектуры Turing

В рамках ежегодной международной конференции GTC 2018, проходящей в эти дни в Японии, компания NVIDIA анонсировала выпуск нового поколения ИИ-ускорителей на базе архитектуры Turing, которые получили название Tesla T4. Ускорители, в отличие от устройств прошлого поколения, выполнены в низкопрофильном дизайне. Для обеспечения работы устройств не требуется внешний источник питания, а энергопотребление не превышает 75 Вт, при этом обеспечивая многократный прирост в ключевых областях машинного обучения.

NVIDIA помимо презентации на конференции GTC 2018 в Японии новых ИИ-ускорителей, игровых ускорителей GeForce RTX и профессиональной графики Quadro RTX, представила новое семейство GPU, которое предназначен для анализа информации в центрах обработки данных, а также машинного обучения. Tesla T4 («T» в названии означает новую архитектуру Turing) – новые решения, которые стали обновлением текущего семейства GPU P4, активно используемого абсолютным большинством поставщиков облачных вычислений. Как заявили представители NVIDIA, одной из первых, кто начнет использование Tesla T4, станет корпорация Google.

По сравнению с ускорителями Р4, новые решения Т4 обладают более высокой скоростью. К примеру, задачи по лингвистике решаются в среднем в 34 раза быстрее, нежели с помощью ускорителей Р4. Производительность Т4 в пиковой отметке может достигать 260 TOPS для 4-битных целочисленных операций INT4, 130 TOPS — для INT8 и 65 терафлопс для смешанных тензорных операций FP16. При осуществлении обычных расчетов с плавающей запятой FP32 пиковая производительность может достигать 8.1 терафлопс.

Ускорители Т4, выполненные в виде низкопрофильной карты, подходят для установки в стандартный слот PCI Express, питание которого составляет 75 Вт. Поэтому при установке их в стандартные серверные стойки не требуется использование отдельного внешнего источника питания. Помимо этого, благодаря низкому профилю ускорители совместимы с различными видами серверов.

Как заявили в NVIDIA, новые чипы были созданы в первую очередь для процессов логического умозаключения в искусственном интеллекте. Вице-президент и руководитель по бизнесу ЦОД в NVIDIA Tesla Ян Бак (Ian Buck) заявил: «Столь эффективным графическим процессором для задач принятия решений Tesla T4 делают новые тензорные ядра архитектуры Turing. Исполнительный директор Дженсен Хуанг (Jensen Huang) уже говорил о тензорных ядрах и о том, что они могут предложить в играх, задачах рендеринга и в области ИИ, но они прежде всего предназначены для наибольшей эффективности в процессах логического умозаключения». В заявлении также отмечается, что ускоритель включает 320 тензорных ядер и 2560 ядер CUDA Turing.

В последние годы объем онлайн-видео стремительно растет, что приводит к увеличению спроса и на решения, которые осуществляют поиск информации и ее извлечение. Ускорители Tesla T4 подходят и для решения задач, связанных с ИИ-анализом видео, обеспечивая высокий уровень производительности, которые выше в среднем в 2-3 раза, чем при использовании ускорителей прошлого поколения. Решения Tesla T4 позволяют декодировать до 38 потоков видео 1080p, благодаря чему становится возможной интеграция глубинного обучения в видеопрограммы для последующего создания всевозможных интеллектуальных услуг.

Помимо презентации новых ИИ-ускорителей Tesla T4, корпорация NVIDIA анонсировала выход обновления ПО TensorRT 5, используемого при оптимизации моделей глубинного обучения. Новая версия программного обеспечения получила поддержку сервера принятия решений TensorRT, а также микросервиса для процессов логического умозаключения.

Источник: servernews