К полной версии

NVIDIA расширила линейку специализированных ускорителей

NVIDIA расширила линейку специализированных ускорителей
Компания NVIDIA на минувшей неделе официально представила новые модели ускорителей – Tesla P40 и Tesla P4, которые ориентированы на эффективное решение задач, относящихся к области глубокого обучения. Благодаря новым моделям ускорителей NVIDIA самообучающиеся систему будут значительно быстрее проводить анализ нескольких потоков видео в режиме реального времени и делать соответствующие логические выводы. Ускорители Tesla P40 и Tesla P4 должны заменить адаптеры прошлого поколения Tesla M40 и Tesla M4.

Специализированный адаптер Tesla P40 получил полную версию графического процессора GP102, который является в свою очередь «облегченной» версией HPC-чипа GP100. Ускоритель оперирует 3840 потоковыми процессорами Pascal, 240 текстурными блоками (TMU), 96 блоками рендеринга (ROP), 384-разрядной шиной памяти и 24 Гбайт локальной памяти стандарта GDDR5. Небольшим недостатком новинки является то, что в ней применены микросхемы буферной RAM, рабочая частота которых составляет 1800 (7200) МГц. Номинал GPU у адаптера Tesla P40 составляет 1303 МГц (базовая частота) до 1531 МГц (boost-режим). Пиковая пропускная способность подсистемы – 346 Гбайт/с. Среднее энергопотребление ускорителя составляет порядка 250 Вт. Для обеспечения хорошей охлаждения, адаптер получил двухслотовый радиатор, продувание которого осуществляется вентиляторами серверной стойки. Габаритные размеры графического ускорителя Tesla P40 – 267х112х40 мм. Производительность ускорителя составляет 12 TFLOPS при операциях с числами одинарной точности и 47 TOPS при целочисленных (INT8) операциях. Из особенностей стоит отметить поддержку одновременного анализа до 35 потоков видео.

Технические параметры модели Tesla P4 более скромные. В ускорителе используется чип Pascal GP104, который содержит 2560 потоковых процессоров, 160 текстурных блоков, 64 блока растровых операций, шину памяти разрядностью 256 бит и 8 Гбайт GDDR5. Рабочая частота адаптера составляет 810-1063 МГц. Частота микросхем RAM составляет 1500 МГц, позволяя обеспечить пропускную способность до 192 Гбайт/с. При пиковой производительности энергопотребление составляет 75 Вт, поэтому отдельное питание для адаптера не требуется. Производительность модели Tesla P4 составляет в 5,5 TFLOPS (числа одинарной точности) и 22 TOPS (целые числа). Адаптер имеет поддержку анализа 35 потоков видео одновременно.

Старт продаж ускорителя Tesla P40 запланирован на начало октября, а модель Tesla P4 появится месяцем позже.

назад