AMD anuncia GPU MI100 Instinct baseada em CDNA com 120 CUs para HPC, promete até 2,1x mais performance por dólar em comparação com a NVIDIA A100
A AMD anunciou o Instinct MI100 baseado na nova arquitetura CDNA voltada para a aprendizagem de máquinas (ML) e cargas de trabalho de computação de alto desempenho (HPC). O MI100 deverá oferecer 10 teraflops de desempenho FP64 que vai até 11,5 TFLOPS quando emparelhado com processadores AMD EPYC de segunda geração.
Durante a apresentação, a AMD também confirmou que os processadores EPYC de 3º geração baseados no código Zen 3 de Milão estão agora sendo amostrados para selecionar OEMs e estão programados para um lançamento no 1º trimestre de 2021.
A AMD disse que está desenvolvendo arquiteturas diferentes adaptadas para aplicações específicas com algumas sobreposições. Enquanto a RDNA irá atender aos jogos, a CDNA está mais focada em aplicações computacionais e HPC. O Instinct MI100 oferece uma Tecnologia Matrix Core que permite operações de matriz de precisão única e mista, como FP32, FP16, bFloat16, Int8, e Int4.
O segundo gen Infinity Fabric no MI100 apresenta 32 GB de memória HBM2 a 1,2 GHz fornecendo 1,23 TB/s de largura de banda
A tabela a seguir ilustra as especificações do Instinto AMD MI100
Projeto | Altura total, Dupla ranhura, 10,5 pol. de comprimento |
Unidades de cálculo | 120 |
Processadores Stream | 7,680 |
FP64 TFLOPs (Pico) | 11.5 |
FP32 TFLOPs (Pico) | 23.1 |
FP32 Matrix TFLOPs (Pico) | 46.1 |
FP16/FP16 Matrix TFLOPs (Pico) | 184.6 |
TOPS Int4/Int8 (Pico) | 184.6 |
bFLOAT16 TFLOPs (Pico) | 92.3 |
Memória HBM2 ECC | 32 GB |
Interface de memória | 4.096 bits |
Relógio de Memória | 1.2 GHz |
Largura de banda de memória | 1.23 TB/s |
Suporte PCIe | Gen4 |
Infinity Fabric Links/Bandwidth | 3 / 276 GB/s |
TDP | 300 W |
Refrigeração | Refrigerados passivamente |
Enquanto o MI100 é projetado para funcionar bem com processadores EPYC, a AMD confirmou que a nova GPU também suporta processadores Intel. Em geral, pode-se esperar um desempenho de até 7x FP16 do MI100 em comparação com as GPUs AMD HPC da geração anterior.
O Instinct MI100 fornece até 64 GB/s de largura de banda Infinity Fabric entre a CPU e a GPU sem a necessidade de usar qualquer chave PCIe. Há um total de três links Infinity Fabric que oferecem até 276 GB/s de capacidade de transmissão. Essencialmente, uma colmeia quad-GPU do MI100 pode render até 1,1 TB/s de largura de banda total. De acordo com a AMD, estas características dão ao MI100 uma vantagem significativa sobre o NVIDIA A100 em cargas FP16/FP32 e, ao mesmo tempo, oferecem um desempenho superior por dólar (ver slides abaixo).
O Instinct MI100 suporta o novo ecossistema ROCm 4.0, o qual a AMD se destaca como uma solução completa para cargas de trabalho ML e HPC. ROCm 4.0 agora usa um compilador de código aberto e suporta OpenMP 5.0 e HIP. Além disso, PyTorch e TensorFlow estão agora otimizados para ROCm 4.0.
O AMD Instinct MI100 pode ser esperado no final deste ano nos principais sistemas OEM e ODM de empresas como Dell, Gigabyte, HP e SuperMicro.
Os Top 10
» Os Top 10 Portáteis Multimídia
» Os Top 10 Portáteis de Jogos
» Os Top 10 Portáteis Leves para Jogos
» Os Top 10 Portáteis Acessíveis de Escritório/Empresariais
» Os Top 10 Portáteis Premium de Escritório/Empresariais
» Os Top 10 dos Portáteis Workstation
» Os Top 10 Subportáteis
» Os Top 10 Ultrabooks
» Os Top 10 Conversíveis
» Os Top 10 Tablets
» Os Top 10 Smartphones
» A melhores Telas de Portáteis Analisadas Pela Notebookcheck
» Top 10 dos portáteis abaixo dos 500 Euros da Notebookcheck
» Top 10 dos Portáteis abaixo dos 300 Euros
Aqui estão alguns dos slides do briefing de imprensa da AMD
Fonte(s)
Comunicado de imprensa da AMD