Intel anuncia novos Xeon Escaláveis de 3ª Geração

I

Anúncio faz parte de um conjunto maior de soluções com ênfase no processamento de IA e análise de dados.

Depois de anunciar seus novos processadores Intel Core de décima geração para desktops, notebooks e sistemas corporativos, chegou a vez dos servidores com a chegada na semana passada a terceira geração do Xeon Scalable Processor (codinome Copper Lake) que…

… como nos seus antecessores vem com a proposta de acelerar ainda mais a chamada Era Datacêntrica cuja idéia é de ir além da simples tarefa de devorar dados, englobando também soluções ligadas ao armazenamento e transferência de dados resultando, assim numa solução mais holística, coerente e integrada:

E como é de praxe nessa linha de produtos, esses novos Xeon possuem características técnicas cheias de superlativos…

…como o impressionante Intel Xeon Platinum 8380HL Processor equipado com 28 núcleos físicos com HT que, num sistema de 8 soquetes é capaz de gerenciar até 448 núcleos lógicos de processamento com um TDP de 250 Watts e a mirabolante quantidade de 4,5 TB de DRAM. Sua velocidade básica varia entre 2,9~3,1 GHz mas pode chegar até a 4,3 GHz no chamado Maximum Single-Core Intel Turbo Boost onde toda a potência do chip é centrada em apenas um núcleo de processamento (conhecido internamente pelo apelido de “The Golden Core“) o que pode ser útil para executar programas não otimizados para sistemas paralelizados.

Nome e número do processadorvelocidade
Padrão
(GHZ)
Velocidade Máxima
de um único núcleo
no modo turbo(GHZ)
Núcleos/
Threads
TDP
(em Watts)
Cache do
processador
Suporte de memória
(6 canais)
Capacidade máxima de DRAM
(Por soquete)
Número
de soquetes
Tecnologia
Intel Speed Select?
Intel Xeon Platinum
8380HL Processor
2,94,328/5625038,5 MBDDR4-3200 MT/s
(1 DPC)
ou
DDR4-2933 MT/s
(2 DPC)
4,5 TB4 ou 8Não
Intel Xeon Platinum
8380H Processor
2,94,328/5625038,5 MBDDR4-3200 MT/s
(1 DPC)
ou
DDR4-2933 MT/s
(2 DPC)
1,12 TB4 ou 8Não
Intel Xeon Platinum
8376HL Processor
2,64,328/5620538.5 MBDDR4-3200 MT/s
(1 DPC)
ou
DDR4-2933 MT/s
(2 DPC)
4,5 TB4 ou 8Não
Intel Xeon Platinum
8376H Processor
2,64,328/5620538.5 MBDDR4-3200 MT/s
(1 DPC)
ou
DDR4-2933 MT/s
(2 DPC)
1,12 TB4 ou 8Não
Intel Xeon Platinum
8354H Processor
3,14,318/3620524.75 MBDDR4-3200 MT/s
(1 DPC)
ou
DDR4-2933 MT/s
(2 DPC)
1,12 TB4 ou 8Não
Intel Xeon Platinum
8353H Processor
2,53,818/3615024.75 MBDDR4-3200 MT/s
(1 DPC)
ou
DDR4-2933 MT/s
(2 DPC)
1,12 TB4 ou 8Não
Intel Xeon Gold
6348H Processor
2,34,224/4816533 MBDDR4-2933 MT/s
(2 DPC)
1,12 TB4Não
Intel Xeon Gold
6328HL Processor
2,84,316/3216522 MBDDR4-2933 MT/s
(2 DPC)
4,5 TB4Sim
Intel Xeon Gold
6328H Processor
2,84,316/3216522 MBDDR4-2933 MT/s
(2 DPC)
1,12 TB4Sim
Intel Xeon Gold
5320H Processor
2,44,220/4015027,5 MBDDR4-2666 MT/s
(2 DPC)
1,12 TB4Sim
Intel Xeon Gold
5318H Processor
2,53,818/3615024,75 MBDDR4-2666 MT/s
(2 DPC)
1,12 TB4Não

Vale a pena ressaltar que o Copper Lake ainda é fabricado no processo de 14 nm e nessa leva, ainda não foram lançados as versões mais de entrada com suporte para sistemas de apenas um ou dois soquetes, caso das linhas Silver e Bronze.

De qualquer modo, a empresa já revelou que esses modelos mais de entrada (codinome Ice lake) devem chegar ao mercado até o fim deste ano. Já em 2021 todos eles serão substituídos pelo Saphire Rapids baseado na plataforma Eagle Stream.

Segundo a Intel, isso mostra o esforço da empresa em atender as demandas mais prementes de seus clientes que pedem por sistemas mais poderosos capazes de rodar sistemas de processamento intensivo, em especial nas áreas de IA e data analytics.

A vez e a hora do Brain Float Point

Um bom exemplo de esforço do pessoal de Santa Clara nesta direção é o anúncio de que o Copper Lake é um dos primeiros chips da casa a suportar o chamado Brain floating-point format (também conhecido como bfloat16 ou simplesmente BF16) que é um novo formato numérico proposto originalmente pelo Google e apoiado pela Intel que é semelhante ao formato FP32 (também conhecido como Single-precision floating-point format)…

… porém com seu campo de mantissa truncado em apenas 7 bits

… o que difere do FP16 padrão (Half-precision floating-point format) cujo o expoente se limita a 5 bits e a mantissa a 10 bits :

Com isso, o BF16 se comporta mais ou menos como um registro FP32 o que permite uma conversão mais simples entre os dois tipos de dados durante o processamento, assim como exigir alterações mínimas no software para a sua implementação e uso.

Em outras palavras, apesar de que alguma informação poder ser perdida, os resultados ainda podem ser representados com uma boa precisão…

… acelerando assim o processo de aprendizado de máquina…

… e o desempenho de inferência na CPU.

Em relação ao software, a Intel oferece suporte para BF16 nas suas distribuições otimizadas para as principais estruturas de deep learning (incluindo TensorFlow e Pytorch) que estão disponíveis no seu kit de ferramentas Intel AI Analytics.

Ela também oferece otimizações BF16 em seu kit de ferramentas OpenVINO e no ambiente ONNX Runtime para facilitar as implantações de inferência o que também inclui o suporte para seus FPGAs e processadores neurais como o Nervana.

Sob um certo ponto de vista, o Copper Lake não deixa de ser uma resposta para o seu principal concorrente nessa área — o Alviverde de Santa Clara — cuja estratégia de IA e HPC sempre esteve fortemente baseada nas suas GPUs enquanto que o Azul e Branco de Santa Clara até hoje defende a idéia de fazer o mesmo dentro das uas CPUs (ou pelo menos enquanto a sua GPU discreta Xe Graphics não der o ar da graça):

Com relação ao seu desempenho, a empresa afirma que seus clientes que planejam atualizar infraestruturas podem esperar um ganho estimado de 1.9x em cargas de trabalho comuns e até 2.2x mais VMs em comparação a plataformas equivalentes de 4 soquetes de 5 anos atrás.

Disponibilidade e Preço

Segundo a Intel os novos Xeon Scalable Processor de 3ª Geração já estão disponíveis para clientes. Já a disponibilidade geral dos sistemas OEM é esperada para o segundo semestre de 2020.

Em maio, o Facebook anunciou que os processadores escaláveis Intel® Xeon® de 3ª Geração passariam a ser a base dos seus novos servidores para Open Compute Platform (OCP).

Já outros CSPs como o Alibaba, Baidu e Tencent, anunciaram que também estão adotando esses processadores de última geração.

Mais informações aqui.

Sobre o autor

Mário Nagano

Desde o século passado Mario Nagano analisa produtos e já escreveu sobre hardware e tecnologia para veículos como PC Magazine, IDGNow!, Veja e PC World.
Em 2007 ele fundou o Zumo junto com o Henrique assumindo o cargo de Segundo em Comando, Editor de Testes e Consigliere.

+novos