em obras

Intel revela processador “Tiger Lake” com a nova GPU Xe LP

Nova aceleradora gráfica da Intel é a primeira de uma nova família de GPUs integradas e discretas para equipar de portáteis a servidores.

No último dia 11 de agosto o pessoal de Santa Clara realizou mais uma edição do seu Intel Architecture Day 2020 que, como o próprio nome sugere, é um evento dedicado a divulgar no que a empresa está trabalhando nas áreas de hardware, software e processos de fabricação.

Mas como em outros eventos acontecidos desde o surgimento da pandemia do coronavírus esta edição foi totalmente digital sendo que as diversas apresentações foram conduzidas por Raja Koduri arquiteto chefe e vice presidente sênior da divisão de gráficos discretos da Intel…

… cujo cargo the permite ter uma visão bem do alto da empresa, cuja estratégia nas áreas de engenharia e arquitetura estão passando por uma grande transformação para enfrentar os desafios tecnológicos que estão por vir na próxima década:

Koduri afirma que ao invés de concentrar todos os esforços no desenvolvimento do chip (e do seu entorno) a abordagem agora deve ser mais holística baseada em microarquiteturas mais flexíveis e até híbridas cujo foco é na resolução de problemas o que faz com que o software tenha um papel ainda mais relevante:

Outro conceito bem curioso apresentado pelo executivo é a dos seis Pilares da Tecnologia que seriam as tecnologias essenciais para fazer com que a Lei de Moore continue a existir e ser relevante…

… já que ela deixa de ser apenas uma métrica — hoje limitada pelas leis da física — para se tornar numa espécie de índice de satisfação que duplica a experiência do usuário a cada 18 meses.

Para isso, é intenção da empresa entregar essa visão por meio de um conjunto eclético de processadores baseados em micro arquiteturas escalares (usadas em CPUs), vetoriais (GPUs), matriciais (Aprendizado de máquina e AI) e espaciais (FPGAs)…

… alimentados por novos sistemas de memória e interconectados por barramentos de todo tipo, cor e modelo — tudo unido por uma única abstração de software protegido por um sólido sistema de segurança.

Com isso, a nova estratégia da em empresa não é mais abordar cada uma dessas arquiteturas de maneira separada e sim como partes de uma solução que seria desenvolvida sob medida…

…para cada necessidade de seus clientes focando assim tanto em desempenho quanto em generalidade:

E como entregar essa visão?

Apresentando Tiger Lake

Para sintetizar alguns os avanços da Intel nas áreas de microarquitetura e produção a empresa usou como exemplo seu novo SoC codinome Tiger Lake, um SoC móvel baseado na microarquitetura Willow Cove e que irá suceder a linha Ice Lake:

Ele será conhecido no mercado como Intel Core ix de 11a geração mas como o Architecture Day é um evento técnico Koduri não revelou detalhes mais comerciais como quais serão os primeiros modelos a chegar ao mercado e números de desempenho, o que deve acontecer em breve ainda neste ano.

Ele vai ser produzido por um novo processo de 10nm da Intel que também introduz um novo tipo de transistor batizado de SuperFin que seria a terceira geração de FinFet introduzido pela intel a quase uma década atrás com o lançamento do Ivy Bridge.

Essa redução na escala acompanhada de melhorias em diversas partes deste chip — do barramento na sua base até até as interconexões metálicas do topo…

…proporcionaram o maior ganho relativo de desempenho nas suas intra-conexões da história da empresa:

Koduri comentou que a transìção dos 14nm para os 10nm demorou tanto que a Intel realizou diversas melhorias incrementais no processo de 14nm adicionando o sufixo “+” para distinguir cada passo — por exemplo 14nm, 14m+ e 14nm++ e assim por diante.

Mas depois de vários “+” encadeados, a empresa concluiu que isso já estava beirando o ridículo e decidiu criar uma nova nomenclatura baseado na descrição de “marcos tecnológicos a serem celebrados“, de modo que o processo de fabricação do Tiger Lake que seria a terceira geração de 10nm — ou 10nm++ — passa a se chamar Intel 10nm SuperFin e o seu sucessor Intel 10nm Enhanced SuperFin:

Aliás, o nome SuperFin veio da combinação de duas grandes tecnologias: A do capacitor SuperMIM (Metal+Insulator+Metal) e do FinFet melhorado.

Willow Cove

Mas voltando ao que nos interessa, entre os objetivos a serem alcançados com o SoC Tiger Lake, além do tradicional ganho de desempenho combinado com menor consumo de energia, novos objetivos foram adicionados na lista como gráficos melhores, processamento de AI escalável, barramentos de dados de alto desempenho, rico em recursos (os chamados IPs) e equipado com recursos de segurança ainda mais avançados e que fosse capaz de trabalhar numa ampla faixa dinâmica de TDP que pode variar de menos de 10 até 65 watts:

Segundo Boyd S. Phelps VP e gerente geral do grupo de engenharia de cliente e de desenvolvimento do Core, esses objetivos foram alcançados graças ao uso do novo SuperFin o que permitiu balancear o consumo de energia entre os diversos componentes do SoC — ou seja economizando em sistemas não tão críticos de um lado para ser usado em outros mais fominhas — resultando assim no Willow Cove, um produto ainda baseado no Sunny Cove, porém mais veloz, esperto e econômico no consumo.

Processador Willow Cove

Fora isso, o seu cache de memória foi redesenhado para ser não inclusivo com uma uma área de memória intermediária (ou MLC) que passou de 512 KB para 1,25 MB para melhorar seu desempenho e prepará-lo para as cargas de trabalho do futuro.

Já o cache de último nível foi aumentado em +50% passando para uma faixa de 12 MB até 24 MB dependendo do modelo.

Finalmente, seus recursos de segurança também foram melhorados com o uso da chamada Intel Control Flow Enforcement Technology (ou CET) que protege o sistema contra o uso indevido de código legítimo por meio de ataques de sequestro de fluxo de controle (control-flow hijacking) — uma técnica muito usada em malwares.

Segundo Phelps, o resultado desse esforço é que Willow Cove é que ele opera de maneira bastante dinâmica por toda sua curva de Voltagem x Frequência, ou seja, se comparado com seu antecessor, dada uma certa voltagem ele gera um ganho significativo de frequência. Do mesmo modo, ele também pode operar numa frequência frequência fixa com uma voltagem significativamente menor:

Fora isso, com o uso de uma nova aceleradora gráfica Xe LP (mais sobre isso abaixo) combinada com otimizações na própria CPU unidas por uma malha “coerente” de barramento duplo (batizado de “ring”) proporcionam um melhor desempenho nas aplicações de IA (Inteligência Artificial) sendo que o chip ainda conta com uma aceleradora neural batizada de Gaussian & Neural Accelerator (ou GNA) 2.0 que fornece um mecanismo dedicado para processar cargas de trabalho de IA em segundo plano (como coletar, analisar e interpretar dados e até contextos) que nem exigem muito do processador mas que precisam funcionar com baixíssimo consumo de energia.

SoC Tiger Lake

Com relação ao controlador de memória DRAM, os bancos de memória foram reorganizados em grupos de 8 x 16 e foi adicionado um segundo controlador de memória capaz de realizar solicitações mais profundas, reduzindo assim sua latência.

Já a largura de banda pode chegar a até 86 GB/s e o sistema ainda conta com a tecnologia Intel Total Memory Encryption para proteger a memória contra ataques maliciosos. No início Willow Cove irá suportar bancos de memória DRAM LP4x-4267, DDR4-3200 e no futuro, até LP5-5400

Finalmente, Willow Cove conta com uma controladora de E/S integrada Thunderbird 4 / USB4 (até 40 GB/s por porta), PCIe Gen 4, saída de vídeo via Type-C além de oferecer suporte para sinais de vídeo de alta definiçao com largura de banda isócrona de até 64GB/s com ligação direta (batizada de Display ISOC Port) na memória para garantir a qualidade do serviço, seja na forma de imagens de maior resolução.

Com relação a captura de imagens o novo chip conta com o chamado IPU6 um circuito capaz de suportar até seis sensores (ou câmeras) capazes de capturar vídeos em 4K30 (podendo chegar a 4K90) e imagens de até 27 MP (podendo chegar a 27 MP).

Finalmente, uma nova GPU no pedaço

Na nossa opinião, a cerejinha desse bolo nem seria o SuperFin muito menos o Willow Cove e sim sua nova GPU integrada que seria o tão esperado Intel Xe LP o primeiro de uma linha de produtos que, de um certo modo começa pequeno mas que num futuro próximo promete crescer para outros mercados como o de gráficos discretos para uso geral, gamer e até HPC!

De fato, o Xe talvez seja a maior peitada do Azul e Branco de Santa Clara contra o seu rival — o Alviverde de Santa Clara — de entrar de sola no mercado de GPUs discretas desde o fiasco do Larabee que, em 2007 já falava em renderizar imagens em Ray Tracing em tempo real! 😯

O curioso é que depois de diversos adiamentos Larrabee deixou de ser uma GPU discreta para se tornar um processador numérico para HPC chamado Knights Ferry 

Em 2010, vimos uma demo desse sistema em um notebook conectado remotamente num servidor equipado com a aceleradora MICA da Intel. Ela rodava uma versão “alemã” (sem símbolos nazistas no cenário) do jogo Wolfestein cujo software foi modificado para renderizar imagens em ray tracing em tempo real:

Mas voltando aos dias de hoje, o Xe LP (de Low Power) é uma nova GPU integrada voltada para sistemas móveis equipada com 96 Unidades de Execução (ou EUs) e outros recursos como processamento assíncrono, visualização de instâncias, mecanismo de mídia baseado no AV1 e mecanismo de exibição atualizado.

O Xe LP também irá oferecer ferramentas como tuning para jogos, captura de imagens para streaming e um novo motor de display. Fora isso, vale a pena destacar que a Intel desenvolveu um compilador otimizado para melhorar o desempenho de jogos desenvolvidos com DirectX 11.

Koduri explicou que a empresa irá concentrar inicialmente os seus esforços em consolidar a presença do Xe LP no mercado de gráficos integrados porque é nessa faixa que a empresa poderá alcançar o maior número de usuários.

Neste mesmo tempo, a empresa irá disponibilizar a chamada DG1 (= Desktop Graphics 1 ?) a primeira placa gráfica baseada no Xe LP que será voltada tanto para desenvolvedores de software quanto se hardware para desenvolverem drivers e softwares e até patches e otimizações para essa nova plataforma, facilitando assim o trabalho desses profissionais que poderão explorar essa nova GPU sem precisar investir num sistema com Tiger Lake.

Para isso a DG1 também contará com seu próprio subsistema de memória, envelope de consumo e a previsão é que ele chegue no mercado ainda neste ano.

Fora isso também haverá uma versão do Xe LT para servidores/datacenters chamada SG1 (= Server Graphics 1 ? ) cuja idéia é de atender ao crescente números de clientes interessados em ter acesso a GPUs na nuvem com grande capacidade de processar vídeos — especialmente em aplicações de transcodificação e streaming — caso do Intel Media Engine que já oferece suporte para diversos frameworks de software como ffmpeg, D-Streamer, Handbrake, Cyberlink, Adobe etc.

A SG1 vai estar disponível em versões de 1 até 4 GPUs em padrões Small Form Factor para serem usado em servidores de Data Center e devem chegar ao mercado até o fim deste ano.

Já para as aplicações que demandem maior capacidade de procesamento, haverá uma versão maior e mais parruda do Xe batizada de Xe HP cuja estratégia é de aumentar a escala em tudo como a contagem de núcleos que poderá passar dos quatro dígitos além de um aumento significativo do clock que poderá variar de 1,5x até 2,0x se comparado com o LP além de um sistema de memória pelo menos 10x mais veloz.

Fora isso, o Xe HP também terá que lidar com formatos numéricos que não são muito usados em gráficos integrados como FP de dupla precisão muito usado em aplicações de IA.

O aumento da escala também exigirá o uso de envelopes térmicos que pode variar de 75~500 watts em padrões de formatos diversos assim como opções de encapsulamento para um dois ou quatro GPUs:

Koduri declarou que a previsão é que os primeiros produtos baseados no XE HP cheguem ao mercado em 2021.

E a GPU para gamers?

Para o grupo de usuários mais barulhentos do mercado, a boa notícia é que eles não foram esquecidos sendo que a Intel já trabalha numa versão do Xe HP otimizada para uso em jogos batizada de Xe HPG que combinou as melhores características do Xe LP, HP e HPC num novo produto também equipado com um subsistema de memória baseado em DDR6 para baixar o seu custo já que o HP e HPX usam memórias LP5.

O executivo revelou que este chip já existe e está sendo testado nos laboratórios da empresa sendo que a previsão é que ele chegue ao mercado em 2021.

Legal né?

Ah sim, ele também terá suporte para Ray Tracing em tempo real!

Anda em tempo:

Além do Tiger Lake, Koduri falou brevemente sobre Alder Lake um processador com tecnologia híbrida que irá suceder o Lakefield em 2021.

Anunciado em 2019 o Lakefiled é um curioso chip “pentacore” equipado com um núcleo de processamento “principal” Sunny Cove mais quatro “mini-núcleos” codinome Tremont (baseado no Atom) cujo papel é de executar tarefas menores em segundo plano consumindo pouquíssima energia, o que viabilizaria um modelo de uso muito parecido com o Always Connected PC do pessoal de San Diego.

Baseado na experiência do Lakefield, a Intel resolveu dar um passo adiante com Alder Lake focando mais em ganho de desempenho do que consumo propriamente dito, chegando assim no produto com a melhor relação de desempenho por watt da empresa.

Para isso Alder Lake irá contar com um novo núcleo principal codinome Golden Cove e novos “mini-núcleos” Gracemont sendo que a previsão é que ele também chegue ao mercado em 2021.

Sobre o autor

Mário Nagano

Desde o século passado Mario Nagano analisa produtos e já escreveu sobre hardware e tecnologia para veículos como PC Magazine, IDGNow!, Veja e PC World.
Em 2007 ele fundou o Zumo junto com o Henrique assumindo o cargo de Segundo em Comando, Editor de Testes e Consigliere.

em obras

interfaces newsletter

+novos