ZTOP

IDF 2011: 20 minutos com Justin Rattner

Este Ztop entrevistou com exclusividade Justin Rattner CTO e diretor do Intel Labs que falou sobre multi-core, many-core, computação contextual e outros bichos.

Dono do emprego que ele considera o mais legal do mundo, Justin Rattner assumiu a direção do legendário Intel Labs em 2005 no lugar de Pat Gelsinger, cargo que lhe proporciona uma visão privilegiada do futuro da empresa quando o assunto é pesquisa e desenvolvimento. É dele a tarefa de apresentar o último keynote do IDF, chance que ele sempre aproveita para exercitar sua veia cômica como essa imitação de um colega de trabalho:

Esse post é uma mistura de uma breve entrevista “cara a cara” que tivemos um dia antes do seu keynote (por sinal a única concedida para um jornalista da América Latina) ilustrado com algumas demos apresentadas durante seu keynote.

Um dos assuntos que a Intel voltou a falar  neste ano são os chamados chips many-core ou MIC  (Many Integrated Core) que, ao contrário dos chips multi-core (como os Intel Core-ix de linha) são formados por diversos núcleos independentes que se comunicam entre por meio de um barramento interno, cujos exemplos mais conhecidos são o Terascale Processor de 80 núcleos de 2007 e a GPU Larrabee que evoluiu para uma solução mais elegante conhecida como Knights Ferry, uma espécie de co-processador aritmético para HPC.

Quando perguntei qual seria o atual estado de desenvolvimento dos MIC, Rattner acha que essa tecnologia não tem recebido a devida atenção nesses últimos tempos e que ele acha propício voltar a esse assunto principalmente porque este ano marca o quinto aniversário do anúncio do primeiro chip dual-core da empresa, um verdadeiro divisor de águas para o pessoal de Santa Clara que mudou radicalmente a maneira de pensar tanto a nível de hardware quanto de software.

Rattner disse que a Intel pequisa e desenvolve soluções tanto em many-core, multi-core e a combinação de ambos (descrito como soluções heterogêneas) que vão de Datacenters à desktops e várias coisas no meio desse caminho, o que inclui uma curiosa aplicação que seria uma estação-base LTE funcionando totalmente por software num servidor multicore, um trabalho por sinal desenvolvido em parceria com uma operadora da China:

O executivo explica que essa solução apresenta diversas vantagens já que além de se tratar de uma “plataforma genérica”  baseada em software, ela é bem mais  e flexível que seus concorrentes baseados em DSPs. Numa conta rápida ele disse que cada um desses sistemas equipados com dois processadores Xeon de oito núcleos, cada um deles equipados com seu respectivo vector engine acelerado com AVX, temos no final um sistema equipado com 16 canais que funcionam do mesmo modo que um DSP que funcionando numa velociade três vezes maior o que um DSP de linha temos uma capacidade de processamento equivalente à uma estação base equipada com 48 DSPs convencionais, ou seja um sistema multi-core substituindo um monte de ASICS (CIs dedicados para uma só aplicação), SOCs (System On a Chip) usados num sistema convencional o que na sua opinião é “muito legal”.

Já no mundo dos desktops e mesmos nos seus futuros handhelds, a Intel já pesquisa uma tecnologia que combina reconhecimento de face com encriptação de dados do tipo RSA o que pode levar à criação de um novo tipo de aplicação para  mídias sociais…

…  onde o PC será capaz de reconhecer a sua face e relacionar automanticamente a mesma com outras faces que formam um grupo de pessoas que permitem compartilhar suas imagens apenas com as pessoas que elas realmente conhecem.

… isso faz com que outras pessoas que até tenham acesso à mesma página não tenha acesso às pessoas e/ou assuntos relacionados com sua pessoa. Note que as imagens que “não foram com sua cara” mantiveram-se criptografadas, o que lembra uma tela de TV fora do ar.

Rattner explica que essa aplicação é um ótimo exemplo de processamento heterogêneo já que neste caso a aceleradora gráfica pode ser reprogramada para executar as rotinas de encriptação de dados e computer vision, enquanto que a CPU utiliza essas informações para fazer o reconhecimento final e descriptografar as imagens relacionadas com a sua pessoa e/ou cara, ou seja, uma maneira mais simples de relacionar-se apenas com as pessoas que você realmente reconhece baseado apenas em quem você é, e que funciona quase que instantaneamente em um sistema com Sandy Bridge.

Esse tipo de aplicação é de um certo modos os primeiros passos na direção do que o executivo chama de “context awareness” (  = conscientização/percepção do contexto) onde o tremendo poder de processamento dos atuais chips da empresa permitirão grandes saltos nessa área de conhecimento.

Quando perguntei essa tecnologia poderia ser aplicada para outros tipos de interação como reconhecimento de voz ou mesmo tradução simultânea, Rattner disse que ele acha que o grande desafio nestes dois casos não estaria na capacidade de processamento e sim na elaboração de algoritmos capazes de fazer o reconhecimento correto da linguagem natural, algo bastante complicado para aqueles que gostam de se expressar por meio de metáforas ou frases de sentido figurado. De fato ele afirma que ao invés de formar uma frase completa, as pessoas normais costumam se comunicar de maneira fragmentada o que não faz muito ( ou nenhum) sentido para um computador.

Com relação ao Knights Ferry, esse produto já está no mercado já a algum tempo sendo que de 50 a 100 sistemas já estão na mão de desenvolvedores de software.

Um exemplo interessante mostrado no keynote de Rattner foi uma aplicação de supercomputação utilizada pelo CERN para analisar seus dados coletados no LHC (Large Hadron Collider) que foi portado para o Knights Ferry. A grande sacada nesse exemplo é que essa conversão foi bastante simples graças ao uso das ferramentas de programação da Intel para MIC  já que a aplicação passou de um sistema x86 para outro sistema x86 ao contrário de outras soluções baseada em GPGPU.

O exemplo abaixo mostra a mesma aplicação rodando num MIC com apenas um (a esquerda) e com todos (a direita) os seus 32 núcleos funcionando.

Já a próxima geração de MIC será o Knights Corner que foi anunciado na última Conferência Internacional de Supercomputação (ISC’11) em Hamburgo na Alemanha, já baseado no processo fabricação de 22 nm e que deve chegar ao mercado em 2012. Rattner afirma que ele terá bem mais núcleos de processamento que os 32 do Knights Ferry (a Intel afirma que são mais de 50), que também serão mais velozes e equipados com um processador de ponto flutuante mais robusto e com suporte para double precision, o que resultará num tremendo ganho de desempenho.

Quando perguntei se ele teria um número mais preciso de núcleos ele educadamente se recusou a responder. De qualquer modo já marquei o número 62 no bolão do Knights Corner a conferir na época do seu lançamento.

Obviamente pra acompanhar esse ganho de desempenho a Intel também vai precisar de um novo sistema de memória que ele chama de “Hybrid Memory Cube” que foi desenvolvido em parceria com a Micron (já que a Intel não fabrica DRAMs). Uma das peculiaridades desse projeto é que os chips de memória são formados por uma pilha de cinco camadas (quatro chips de memória e uma de lógica) interconectadas verticalmente. A camada de lógica na base — que ele chama de Hybrid — porque os transístores lógicos são bem mais potentes que os usados nos chips de memória e são usados para direcionar os sinais de dados verticalmente pela pilha além e serem bastante eficiente na sua comunicação com o mundo exterior.

Isso faz com que essa interface de memória seja uma das mais velozes já demonstradas publicamente…

… alcançando 120 GB/segundo, além de ser bastante eficiente em termos de consumo de energia.

Mas como se trata de um produto ainda experimental, a Hybrid Memory não acompanhará a o Knights Corner, mas com toda certeza estará presente no seu sucessor (codinome Knights Landing). Isso porque aumentar o número de núcleos em um sistema many-core é uma tarefa bem mais simples do que aumentar a largura de banda da interface de memória, algo que Rattner descreve como algo bastante difícil mas necessário já que corre-se o risco dos núcleos de processamento não poderem receber os dados do sistema de memória no tempo ideal, comprometendo assim o desempenho geral do processador. Nesse caso o sistema tem que ser visto de uma maneira holística de modo que o desempenho das CPUs e o sistema de memória estejam bem balanceados.

E o uso de Transactional Memory nas MICs? Do lado dos chips multi-core (como os Core iX) o executivo disse que é tecnicamente possível implementar esse recurso por software mas a Intel ainda está a uma ou duas gerações de oferecer isso por hardware. Com certeza esse recurso está no roadmap da empresa mas isso ainda vai demorar um pouco. De qualquer modo ele afirma que essa implementação vai passar por uma interessante debate dentro da Intel para se saber o que será feito a nível de hardware e software, já que as maioria das transações são relativamente pequenas e podem ser resolvidas quase que instantaneamente por software, mas se você uma transação realmente grande os recursos do sistema irão se esgotar rapidamente de modo que a grande questão é saber o que o hardware e o software irão fazer nesse momento.

Uma curiosidade tanto do Knights Ferry/Corner é que ele utiliza núcleos de processamento x86 bastante simples que o executivo reconhece já mostrar sinais de idade e que será substituído por um novo modelo de baixíssimo consumo. Rattner explicou que essa decisão baseia-se na estratégia de que as próximas MCIs deverão ser mais eficientes em termos de consumo.

Uma pista do que será esse novo processador é aquele “chip movido a energia solar” mostrado no keynote de Paul Otellini que ao contrário do que pensávamos não era um Atom de ultra baixa voltagem e sim uma CPU completamente nova batizada com o codinome Claremont (mais sobre isso em outro post).

De qualquer modo o desafio nesse caso foi de criar um chip com o menor nível de consumo possível de modo que ele não pode ser considerado o estado da arte se comparado com chips mais modernos. Assim Rattner disse que não se surpreenderia em ver as futuras gerações de MCI além do Knights Landing equipado com um novo núcleo com design baseado no Atom.

Para encerrar essa conversa, perguntei para o executivo o qual é a sensação de estar na direção do Intel Labs. O que ele diz para todo mundo é que ele tem o emprego mais legal do mundo já que ele trabalha com uma fantástica equipe internacional e levantar da cama todo dia para inventar o futuro é uma sensação muito boa, especialmente naquelas horas em que alguém entra no meu escritório e começa a falar:

Então, eu tive essa idéia…

E dai pode surgir algo que pode mudar a vida de bilhões de pessoas ao redor do mundo.

Disclaimer: ZTOP viajou para São Francisco a convite da Intel, mas todas as opiniões aqui são nossas.

Desde o século passado Mario Nagano analisa produtos e já escreveu sobre hardware e tecnologia para veículos como PC Magazine, IDGNow!, Veja e PC World. Em 2007 ele fundou o Zumo junto com o Henrique assumindo o cargo de Segundo em Comando, Editor de Testes e Consigliere.