Chip de IA analógico da Peking University: usa NMF, é ≈ 12x mais rápido e consome 200x menos energia

Padre Miguel Ângelo Ferreira • May 13, 2026 16:11

Uma velha ideia volta ao centro da corrida da IA

Enquanto a conversa global gira em torno de GPUs caríssimas e data centers gigantes, investigadores chineses escolheram um caminho menos óbvio: revisitar o passado para resolver um problema bem atual.

Em vez de simplesmente espremer mais desempenho de chips digitais, eles trouxeram de volta um princípio quase abandonado desde antes da era do microprocessador - e colocaram essa lógica no centro de uma nova abordagem para acelerar a inteligência artificial.

Pesquisadores da Peking University apresentaram uma puce de IA analógica capaz de fazer cálculos 12 vezes mais rápido que processadores digitais avançados, usando 200 vezes menos energia. O trabalho foi publicado na revista científica Nature Communications e já começou a chamar atenção da indústria de tecnologia.

Uma única geração de chips não vai resolver o problema energético da IA. Resgatar o analógico é, na prática, mudar o jogo.

O impacto não está só nos números, mas na escolha de caminho: em vez da rota tradicional dos bits, zeros e uns, a equipa decidiu apostar na computação analógica - um tipo de cálculo que antecede o computador pessoal.

O que é, afinal, um chip de IA analógico

Antes do domínio total do digital, engenheiros já recorriam a computadores analógicos para resolver problemas físicos, como simular trajetórias de foguetes ou variações de temperatura em reatores. Em vez de números discretos, estas máquinas operavam com grandezas contínuas, como tensão elétrica e corrente.

Na nova puce chinesa, o princípio é semelhante, mas atualizado com materiais modernos e circuitos de alta precisão. Em vez de “imitar” o cérebro só por software, o próprio hardware passa a comportar-se como um sistema físico que resolve equações quase de forma natural.

Chips digitais: dividem cada operação numa sequência de passos, executados linha a linha.
Chips analógicos: deixam a própria física realizar vários cálculos ao mesmo tempo, em paralelo.

Durante décadas, esta abordagem foi vista como pouco prática: ruído elétrico, precisão limitada e programação difícil afastaram as grandes empresas. A combinação de IA com circuitos analógicos, porém, altera o equilíbrio. Muitos modelos de aprendizagem automática toleram pequenas imprecisões, desde que o resultado global seja consistente e rápido.

Energia, o calcanhar de Aquiles da IA

O salto recente da IA generativa apoia-se em GPUs como a Nvidia H100, desenhadas para executar milhares de milhões de operações por segundo. Só que esta força bruta vem com um preço: consumo elétrico elevadíssimo e calor complicado de dissipar.

Uma parte relevante desse gasto não vem do cálculo em si, mas da circulação de dados entre memória e unidade de processamento. Sempre que um modelo de IA consulta pesos, parâmetros e exemplos, bits atravessam o chip - e, muitas vezes, viajam também entre vários chips.

A puce analógica chinesa ataca diretamente esse ponto fraco. Ela usa “in-memory computing”: os cálculos são feitos no próprio local onde os dados estão guardados. Menos movimento de informação, menos desperdício de energia, menos calor.

Calcular onde o dado está guardado parece um detalhe técnico, mas se transforma em economia em escala de usina elétrica.

Como a China “ressuscita” uma técnica matemática dos anos 1990

No coração do chip analógico está um método chamado Non-negative Matrix Factorization (NMF), ou factorização de matrizes não negativas. O nome assusta, mas a ideia é simples: decompor uma grande tabela de dados em blocos menores que revelem padrões escondidos.

A NMF é muito usada em:

sistemas de recomendação (filmes, músicas, produtos),
compressão e reconstrução de imagens,
análise de comportamento de usuários,
separação de sinais de áudio, como voz e ruído.

Em hardware digital, esta técnica pede muitas iterações e multiplica matrizes gigantes milhões de vezes. O custo dispara quando o volume de dados chega a escalas de Netflix ou grandes redes sociais.

Os engenheiros da Peking University fizeram algo arrojado: em vez de executar a NMF como software, transformaram o método num fenómeno físico. O circuito da puce é concebido para que, ao receber as entradas, o próprio comportamento elétrico faça a factorização numa única etapa - onde um processador tradicional precisaria de milhares.

Testes com dados reais, não só com equações bonitas

Para evitar a crítica clássica de “só funciona em laboratório”, a equipa liderada por Sun Zhong aplicou a puce a problemas concretos. Em sistemas de recomendação, simulando cargas semelhantes às de plataformas como Netflix ou Yahoo, a puce analógica entregou resultados comparáveis em qualidade, mas muito mais depressa e quase sem gastar energia.

No processamento de imagens, os testes mostraram que o chip conseguia comprimir e depois reconstruir fotos com qualidade visual muito próxima à obtida por métodos digitais de alta precisão, reduzindo para metade a necessidade de armazenamento.

Tipo de chip	Velocidade	Consumo de energia
Processador digital avançado	Base de comparação	100%
Puce analógica da Peking University	≈ 12x mais rápido	≈ 0,5% (200x menos)

Um dos avaliadores do artigo científico chegou a falar em “vários ordens de grandeza” de ganho em velocidade e eficiência - algo incomum em revisões académicas mais conservadoras.

Por que isso mexe com a geopolítica da tecnologia

A China já vinha a investir pesado em supercomputadores, redes de longa distância e chips para IA. A aposta na computação analógica acrescenta uma camada estratégica a esta corrida.

Se a tecnologia escalar, data centers inteiros poderão ser redesenhados, reduzindo tanto a fatura energética como a dependência de GPUs ocidentais. Relatórios internos citados pela imprensa asiática sugerem que, em certas tarefas muito específicas, a puce poderia chegar a mil vezes o desempenho de algumas GPUs, quando se considera o conjunto de velocidade e gasto energético.

Revisitar ideias dos anos 1970 com tecnologia de 2026 é, ao mesmo tempo, um gesto de pragmatismo e de ambição geopolítica.

Limites, riscos e usos prováveis

A computação analógica não substitui todos os usos da computação digital. Ela é especialmente forte em operações matemáticas repetitivas e estruturadas, como multiplicações de matrizes, núcleo da IA atual.

Alguns pontos de atenção levantados por especialistas:

Precisão: o analógico lida com ruídos. Para aplicações médicas ou financeiras, isso pode exigir camadas de correção digital.
Programação: desenvolver para hardware analógico exige novas ferramentas e linguagens, o que cria uma curva de aprendizado.
Escalabilidade industrial: transformar um protótipo de laboratório em produção em massa é um desafio por si só.
Padronização: falta um “ecossistema” de softwares e bibliotecas voltados para esse tipo de chip.

Por outro lado, as oportunidades são claras em áreas como:

recomendação em tempo real com baixo custo energético,
dispositivos de borda (câmeras inteligentes, sensores industriais, robôs),
centros de dados com metas agressivas de redução de carbono,
processamento local em países com infraestrutura elétrica limitada.

Termos que valem uma tradução para o cotidiano

Duas expressões técnicas aparecem o tempo todo nesse debate:

O que é “computação in-memory”

Na maioria dos computadores, memória e processador ficam separados. A cada operação, dados são copiados da memória para o núcleo de cálculo e depois devolvidos. “In-memory” significa praticamente fundir essas funções: o lugar que guarda também processa.

Pense numa fábrica: no modelo tradicional, a matéria-prima vai de um armazém para outro, várias vezes. No in-memory, a fábrica é reorganizada para que quase tudo aconteça no mesmo espaço. Menos transporte, menos perdas, menos atraso.

Por que a NMF combina com IA recomendadora

Num serviço de streaming, cada utilizador e cada filme podem ser representados como linhas e colunas de uma enorme matriz. A NMF decompõe essa matriz em fatores que “explicam” preferências escondidas: gosto por ação, comédia romântica, documentários, por exemplo.

Com a factorização feita diretamente no hardware, a puce analógica transforma toneladas de cliques e visualizações em padrões utilizáveis por outros algoritmos, com um ganho brutal de velocidade.

Cenários possíveis para os próximos anos

Se a tecnologia amadurecer, é provável que surja uma arquitetura híbrida. Chips analógicos fariam o trabalho pesado de multiplicação de matrizes e decomposições numéricas, enquanto processadores digitais coordenariam o fluxo, fariam afinações e lidariam com tarefas mais lógicas.

Num cenário plausível, grandes empresas de cloud poderiam oferecer “nós analógicos” dedicados, tal como hoje alugam GPUs e TPUs. Startups de IA passariam a escolher entre treinar modelos em clusters digitais tradicionais ou em infraestruturas que misturam analógico e digital, conforme o tipo de aplicação e o custo local da eletricidade.

Também surgem questões regulatórias e ambientais: metas de redução de emissões podem pressionar governos e empresas a priorizar arquiteturas menos vorazes em eletricidade. Nesse contexto, a “ressurreição” da tecnologia analógica deixa de ser curiosidade histórica e vira peça concreta de política industrial.