O NUMA é uma tecnologia de acesso à memória usada na plataforma Quad FX da AMD. O Quad FX é uma plataforma "dual-cpu" lançada pela AMD em 2006, onte temos dois processadores da série FX, espetados na mesma placa-mãe e ligados através de um link HyperTransport.
Como no Quad FX cada processador possui seu próprio controlador de memória dual-channel, é necessário utilizar um total de 4 módulos: dois para cada processador. Como cada processador tem acesso direto à apenas metade da memória instalada, é necessário um sistema que permita a comunicação entre ele, de forma que um possa enxergar a metade utilizada pelo outro. Entra em cena o NUMA (Non-Uniform Memory Architecture) que permite que ambos os processadores trabalhem utilizando uma tabela de endereços unificada. Graças a isso, cada um dos dois processadores enxerga toda a memória disponível, e acessos feitos à metade de propriedade do outro processador são realizados através do link HyperTransport que os interliga.
Embora a idéia pareça boa no papel, o uso do NUMA aumenta os tempos de latência do acesso à memória, já que aproximadamente metade dos acessos são feitos aos módulos do processador vizinho, fazendo todo o caminho através do barramento HyperTransport, em vez de de irem diretamente do módulo ao controlador de memória local.
Em aplicativos não-otimizados (atualmente poucos programas são capazes de explorar ao máximo o benefício de um segundo núcleo, o que dizer de quatro) a perda causada pelo aumento da latência no acesso à memória anula grande parte do benefício proporcionado pelos dois núcleos adicionais, fazendo com que mesmo o FX 74 tenha dificuldades em oferecer ganhos tangíveis sobre um X2 6000+, que também opera a 3.0 GHz. Em alguns benchmarks, aplicativos científicos e modelagem em 3D, o Quad FX se destaca, mas em aplicativos de uso geral e em games o ganho de desempenho real é pequeno.
Em um teste rápido, utilizando uma NVIDIA GeForce 8800 GTX a 1600x1200, o FX-70 consegue apenas 148 FPS no Half Life 2 (Gunship Timedemo), contra 147 obtidos por um X2 5200+, que também opera a 2.6 GHz. Ele ganha por uma margem de 6% no 3D MAX e ganha por uma pequena margem em compressão de vídeo usando o Xmpeg, mas perde (embora por apenas 2 a 3 FPS) no Quake 4, que seria um bom exemplo de game em que o uso do NUMA acaba fazendo mais mal do que bem.