Os processadores de hoje contêm bilhões de transistores geradores de calor em um espaço cada vez menor. O orçamento de energia pode ir de:
- 1000 watts em um servidor especializado
- 100 watts em desktops
- 30 watts em laptops
- 5 watts em tablets
- 1 ou 2 watts em um telefone
- 100 miliwatts em um sistema incorporado
Isso é três quatro ordens de magnitude. O design moderno da CPU é a delicada arte de colocar um inferno na cabeça de um alfinete.
Veja o Pentium original de 1993 em comparação com o Pentium do 20º aniversário:
![]() |
1993 |
![]() |
2014 |
Lembro-me de resfriar as primeiras CPUs com dissipadores de calor simples, sem ventoinha. Essa época já passou há muito tempo.
Um computador desktop espaçoso oferece oportunidades de resfriamento (e, portanto, um orçamento de watts) com as quais um laptop ou tablet só poderia sonhar. Com que frequência o senhor estará no pico de carga? Para a maioria dos computadores, a resposta é “raramente”. Quanto menor o espaço, maior o desempenho exigido, mais desafiadora fica a sua situação.
Às vezes, Eu construo servidores.
Inspirado pelo Google e seu uso de hardware x86 barato e de commodity para escalar sobre o sistema operacional Linux de código aberto, eu também criei nossos próprios servidores. Quando fico estressado, quando sinto o mundo pesando sobre meus ombros e não sei a quem recorrer… Eu construo servidores. É terapêutico.
Os servidores são uma daquelas situações em que o senhor pode estar com carga total de CPU com mais frequência do que o normal. Eu prefiro construir servidores 1U que é a menor unidade montável em rack, com altura total de 1,75″.
Atualmente, o senhor tem muitos núcleos em um dado, por isso construo servidores de CPU única. Um dos motivos é o preço; o outro motivo é que a velocidade do clock diminui proporcionalmente ao número de núcleos em um dado (isso é para a série Broadwell Xeon V4):
núcleos | GHz | ||
E5-1630 | 4 | 3.7 | $406 |
E5-1650 | 6 | 3.6 | $617 |
E5-1680 | 8 | 3.4 | $1723 |
E5-2680 | 12 | 2.4 | $1745 |
E5-2690 | 14 | 2.6 | $2090 |
E5-2697 | 18 | 2.3 | $2702 |
Sim, existem CPUs de servidor com ainda mais núcleos, mas se o senhor tiver que perguntar quanto elas custam, o senhor definitivamente não pode comprá-los… e eles têm um clock ainda mais lento. O que fazemos é melhor atendido por um número menor de núcleos super-rápidos do que por um número maior de núcleos lentos.
Com isso em mente, considere estas duas CPUs de servidor Intel Xeon:
Como o senhor pode ver nas páginas oficiais de produtos da Intel para cada processador, ambos têm um orçamento de calor TDP de 140 watts. Estou examinando as especificações e pensando que talvez essa seja uma boa troca.
Infelizmente, aqui está o que eu realmente medi com meu fiel Kill-a-Watt para cada compilação de servidor enquanto eu realizava meu teste de estabilidade padrão, com peças completamente idênticas, exceto pela CPU:
- E5-1630: 40w ocioso, 170w mprime
- E5-1650: 55 W em modo inativo, 250w mprime
Estou aqui para dizer aos senhores que o valor do TDP da Intel de 140 watts para a versão de 6 núcleos dessa CPU é um uma mentira terrível e escabrosa!
Isso causou um pequeno problema para mim, pois nosso servidor padrão de 1U agora superaquece, emite alarmes e se acelera com a CPU de 6 núcleos – ao passo que a CPU de 4 núcleos não apresentou problemas. Ei, Intel! De minha casa na Califórnia, Eu apunhalo o senhor!
Mas, o senhor sabe…
Melhor dissipador de calor
A altura máxima de 1,75″ do formato de servidor 1U não deixa muito espaço para o resfriamento criativo de uma CPU. Mas o senhor pode mudar de um cooler de alumínio para um de cobre.
O cobre é significativamente mais caro, além de ser mais pesado e mais difícil de trabalhar, portanto, geralmente é mais fácil jogar uma massa cada vez maior de alumínio no problema de resfriamento quando o senhor puder. Porém, quando o espaço é limitado, como é o caso de um servidor 1U, o cobre dissipa mais calor no mesmo fator de forma.
O famoso cooler “Ninja” para CPU veio em versões idênticas de cobre e alumínio para que possamos comparar maçãs com maçãs:
- Ninja de alumínio – aumento de 24 °C em relação à temperatura ambiente
- Ninja de cobre – aumento de 17C em relação ao ambiente
O senhor pode dimensionar a carga e os watts de calor resultantes, ativando os threads do MPrime para o número exato de núcleos que deseja “ativar”, então foi assim que testei:
- Dissipador de calor de alumínio – estável a 170 watts (mprime threads=4), mas avisos de aquecimento com 190 watts (mprime threads=5)
- Dissipador de calor de cobre – estável a 190 watts (mprime threads=5), mas avisos de aquecimento com 230 watts (mprime threads=6)
Cada execução precisa ser feita durante a noite para ser considerada bem-sucedida. Isso ajudou, visivelmente. Mas precisamos de mais.
Melhor interface térmica
Quando se trata de montagem de servidores, eu uso a almofada de interface térmica cinza pré-aplicada que vem nos dissipadores de calor. Mas, por tédio e desejo de experimentar, eu …
- Removi o dissipador de calor de cobre.
- Usei álcool isopropílico para limpar a CPU e o dissipador de calor.
- Apliquei o composto térmico “Ceramique” que tenho em mãos, usando um padrão em forma de X.
Eu não esperava nenhuma mudança, mas para minha surpresa com a nova TIM aplicada levou 5 vezes mais tempo para atingir as temperaturas do acelerador com mprime threads=6. Antes, ele se acelerava termicamente em um minuto após o início do teste e, depois, levou cerca de 10 minutos para atingir a mesma temperatura de aceleração. A diferença foi perceptível.
Esse é um resultado surpreendentemente bom e nos diz que a gosma cinza padrão que vem pré-instalada nos dissipadores de calor… não é boa. Por este teste de 2011, a diferença entre os piores e os melhores compostos térmicos é de 4,3°C.
Mas, como Dan observou corajosamente uma vez enquanto testava o Vegemite como material de interface térmica:
Se o seu PC é tão marginal que uma CPU funcionando três ou quatro graus Celsius mais quente o fará travar [or, for modern CPUs, cause the processor to auto-throttle itself and substantially reduce system performance]a solução não é tentar se afastar do precipício com um composto térmico melhor. É fazer uma grande mudança no sistema de resfriamento ou simplesmente diminuir a velocidade do clock.
Uma interface térmica aprimorada só leva o senhor até lá mais rápido (ou mais lento); ele não resolve o problema subjacente. Portanto, ainda não terminamos aqui.
Fluxo de ar canalizado
A maioria dos gabinetes SuperMicro que usei, mas não todos, incluiu um duto/cobertura de ventoinha básico que fica entre as ventoinhas centrais e o sistema. Como as ventoinhas do gabinete ficam praticamente na frente da CPU, incluí o shroud nas montagens por uma questão de completude, mais do que por qualquer convicção de que ele estivesse fazendo algo pelo desempenho do resfriamento.
No entanto, esse gabinete de servidor em particular tinha não inclui um duto de ventilação. Não pensei muito sobre isso na época, mas considerando o estresse térmico que essa CPU de 6 núcleos e sua geração de calor de 250 watts estavam causando em nossa construção de 1U, decidi que deveria construir um duto rápido com cartolina e testá-lo.
(Eu sei, eu sei, é um duto muito malfeito, mas eu estava criando um protótipo).
Com certeza, esse duto, combinado com as alterações anteriores no dissipador de calor e no TIM, permitiu que o servidor permanecesse estável durante a noite com uma execução completa do MPrime de 12 threads.
Acho que certamente demonstramos o valor surpreendente (pelo menos para mim) dos fan shrouds. Mas antes de ficarmos muito animados, vamos considerar um último aspecto.
Defina “CPU Load” (carga da CPU)
Às vezes, o usuário fica tão envolvido com a solução do problema que se esquece de considerar se está, de fato, resolvendo o problema. certo problema.
Nesses testes, definimos 100% de carga da CPU usando o MPrime. Algumas pessoas afirmam que o MPrime é mais um vírus de potência do que um teste de carga real, porque ele exerce muita pressão térmica sobre as CPUs. Inicialmente, rejeitei essas alegações, pois uso o MPrime (e seu primo do Windows, o Prime95) há quase 20 anos para testar a estabilidade da CPU, e ele nunca me decepcionou.
Mas eu fiz mais pesquisas e descobri que o MPrime, desde 2011, usa AVX2 amplamente nas CPUs Intel mais recentes:
As versões mais recentes do Prime são carregadas de tal forma que só é seguro executá-las em configurações próximas às de fábrica. Na verdade, os processadores de servidor fazem o downclock quando o AVX2 é detectado para manter sua classificação de TDP. No desktop, temos liberdade para jogar e o que a maioria das pessoas não sabe é a quantidade de corrente que essas rotinas podem gerar. Pode ser letal para uma CPU ver esse nível de corrente por períodos prolongados.
…
É por isso que a maioria dos programas de teste de estresse alterna entre diferentes tipos de padrões de dados. Dependendo da eficácia da rotação e de como esse padrão causa problemas para a margem de tempo do sistema, ele detectará ou não o potencial de instabilidade. Portanto, é aconselhável não se prender a um único tipo de teste.
Isso explica por que vi uma discrepância tão grande entre outros programas de carga da CPU, como o BurnP6 e o MPrime.
O MPrime faz um trabalho incrível ao gerar o tipo de carga de CPU que causa pressão máxima de calor. Mas, a menos que seus servidores consumam regularmente zilhões de instruções AVX2 que consomem muita energia isso pode ser completamente irrepresentativo de qualquer carga do mundo real que o seu servidor teria realmente veria.
Seu próprio inferno pessoal
Isso foi um exagero? Provavelmente sim. Mesmo com o dissipador de calor de alumínio, nenhuma alteração no material da interface térmica e nenhum duto, provavelmente não veríamos nenhum estrangulamento em uso normal em nosso rack de servidor. Mas eu queria ser certeza. Completamente certo.
Isso é extremo? Colocar 140 TDP de calor da CPU em um servidor 1U? Na verdade, não. Nick, do Stack Overflow, me disse que eles acabaram de colocar duas CPUs Xeon 2699v4 de 22 núcleos e 145W de TDP e quatro GPUs de 300W TDP em um único servidor Dell C4130 1U. Eu odiaria estar na sala quando essas ventoinhas girassem. Também tenho um pouco de medo de descobrir o que acontece se o senhor executar o MPrime com carga total da GPU nessa caixa.
Os servidores são um exemplo reconhecidamente raro de grandes compensações de tamanho e calor de desempenho da CPU, um dos poucos que restam. É divertido brincar com os extremos, mas o SoC dentro do seu telefone faz as mesmas compensações em uma escala menor. Pequenos infernos em nossos bolsoscada um deles.
[advertisement] No Stack Overflow, colocamos os desenvolvedores em primeiro lugar. Já o ajudamos a encontrar respostas para suas perguntas difíceis sobre codificação; agora, deixe-nos ajudá-lo encontre seu próximo emprego. |