This is an old revision of the document!
Table of Contents
Servidores de processamento
Existem diversos grupos de pesquisa que dispõem de recurso próprio para processamento. O objetivo deste artigo não é descrever completamente a infraestrutura de processamento do IME, mas descrever a infraestrutura de processamento disponível para toda a comunidade do IME.
Contamos com quatro servidores de processamento: brucutu, brucutuiv, brucutuv e brucutuvi. Todos os servidores operam com o sistema Debian GNU/Linux na versão estável. O acesso a tais servidores é remoto se dá a partir do protocolo SSH.
Configuração
As configurações simplificadas de hardware dos computadores são as seguintes:
servidor | processador | núcleos | memória RAM | coprocessador |
---|---|---|---|---|
brucutu | 2x Intel Xeon E5645 | 12 | 216GB | N/A |
brucutuiv | 2x Intel Xeon E5-2650 v4 | 24 | 384GB | Nvidia Tesla K40 |
brucutuv | 2x Intel Xeon Gold 6148 | 40 | 512GB | N/A |
brucutuvi | 2x Intel Xeon Gold 6148 | 40 | 512GB | Nvidia Tesla V100 |
Atentamos que todos os processadores contam com hyperthreading de tal sorte que a quantidade efetiva linhas de processamento é o dobro do número de núcleos.
Boas práticas
- Utilizar o comando screen como sugerido
- Se o seu programa utiliza muito escrita ou leitura em disco ou precisa de muito espaço, copie os arquivos localmente no servidor, criando uma pasta para você no /var/tmp (no caso da brucutu) ou em /var/tmp, /var/fasttmp ou /tmp (no caso da BrucutuIV, conforme sua necessidade). Essas áreas não possuem cota de disco, mas podem ser periodicamente apagadas
- Faça o seu código de forma que em caso de queda de energia ou travamento do servidor, o seu processo possa reiniciar e continuar o processamento a partir de um ponto definido por você (checkpoint). São poucas as vezes que o servidor travou ou a energia caiu, mas nesses casos é bom estar prevenido sempre com um código bem escrito para não perder tempo recomeçando do zero.
- Não temos restrições de quanto processador/disco/memória/rede cada usuário pode utilizar, mas nem por isso você pode utilizar todos os recursos só para você. Seja gentil com as pessoas e, caso seu processo seja muito pesado em algum recurso, utilize o “nice” no seu processo, para que outros usuários não tenham problemas com os processos deles.