Construção de um Cluster com Ubuntu

Iniciado por glaucio, 02 de Dezembro de 2006, 12:11

tópico anterior - próximo tópico

glaucio

Olá a todos
Estou enfrentando problemas na configuraçãode um Cluster. Já montei vários com Mandrake, Fedora e recentemente UBUNTU seguindo o Livro Construindo Superconputadores com linux do Marcos Pitanga. MAs pela primeira vez estou com uma máquina com UBUNTU que não aceita conehão por nome, dando a mensagem: rsh: nome.dominio: Temporary failure in name resolution.

Os arquivos basicos de configuração para montar um paralelo são: hosts, hosts.equiv, .rhosts
Fazendo a configuração do /etc/hosts como

127.0.0.1 localhosts.localdomain localhosts
192.168.100.001 mestre.dominio mestre
192.168.100.001 escravo.dominio escravo

Eu sempre consegui fazer a conexão correta, mas nesta maquina qualquer comando ssh, rsh, rlogin só estão funcionando com o IP.

Por favor Alguem pode me ajudar

Obrigado

Glaucio

KurtKraut

Aloha,


Acho que no ubuntuforums.org você terá mais chance de cruzar com alguém que esteja trabalhando com o Ubuntu em clusters. Ele tem sido usado bastante nessa modalidade como, por exemplo, o pessoal da área de saúde da Universidade de Harvard.

Abraços,


Kurt Kraut

glaucio

Na realidade minha dúvida não é na construção do Cluster, eu já coloquei na faculdade 4 maquinas operando o paralelo. O Problema Real é que comprei duas placas a7n8x-xe revitalizar duas maquinas de outro cluster. Em uma tudo funcionou corretamente, mas na OUTRA a rede só funciona com IP por número, não reconhecendo o comando pelo host. Assim, Qualquer programa que user o host da máquina para conexão retorna com erro de não reconhecer o nome.
Parece que UBUNTU nesta maquina não reconhece o arquivo hosts corretamente.

SERÁ QUE ISTO É PROBLEMA DE HARDWERE?

Fiz a istalação do FEDORA nesta maquina e o mesmo problema ocorreu.
Nunca me deparei com tal problema, Aguém pode me ajudar.

KurtKraut

Aloha,


Mude o título do assunto do seu post já que o problema não envolve questões técnicas de clusters e sim de rede & hardware. Mudando o título, você tem mais chance de ser lido por alguém que já passou por esse problema e suspeita de uma solução.

glaucio

ATENÇÃO:  EXISTEM DIFERENÇAS NA INSTALAÇÃO DO UBUNTU 6.06.1 DESKTOP e SERVIDOR no que diz respeito a rede ssh e rsh. EU CONSEGUI FAZER A REDE FUNCIONAR COM A INSTALAÇÂO SERVIDOR. PROVAVELMENTE EXISTEM FALHAS NA VERSÃO DESKTOP na DEFINIÇÃO DO HOSTNAME. A VERSÃO SERVIDOR FUNCIONA CORRETAMENTE.

KurtKraut

Aloha,

Primeiro, obrigado pelo aviso. Segundo, não use capslock por favor. Por fim, nos dê detalhes sobre os sintomas que teve e como resolveu aparentemente para checarmos se há um bug mesmo.

glaucio

Bom então desculpe pelo caps lock, foi no momento da descoberta. ;D. A princípio toda vez que instalava  o ubuntu desktop 6.06.1 e o utilizava na rede local, por exemplo rsh nome ou ssh nome, existia o retorno dizendo que havia uma falha temporária no nome. Mas quando usava o IP tudo funcionava. Mais curioso foi que tenho outros dois PCs, um com a placa A7N8X-Xe e A7N8X-X que funcionam corretamente com esta versão e possuem o mesmo sistema hardware para rede. Estava achando que eu tinha um problema na placa, mas meu orientador me alertou que existem diferenças entre versões desktop e servidor que poderiam causar este problema. Assim, em outro HD istale a versão servidor. A diferença foi que de imediato ele configurou a rede com IP fixo, nome da maquina, SEM SERVIDOR DE DNS,etc... enquanto no desktop isto só é realizado pós-instalação. Aí veio a surpresa, quando dei o comando ssh nome tudo funcionou. Bom então fui investigar o arquivo /etc/hosts  e verifiquei que na versão SERVER estava da seguinte forma

127.0.0.1   localhost
192.168.100.2  nome

Mas na versão desktop

127.0.0.1  localhost
127.0.1.1  nome
192.168.100.2  nome

A princípio a versão desktop não consegue operar se eu configuro sem a segunda linha e toda vez que retorno ao ele faz o seguinte:

127.0.0.1  localhost  nome
192.168.100.2  nome

Não sei como nem porque isto ocorre, mas também ocorre nos PCs que funcionam.

Fui verificar se havia mais alguma diferença marcante. A principio não. Até quando uso o NETWORK TOOlS para rastrear rotas o PC não consegue reconhecer o nome.

Será que esta falha pode estar ligado a alguma deficiencia no driver sa NVIDIA para linux que atende a esta placa? E que esteja dando algum problema na rede?

Fica ai o alerta.

glaucio

Agradeço a atenção, mas já consegui resolver o problema. A solução foi algo absurda, mas fica para que enfrentar:

Os PC que eu fiz o Cluster são com placas A7N8X-XE, a princípio eu precisava usar servidor e cliente RSH, é o mais facil de operar nestes casos, já é um receita bem estabelecida. Mas ai vem o problema. Com as duas maquinas instaladas UBUNTU-Desk e configuradas e permitindo ping entre elas tudo estaria funcionando. MAS em uma das maquinas ao usar "RSH ou SSH nomedamaquinaescravo" a resposta era uma falha temporária na resolução dos nomes. Isto foi um problema sério pois ela só aceitava conexão pelo IP.
Bom, depois de instalar outras distribuições como KUBUNTU, XUBUNTU, FEDORA CORE 3 (que não reconheceu minha placa de rede onboard), KURUMIM 7, fiz o que poderia ser idiota. Instalei o CD server do UBUNTU dapper e configurei a rede na instalação como é o processo padrão: IP fixo, nome da maquina, mas sem servidor de DNS. Ai tudo funcionou corretamente. MAs outro problema apareceu, O RSH não funcionava sem senha mesmo configurado. Também o ssh não funcionava sem senha mesmo configurado com a chave pública.  O mais intrigante é que tudo funcionava com uma terceira maquina FC3 que era uma maquina mais antiga que eu tenho.  Verificando os Pacotes ache uma versão RHS-redone que indicava estar corrigida para estes problemas. Instalei a versão servidor e cliente. Ai a coisa piorou, o rsh nem comandava. Mas verifique que a versão servidor estava OK. Então só desintale a versão cliente do redone e instale a versão anterior, mantendo a servidor. Ai tudo funcionou.
Outra Curiosidade é que na maquina em que a versão UBUNT- desktop funcionanava tentei colocar a versão servidor, mas novamente problema. Ela acusou um erro o MAC da placa e não inicializa a rede, mas na versão Desktop tudo funciona.

Mas FELIZMENTE o RSH funcionando já me permite trabalhar. MAS fica o AVISO. O UBUNTU TEM PROBLEMAS SÉRIO NOS ARQUIVOS DE CONFIGURAÇÂO RSH E SSH QUE PRECISÃO SER CORRIGIDOS. NÂO SEI o PORQUE DISTO mas mesmo sendo um dos melhores sistemas que já trabalhei isto é ainda um ponto critico que precisa de atenção dos desenvolvedores. Esta falha no RSH também ocorreu em outros PCs em que instale outro cluster.

Agradeço a atenção

Glaucio