Servidor intermitente - Resolvido!

Iniciado por erj001, 02 de Dezembro de 2014, 14:27

tópico anterior - próximo tópico

erj001

Boa tarde, tenho um servidor com a versão 14.04 e desde a semana passada ele está intermitente, os usuários (samba) reclamam que a conexão cai frequentemente e acabam perdendo trabalhos.
Já verifiquei cabos, conexões e parece que tudo está normal.
Há algum log onde possa ficar registrado a razão dessa intermitência?
Agradeço qualquer ajuda, pois estou com muita urgência em resolver esse problema.
Obrigado
Edison

erj001

obs: esse servidor está rodando há mais de 3 meses, e esse problema só apareceu agora.

corumbams

De uma olha no consumo deste servidor digitando.

top

ou apt-get install htop

htop

Veja CPU , LOAD e etc.

Citação de: erj001 online 02 de Dezembro de 2014, 14:28
obs: esse servidor está rodando há mais de 3 meses, e esse problema só apareceu agora.

erj001

Corumbans

O consumo é super baixo, é um dual core com 4 Gb de ram e tem apenas 6 usuários usando compartilhamento samba.
Nenhum outro serviço está habilitado. Nem mesmo o CUPS, pois minha impressora tem placa de servidor. Só tenho o servidor para compartilhamento local.
Aqui tem uma cópia do TOP:
http://www.corrosionx.com.br/transporte/imagem.jpg

Obrigado

Edison

erj001

inseri os logs do samba. quem sabe ajuda a identificar algo.
Infelizmente não sei como interpretar.
http://www.corrosionx.com.br/transporte/log.rar

galactus

Assumindo que você não tem nenhum problema de hardware, seria a primeira coisa que eu verificaria, já que você afirma que tudo funcionava bem por 3 meses e "do nada" começou a cair.....

Esse problema passou a ocorrer depois de alguma atualização do sistema? Alguma coisa na sua configuração da rede foi alterada? Software ou hardware?

Falta você ajudar a gente também, cade sua configuração da rede? Tem servidor DHCP? IP fixo? As outras máquinas rodam que Windows? E etc, etc, e tal!
BigLinux no Notebook  / Várias Distros Virtualizadas no PC.

erj001

Galactus

Não sei como identificar se é um problema de hardware, há algum log que possa dar uma pista?
Não houveram atualizações, após começar a dar problema, eu fiz um update, mas o problema persiste. Nada foi alterado (hardware ou software). Eu instalo o sistema e esqueço. Comprei essa placa (ASUS) apenas para esse fim, tem menos de 6 meses de uso.
Tenho um outro servidor mais básico que uso para instalar ftp e outras coisas. Mas o servidor de arquivos é basicão mesmo. Nem instalei nenhum, serviço tipo no-ip. Eu criei um script que envia o IP para um site no formato html para que eu possa fazer acesso por ssh, e só.
O DHCP uso do roteador, programei o roteador para sempre fornecer o mesmo IP (192.168.0.111) para o MAC:ADDR do servidor.
Os usuários rodam XP ou Windows 7, e só. Há também 2 Macs, mas raramente são utilizados.
Há algum teste de hardware que você conheça que possa testar a máquina?
Obrigado e um abraço
Edison

druidaobelix

Olá erj001,

Topologia, infraestrutura e configuração da rede são essenciais para começar a entender o problema, sem o que fica muito difícil imaginar o que se passa aí.

Há algum parâmetro deadtime estabelecido no servidor da rede, chegou a verificar isso?
As estações normalmente estão configuradas para auto-reconnect, elas estão mesmo?

Pelo seu relato parece que todos os clientes são máquinas Windows.
Não se deve automaticamente presumir que o problema esteja no servidor, pode estar nas estações.
Algumas espécies de vírus podem ocasionar intermitência na conexão e podem se espalhar pela rede.
Há proteção antivírus adequada para as estações?

Existe alguma possibilidade de colocar uma máquina cliente Linux nessa rede para efeitos de teste e comparação?

Uma simples menção de intermitência é algo muito genérico, que pode ser, por exemplo, um defeito no roteador dentre várias outras causas, assim, a análise requer que se vá esmiuçando passo a passo a questão.

www.arredondar.org.br
Vencedor Desafio de Impacto Social Google 2016!
Você também pode participar e fazer a diferença.

erj001

Gostaria de inicialmente me certificar que o hardware está bom.
Você conhecem algum teste confiável?
Obrigado
Edison

druidaobelix

O Ubuntu desktop tem um teste embarcado que é o checkbox, identificado nos ícones como 'System Testing'.

Tem uma interface gráfica instalada (checkbox-gui), não sei dizer se isso vem por padrão instalado também no server.
Deve ser possível instalar pelo apt, questão de ver, e é possível usar apenas pela linha de comando.

Ele possui um módulo para certification-server, mas não tenho maiores detalhes sobre isso, precisa ver mais a fundo.

https://launchpad.net/ubuntu/+source/checkbox

Verifique ainda o Inquisitor, que possui um live (é melhor para uso)  e uma versão enterprise.

http://www.inquisitor.ru/doc/tests/index.html

Veja ainda o Ultimate

http://www.rarst.net/software/ultimate-boot-cd/

Entenda que muito frequentemente esses testes de hardware não irão levá-lo a nada, não descartam realmente de forma absoluta um problema de hardware, embora possam pegar alguma coisa, mas de toda forma não custa tentar.
www.arredondar.org.br
Vencedor Desafio de Impacto Social Google 2016!
Você também pode participar e fazer a diferença.

druidaobelix

#10
O mais imediato teste de hardware que você deve fazer é substituir o seu roteador.

Sua rede é pequena, entendi que são apenas 6 estações, suponho que o seu roteador não seja algo extremamente sofisticado e caro.

De toda forma, por questão de bom senso e segurança mínima, qualquer instalação profissional que precisa de fato estar sempre operante precisa ter um roteador sobressalente, sobremais quando se trata de peça comum, de baixo custo, pois é inadmissível que uma peça dessa dê defeito num final de semana e não seja possível fazer nada à respeito.

www.arredondar.org.br
Vencedor Desafio de Impacto Social Google 2016!
Você também pode participar e fazer a diferença.

druidaobelix

Complementando quanto ao checkbox, caso ja nao venha instalado:

Instala a base do pacote,  back end:

sudo apt-get install checkbox-ng

Instala a interface grafica:

sudo apt-get install checkbox-gui


www.arredondar.org.br
Vencedor Desafio de Impacto Social Google 2016!
Você também pode participar e fazer a diferença.

erj001

Druida
Tenho um roteador e um switch na rede, caso eu desligue o roteador, o servidor continua atendendo as estações, pois elas estão conectadas no switch, e do switch vai um cabo para uma das portas do roteador.
Assim mesmo você acha que o roteador pode estar atrapalhando algo? Ele é usado apenas para acesso na internet. Achei que ele não ia interferir.
Obrigado

druidaobelix

Parece que li em algum canto aí acima que está usando o DHCP do roteador, não é isso?
Se for, ele pode estar interferindo.

Veja se consegue definir melhor o que os 'clientes' estão reclamando.
Reclamam de queda da conexão em que situação?
Estão fazendo mais exatamente o quê quando isso acontece?
Em toda situação? Em algum acesso específico? Em algum software específico?

Veja como é importante descrever a topologia (que tipo: anel, estrela, barramento ? quem está ligado em quem?) e a infraestrutura da rede: está melhorando, agora já sabemos que você tem um switch. :-)

O switch é gerenciavel, se sim está monitorando as portas ?

Para casos de intermitência não deixe de verificar:

Conflito de IP's?
Veja se tem algum equipamento da rede usando o mesmo IP.

MAC duplicado?


www.arredondar.org.br
Vencedor Desafio de Impacto Social Google 2016!
Você também pode participar e fazer a diferença.

erj001

Druida,

Seguindo suas sugestões, acabo de fazer a seguinte modificação. Coloquei algumas máquinas com IP fixo, para não dependerem do DHCP.
Como atribuo à cada máquina um número único, usei esse número, vai de 20 até 48 (há saltos, não tenho tudo isso de micros) e configurei o roteador para fornecer endereços acima de 50.

Aparentemente resolveu, mas amanhã com os usuários no ar, vou saber melhor e depois posto por aqui.

Respondendo suas perguntas, os usuários abrem arquivos da rede (ou estão copiando alguma coisa de/para a rede) e de repente recebem uma mensagem de erro, o servidor fica fora do ar por alguns segundos e depois volta, mas até aí já perderam o trabalho.

O switch não estou certo se é gerenciável, vou ver o modelo. Isso responde se estou monitorando, hehehe.

Conflito de ip: acho difícil, pois não mudei nada na rede e o problema começou a aparecer, e como estou usando DHCP achei que não teria esse problema. Fui ingênuo??

MAC duplicado: nunca imaginei que isso pudesse acontecer.

amanhã vou ver com todos no ar e veremos o que acontece.

Muuuito obrigado pela ajuda e vou manter você informado.

Abraços

Edison