[RESOLVIDO] Rede Gigabit muito lenta

Iniciado por g4p, 08 de Junho de 2015, 15:26

tópico anterior - próximo tópico

zekkerj

Se ocorrer de novo, olhe nesse comando, se a linha/coluna "Swap/Used" está com valor alto.
Pesquise antes de perguntar, sua dúvida pode já ter sido respondida.
Não respondo dúvidas por MP, coloque sua dúvida no fórum onde ela pode ser pesquisada pelos seus colegas!
Não venha ao fórum apenas para perguntar. Se você sabe a resposta de um problema, porque não ajudar seu colega? ;D

g4p

Aconteceu de novo e o servidor não está com o swap alto.

CitarSwap:         4059         95       3964

Que estranho..

g4p

Observações adicionais e úteis:

Testei a transferência em outro HD, que está sendo compartilhado no mesmo servidor e a taxa de transferência está ótima! Passando os 100mb/s.

Comecei a desconfiar do HD em si, mas é estranho.. Isso começou depois que adicionei 2 HDs no servidor esse final de semana. Apenas isso!

O fato de serem modelos diferentes pode interferir? Não, né?

Todos nosso HD trabalham em 7200RPM.

zekkerj

CitarO fato de serem modelos diferentes pode interferir? Não, né?
Só se estivessem em RAID. Estão?
Pesquise antes de perguntar, sua dúvida pode já ter sido respondida.
Não respondo dúvidas por MP, coloque sua dúvida no fórum onde ela pode ser pesquisada pelos seus colegas!
Não venha ao fórum apenas para perguntar. Se você sabe a resposta de um problema, porque não ajudar seu colega? ;D

g4p

- Já descartei ser problema de rede, visto que um outro HD compartilhado no Samba do mesmo servidor alcança 100mbps.

Vou verificar agora se o problema está no Samba ou no HD, fazendo os seguintes testes:

- Instalar um server de FTP e transferir localmente de alguma estação. Se bater os 100mbps, podemos considerar que o problema está no samba, caso continue bem baixa (10mbps aproximadamente) concluímos que o HD está querendo morrer.

Fiz alguns testes com o hdparm:

O HD que está com a taxa lenta no Samba (e me parece que não só no Samba)

Citar[editora@editora]\ [/var/log/samba] $ sudo hdparm -Tt /dev/sdc

/dev/sdc:
Timing cached reads:   18880 MB in  2.00 seconds = 9447.25 MB/sec
Timing buffered disk reads:  20 MB in  3.12 seconds =   6.40 MB/sec

O HD que testei no mesmo servidor e alcançou 100mb/s:

Citar
[editora@editora]\ [/var/log/samba] $ sudo hdparm -Tt /dev/sdb1
[sudo] password for editora:

/dev/sdb1:
Timing cached reads:   25170 MB in  2.00 seconds = 12597.93 MB/sec
Timing buffered disk reads: 480 MB in  3.00 seconds = 159.91 MB/sec

galactus

g4p, a saída do comando hdparm indica que esse HD está pra lá de Bagdá!    Fez o teste com o smart? Tenha o smartmontools instalado e depois testa aí né!   Faz o teste curto primeiro, se tiver baleado vai mostrar logo. 

Como usuário root:

smartctl -t short /dev/dispositivo

Aguarde 3 minutos e depois execute:

smartctl -H /dev/dispositivo

Para saber se ele passou no teste.

Se quiser resultados detalhados:

smartctl -l selftest /dev/dispositivo

smartctl -a /dev/dispositivo


Você não respondeu a pergunta do zekkerj.  Está em RAID? 
BigLinux no Notebook  / Várias Distros Virtualizadas no PC.

g4p

#21
Respondendo a pergunta do zekkerj: não esta em raid.

Vamos lá.. Fiz o seguinte teste agora:

- Transferi via SCP de uma máquina para o servidor no diretório que está montado o HD e alcançou os 100mbps. Ou seja, podemos descartar problemas no HD?

PORÉM, no teste com o hdparm ele retorna, drasticamente,  diferente, como mostrei no quote anterior.

Perguntas que ficou no ar:

- Por que na transferência via SCP ele envio com uma taxa de transferência NORMAL, igual os outros HDs, enquanto no teste com hdparm ele mostra aquela diferença drástica?

- Pensei na possibilidade de ser problema realmente da configuração do Samba. Mas, e o teste do hdparm, que ele indica essa diferença em relação ao outro HD?

Que mistério! :\

g4p

ATUALIZAÇÕES

1) Ontem quando disse que a transferência para o diretório onde esse HD está montado via FTP foi NORMAL, estava enganado. Foi devido ao HD ter voltado a trabalhar normalmente (ele está assim)

2) Como dito a cima. Há momentos que o HD volta ao normal sozinho e passa a trabalhar normalmente, mesmo o pessoal tudo trabalhando. Nesse caso a taxa de down e up para o diretório desse HD, tanto via FTP como Explorer (samba) é normal.

3) O que pode está causando essa instabilidade no HD? Uma hora ele está trabalhando bem, outra hora ele fica lento? Levando em consideração que a maior parte do tempo ele está lento em down e up.

Perguntas:

- Pode ser a quantidade de usuários trabalhando em cima deles? obs: Antes não era assim!
- Pode ser alguma máquina com problema enviando pacotes indevidos?
- Pode ser o HD fragmentado?

g4p

Segue o teste que o galactus pediu:

Citar[editora@editora]\ [~] $ sudo smartctl -t short /dev/sdc
[sudo] password for editora:
smartctl 6.2 2013-04-20 r3812 [x86_64-linux-3.11.0-12-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION ===
Sending command: "Execute SMART Short self-test routine immediately in off-line mode".
Drive command "Execute SMART Short self-test routine immediately in off-line mode" successful.
Testing has begun.
Please wait 1 minutes for test to complete.
Test will complete after Sat Jun 13 14:43:47 2015

Use smartctl -X to abort test.

Citar[editora@editora]\ [~] $ sudo smartctl -l selftest /dev/sdc
smartctl 6.2 2013-04-20 r3812 [x86_64-linux-3.11.0-12-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Self-test routine in progress 10%     11751         -

Citar[editora@editora]\ [~] $ sudo smartctl -H /dev/sdc
smartctl 6.2 2013-04-20 r3812 [x86_64-linux-3.11.0-12-generic] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

zekkerj

Olá g4p,
Parece que esse teu HD tá subindo o telhado. Programe-se para substituí-lo.
Pesquise antes de perguntar, sua dúvida pode já ter sido respondida.
Não respondo dúvidas por MP, coloque sua dúvida no fórum onde ela pode ser pesquisada pelos seus colegas!
Não venha ao fórum apenas para perguntar. Se você sabe a resposta de um problema, porque não ajudar seu colega? ;D

g4p

Citação de: zekkerj online 15 de Junho de 2015, 14:48
Olá g4p,
Parece que esse teu HD tá subindo o telhado. Programe-se para substituí-lo.

Zekkerj, faz sentido a taxa de transferência reduzi quando há varias conexões em cima dele, caso ele esteja ruim, mesmo?

Cheguei a desconfiar do HD também..

g4p

Programei hoje, após o expediente para trocar a entrada SATA do HD no servidor.

Caso isso não resolva, vou inseri outro HD, meter o rsync e testar.

g4p

#27
Bom dia!

Olhem isso:

Citar[editora@editora]\ [~] $ sudo hdparm -Tt /dev/sdb
[sudo] password for editora:

/dev/sdb:
Timing cached reads:   27336 MB in  2.00 seconds = 13682.93 MB/sec
Timing buffered disk reads: 546 MB in  3.00 seconds = 181.73 MB/sec

Comparem com o que eu havia mandado antes:

Citar[editora@editora]\ [/var/log/samba] $ sudo hdparm -Tt /dev/sdc

/dev/sdc:
Timing cached reads:   18880 MB in  2.00 seconds = 9447.25 MB/sec
Timing buffered disk reads:  20 MB in  3.12 seconds =   6.40 MB/sec

Depois de testar TUDO, desde rede até desempenho do servidor: usei iperf, htop, iotop, hdparm, acompanhei o syslog, smblog, sniffei a rede pra verificar algum pacote estranho.. e nada de uma luz no final do túnel. Até.. que decidi remover o HD e trocar a entrada SATA na controladora. Nessa ocasião aproveitei pra pincelar todo o HD, inclusive os conectores, tanto do HD como da controladora. E.. quando ligo o servidor e faço o teste dou de cara com essa mudança drástica. :D

Surge a pergunta: Poeira realmente faz tanto estrago assim? Essa me surpreendeu.. o.o

Acredito que agora está tudo sobre conformes. Vou esperar o final do dia pra vê o desempenho e volto aqui pra dizer a vocês se realmente resolveu.

galactus

CitarAté.. que decidi remover o HD e trocar a entrada SATA na controladora.

Você trocou a porta SATA do HD? É isso? Se foi isso o que você fez taí seu problema.  Nem todas as portas SATA de uma placa mãe são nativas do Chipset!   Você sestá com todas as portas ocupadas? Já tive problemas com portas SATA não nativas, o desempenho é pior, mas nunca tinha visto uma diferença tão grande assim! 
BigLinux no Notebook  / Várias Distros Virtualizadas no PC.

g4p

#29
Citação de: galactus online 17 de Junho de 2015, 14:37
CitarAté.. que decidi remover o HD e trocar a entrada SATA na controladora.

Você trocou a porta SATA do HD? É isso? Se foi isso o que você fez taí seu problema.  Nem todas as portas SATA de uma placa mãe são nativas do Chipset!   Você sestá com todas as portas ocupadas? Já tive problemas com portas SATA não nativas, o desempenho é pior, mas nunca tinha visto uma diferença tão grande assim!

Sim, isso galactus. Mas, antes eu limpei os conectores, tanto do HD como da controladora do servidor. Descarto a possibilidade ser pelo fato da porta SATA não dispor o mesmo desempenho que outras, pois TODOS HDs agora estão trabalhando normalmente como mostro nos logs a baixo. Ah, e isso só aconteceu após ser adicionado 2 HDs na controladora, pois antes o HD ficava na mesma PORTA SATA e sempre trabalhou normal.

Como cheguei a essa conclusão?

Ta aqui o teste com hdpam do HD que foi para a tal porta SATA:

Citar
/dev/sdc:
Timing cached reads:   26462 MB in  2.00 seconds = 13245.20 MB/sec
Timing buffered disk reads: 482 MB in  3.00 seconds = 160.41 MB/sec

Restantes dos HDs:

Citar
/dev/sdb:
Timing cached reads:   26588 MB in  2.00 seconds = 13308.58 MB/sec
Timing buffered disk reads: 582 MB in  3.00 seconds = 193.78 MB/sec

Citar
/dev/sdd:
Timing cached reads:   26712 MB in  2.00 seconds = 13371.20 MB/sec
Timing buffered disk reads: 470 MB in  3.00 seconds = 156.62 MB/sec

Informações do HD:

Citar
[editora@editora]\ [~] $ sudo hdparm -i /dev/sdb

/dev/sdb:

Model=ST3000DM001-1CH166, FwRev=CC27, SerialNo=Z1F3ZPC8
Config={ HardSect NotMFM HdSw>15uSec Fixed DTR>10Mbs RotSpdTol>.5% }
RawCHS=16383/16/63, TrkSize=0, SectSize=0, ECCbytes=4
BuffType=unknown, BuffSize=unknown, MaxMultSect=16, MultSect=8
CurCHS=16383/16/63, CurSects=16514064, LBA=yes, LBAsects=5860533168
IORDY=on/off, tPIO={min:120,w/IORDY:120}, tDMA={min:120,rec:120}
PIO modes:  pio0 pio1 pio2 pio3 pio4
DMA modes:  mdma0 mdma1 mdma2
UDMA modes: udma0 udma1 udma2 udma3 udma4 udma5 *udma6
AdvancedPM=yes: unknown setting WriteCache=disabled
Drive conforms to: Reserved:  ATA/ATAPI-4,5,6,7

Citar
[editora@editora]\ [~] $ sudo hdparm -i /dev/sdc

/dev/sdc:

Model=Hitachi HDS723030ALA640, FwRev=MKAOA5C0, SerialNo=MK0301YHGWRW3A
Config={ HardSect NotMFM HdSw>15uSec Fixed DTR>10Mbs }
RawCHS=16383/16/63, TrkSize=0, SectSize=0, ECCbytes=56
BuffType=DualPortCache, BuffSize=unknown, MaxMultSect=16, MultSect=8
CurCHS=16383/16/63, CurSects=16514064, LBA=yes, LBAsects=5860533168
IORDY=on/off, tPIO={min:120,w/IORDY:120}, tDMA={min:120,rec:120}
PIO modes:  pio0 pio1 pio2 pio3 pio4
DMA modes:  mdma0 mdma1 mdma2
UDMA modes: udma0 udma1 udma2 udma3 udma4 udma5 *udma6
AdvancedPM=yes: disabled (255) WriteCache=disabled
Drive conforms to: unknown:  ATA/ATAPI-2,3,4,5,6,7

Citar
[editora@editora]\ [~] $ sudo hdparm -i /dev/sdd

/dev/sdd:

Model=Hitachi HDS723030ALA640, FwRev=MKAOA5C0, SerialNo=MK0301YHGSPVDA
Config={ HardSect NotMFM HdSw>15uSec Fixed DTR>10Mbs }
RawCHS=16383/16/63, TrkSize=0, SectSize=0, ECCbytes=56
BuffType=DualPortCache, BuffSize=unknown, MaxMultSect=16, MultSect=8
CurCHS=16383/16/63, CurSects=16514064, LBA=yes, LBAsects=5860533168
IORDY=on/off, tPIO={min:120,w/IORDY:120}, tDMA={min:120,rec:120}
PIO modes:  pio0 pio1 pio2 pio3 pio4
DMA modes:  mdma0 mdma1 mdma2
UDMA modes: udma0 udma1 udma2 udma3 udma4 udma5 *udma6
AdvancedPM=yes: disabled (255) WriteCache=disabled
Drive conforms to: unknown:  ATA/ATAPI-2,3,4,5,6,7

Se perceber, o que estava apresentando problemas de lentidão é o que está com melhor desempenho agora.

Bom, dou como problema resolvido e fica aí o registro para futuras consultas de quem passar pelo mesmo problemas. Obrigado pela ajuda zekkerj e galactus.

Tamos aí, abraço!