[Reaberto] Ubuntu 12.04 desligando e religando sozinho.

Iniciado por giovanni94, 10 de Outubro de 2012, 23:03

tópico anterior - próximo tópico

giovanni94

Olá pessoal,

Faz alguns meses que tenho o Ubuntu 12.04 em meu PC novo...
O problema é que, raramente mas ocorre, meu computador desliga do nada e fica alguns segundos desligado até "ressucitar".
Todas as luzes apagam, a do HD, a do botão de energia... Todas...
E então, passa uns 3 segundos e o computador religa mostrando a bios e iniciando o ubuntu novamente, sem eu encostar em nada.

Aqui vão algumas configurações:

Processador: Intel i5-2310 @ 2.9GHz
Vídeo: Intel HD Graphics 2000 (Sandy Bridge)
Som: Intel HDA
Placa-mãe/Chipset: Intel H61
8Gb RAM

Quando eu usava win7 nunca ocorreu este problema, nem no Mint que eu me lembre.
É importante dizer que estou usando o Ubuntu de um jeito meio hardcore, assim como fazia no win7... Servidor de minecraft ao mesmo tempo que assisto uns vídeos e deixo o Steam atualizando umas coisas, nautilus aberto e por aí vai. Porém não era pra acontecer isso, já que meu hardware aguenta tranquilamente e os CPUs quase nunca passam de 40% e a RAM de 2Gb em uso.

Como eu disse, isso acontece raramente... Tenho o computador a uns 6 meses e isso ocorreu umas 6 vezes no máximo.
Umas 2 vezes aconteceu isso quando eu desligava o servidor de minecraft. Hoje aconteceu de eu instalar o steam, esperar atualizar até dar isso...

O que será que pode ser? Alguém com conhecimento a me dar uma força?
Bug de kernel? Superaquecimento? (o que eu duvido, já que meu hardware não é muito exigente e o computador sempre está frio ao tato).

Obrigado desde já!

giovanni94

#1
Problema resolvido!

Fui no arquivo syslog e percebi que estava acusando super-aquecimento.
Instalei o programa sensors e, na área de trabalho sem fazer nada, a temperatura estava em 70ºC.

Dei uma olhada no cooler do processador e percebi que estava cheio de pó, mas muito pó...
O que foi estranho já que meu PC é novo. O problema é que aqui em casa junta muito pó e não sei o motivo, sempre foi assim.
Abri o PC e com aspirador, cotonete e depois secador frio consegui tirar a sujeira, que saia aos tufos.

Agora a temperatura normal está em 30ºC. (:

giovanni94

Desculpem por reabrir o tópico, achei que o problema tinha parado.
Ficou alguns dias sem esse problema e, no entanto, hoje voltou a reiniciar...

Com a limpeza, a performance da GPU e a temperatura deram uma melhorada...

Um fato importante: Toda vez que eu ligo o PC aparece uma mensagem de erro... E normalmente é sobre o pacote de drivers Mesa.
Alguem saberia o que pode ser? Não estou nem um pouco a fim de formatar o computador novamente... Estou com muita coisa nele.

Obrigado desde já.

jkmsjq

Citação de: giovanni94 online 14 de Outubro de 2012, 15:17

[...]

Um fato importante: Toda vez que eu ligo o PC aparece uma mensagem de erro... E normalmente é sobre o pacote de drivers Mesa.
[...]

Se você postasse a mensagem completa como aparece fica mais fácil o Fórum pode ajudar, não acha?
LinuxUser: 548942 / Dando um tópico como resolvido
"A verdade só é agressiva a quem vive de mentiras". Autor desconhecido.
Twitter: @jeisonkertesz

giovanni94

Citação de: jkmsjq online 14 de Outubro de 2012, 16:48
Citação de: giovanni94 online 14 de Outubro de 2012, 15:17

[...]

Um fato importante: Toda vez que eu ligo o PC aparece uma mensagem de erro... E normalmente é sobre algum pacote relatado a GPU.
[...]


Se você postasse a mensagem completa como aparece fica mais fácil o Fórum pode ajudar, não acha?

Seguinte: Eu não sei se essa mensagem de erro tem a ver com desligar o computador "do nada". Mas os dois problemas começaram, se eu não me engano, quase nos mesmos dias.

Primeiro aparece "O sistema detectou um problema no aplicativo."

Então eu clico em relatar o problema... Vem a segunda mensagem:

"Desculpe, o Ubuntu 12.04 apresentou um erro interno".
Aí eu clico em mostrar detalhes, e aparece:

usr/share/apport/apport-gpu-error-intel.py
package:
xserver-xorg-video-intel
problemtype:
crash

Entrei no arquivo /usr/share/apport/apport-gpu-error-intel.py
E aqui está tudo o que está contido no arquivo:

Citar#!/usr/bin/python

import os
import os.path
import sys
import re
import datetime

from apport.hookutils import *

from apport import unicode_gettext as _

pci_devices = [
    { 'name':'i810',        're':'(8086:7121)',        'supported':False },
    { 'name':'i810dc',      're':'(8086:7123)',        'supported':False },
    { 'name':'i810e',       're':'(8086:7125)',        'supported':False },
    { 'name':'i815',        're':'(8086:1132|82815)',  'supported':False },
    { 'name':'i830',        're':'(8086:3577|82830)',  'supported':False },
    { 'name':'i845',        're':'(8086:2562|82845G)', 'supported':False },
    { 'name':'i855',        're':'(8086:3582|855GM)',  'supported':False },
    { 'name':'i865',        're':'(8086:2572|82865G)', 'supported':False },
    { 'name':'i915g',       're':'(8086:2582)'       },
    { 'name':'i915gm',      're':'(8086:2592|915GM)' },
    { 'name':'e7221',       're':'(8086:258a)',        'supported':False },
    { 'name':'i945g',       're':'(8086:2772|945G[ \/]|82945G[ \/])' },
    { 'name':'i945gm',      're':'(8086:27a2|945GM[ \/]|82945GM[ \/])' },
    { 'name':'i945gme',     're':'(8086:27ae|945GME|82945GME)' },
    { 'name':'IGDg',        're':'(8086:a001)' },
    { 'name':'IGDgm',       're':'(8086:a011)' },
    { 'name':'pineviewg',   're':'(8086:a001)' },
    { 'name':'pineviewgm',  're':'(8086:a011)' },
    { 'name':'i946gz',      're':'(8086:2972|82946GZ)' },
    { 'name':'g35',         're':'(8086:2982|82G35)' },
    { 'name':'i965q',       're':'(8086:2992|Q965)' },
    { 'name':'i965g',       're':'(8086:29a2|G965)' },
    { 'name':'g33',         're':'(8086:29c2|82G33)' },
    { 'name':'q35',         're':'(8086:29b2)' },
    { 'name':'q33',         're':'(8086:29d2)' },
    { 'name':'i965gm',      're':'(8086:2a02|GM965)' },
    { 'name':'i965gme',     're':'(8086:2a12)' },
    { 'name':'gm45',        're':'(8086:2a42)' },
    { 'name':'IGDeg',       're':'(8086:2e02)' },
    { 'name':'q45',         're':'(8086:2e12)' },
    { 'name':'g45',         're':'(8086:2e22)' },
    { 'name':'g41',         're':'(8086:2e32)' },
    { 'name':'b43',         're':'(8086:2e42)' },
    { 'name':'clarkdale',   're':'(8086:0042)' },
    { 'name':'arrandale',   're':'(8086:0046)' },
    { 'name':'sandybridge-gt1',   're':'(8086:0102)' },
    { 'name':'sandybridge-m-gt1', 're':'(8086:0106)' },
    { 'name':'sandybridge-s',     're':'(8086:010a)' },
    { 'name':'sandybridge-gt2',   're':'(8086:0112)' },
    { 'name':'sandybridge-m-gt2', 're':'(8086:0116)' },
    { 'name':'sandybridge-gt2+',  're':'(8086:0122)' },
    { 'name':'sandybridge-m-gt2+','re':'(8086:0126)' },
    ]
for device in pci_devices:
    device['rc'] = re.compile(device['re'], re.IGNORECASE)

def get_pci_device(text):
    regex_vga = re.compile('VGA compatible controller (.*)', re.IGNORECASE)

    lines = regex_vga.findall(text)
    if len(lines) > 0:
        for l in lines:
            if len(l.strip())>0:
                for device in pci_devices:
                    if device['rc'].search(l.strip()):
                        return device
    return None

def get_signature(text):
    '''Assumes the format of the i915_error_state file'''
    codes = {
        'EIR' :      re.compile("EIR: 0x([0-9a-fA-F]+)"),
        'ESR' :      re.compile("ESR: 0x([0-9a-fA-F]+)"),
        'PGTBL_ER' : re.compile("PGTBL_ER: 0x([0-9a-fA-F]+)"),
        'IPEHR' :    re.compile("IPEHR: 0x([0-9a-fA-F]+)"),
        }
    section = None
    signature = ''

    for line in text.split("\n"):
        if line == 'Blitter command stream:':
            section = 'blitter'
        elif line == 'Video (BSD) command stream:':
            section = 'video'
        elif line == 'Render command stream:':
            section = 'render'
        elif line[:8] == 'Active [':
            section = 'active'
            return signature
        else:
            for k, r in codes.items():
                match = r.search(line)
                if match and match.group(1) != "00000000":
                    if section:
                        signature += " %s.%s: 0x%s" %(section, k, match.group(1))
                    else:
                        signature += " %s: 0x%s" %(k, match.group(1))

    return signature

def main(argv=None):
    if argv is None:
        argv = sys.argv

    if '--force' not in argv:
        from apport.packaging_impl import impl as packaging
        if not packaging.enabled():
            return 2

    import apport.report
    report = apport.report.Report(type='Crash')
    report.setdefault('Tags', '')
    report.setdefault('Title', 'GPU lockup')

    report.add_os_info()
    report.add_proc_info()
    report.add_user_info()

    report['Package'] = 'xserver-xorg-video-intel'
    report['Tags'] += ' freeze'
    report['Lspci'] = command_output(['lspci', '-vvnn'])
    device = get_pci_device(report['Lspci'])
    if device and 'name' in device:
        if '--force' not in argv:
            if 'supported' in device and device['supported'] == False:
                # Unsupported chipset; we don't want bugs reported for this HW
                return 3
        report['Chipset'] = device['name']
        report['Title'] = "[%s] GPU lockup" %(device['name'])

    attach_hardware(report)
    attach_related_packages(report, ["xserver-xorg", "libdrm2", "xserver-xorg-video-intel"])
    attach_file_if_exists(report, '/etc/X11/xorg.conf', 'XorgConf')
    attach_file(report, '/var/log/Xorg.0.log', 'XorgLog')
    attach_file_if_exists(report, '/var/log/Xorg.0.log.old', 'XorgLogOld')
    attach_file_if_exists(report, '/sys/kernel/debug/dri/0/i915_error_state', 'i915_error_state')

    signature = get_signature(report.get('i915_error_state', ''))
    if not signature:
        # Lack of a signature generally indicates an invalid error state, such
        # as a false positive or a '0x000000' (non-)error state.  In either case,
        # the bug won't be upstreamable nor otherwise actionable.
        if '--force' not in argv:
            return 4

    report['Title'] += " " + signature
    report['DuplicateSignature'] = "%s %s" %(report['Title'], report['DistroRelease'])

    nowtime = datetime.datetime.now()
    report_filename = '/var/crash/%s.%s.crash' % (report['Package'], str(nowtime).replace(' ', '_'))

    if '--stdout' in argv:
        print "# %s" %(report_filename)
        report.write(sys.stdout)
        return 0

    report_file = os.fdopen(os.open(report_filename, os.O_WRONLY|os.O_CREAT|os.O_EXCL), 'w')
    os.chmod(report_filename, 0600)

    try:
        report.write(report_file)
    finally:
        report_file.close()
    return 0

if __name__ == '__main__':
    sys.exit(main())


zekkerj

CitarSeguinte: Eu não sei se essa mensagem de erro tem a ver com desligar o computador "do nada". Mas os dois problemas começaram, se eu não me engano, quase nos mesmos dias.

Pode ser que seja o contrário, essa mensagem pode estar aparecendo como resultado de algum desligamento inadequado.
Seria bom se você pudesse ter algum programa traçando um histórico da temperatura dessa cpu, pra vc confirmar se o problema de super-aquecimento continua.

Aliás, se já houve incidentes de super-aquecimento, talvez fosse o caso de vc verificar o estado da pasta térmica da cpu, de repente ela ressecou e perdeu suas propriedades.
Pesquise antes de perguntar, sua dúvida pode já ter sido respondida.
Não respondo dúvidas por MP, coloque sua dúvida no fórum onde ela pode ser pesquisada pelos seus colegas!
Não venha ao fórum apenas para perguntar. Se você sabe a resposta de um problema, porque não ajudar seu colega? ;D

giovanni94

Citação de: zekkerj online 15 de Outubro de 2012, 20:42
CitarSeguinte: Eu não sei se essa mensagem de erro tem a ver com desligar o computador "do nada". Mas os dois problemas começaram, se eu não me engano, quase nos mesmos dias.

Pode ser que seja o contrário, essa mensagem pode estar aparecendo como resultado de algum desligamento inadequado.
Seria bom se você pudesse ter algum programa traçando um histórico da temperatura dessa cpu, pra vc confirmar se o problema de super-aquecimento continua.

Aliás, se já houve incidentes de super-aquecimento, talvez fosse o caso de vc verificar o estado da pasta térmica da cpu, de repente ela ressecou e perdeu suas propriedades.

Tenho o programa "sensors" instalado. Desde que eu limpei o computador a temperatura não passa dos 45ºC (Isso com muitas coisas em uso ao mesmo tempo, como jogos, tocador de musica, internet, editor de texto e servidor.). Ou seja, tá bem razoável já que a temperatura considerada alta é só 80ºC.

Sobre a questão da pasta térmica ressecada: Eu não creio muito nisso, posto que o computador é novo (menos de um ano de uso).
Aliás, lembro-me da última vez que o computador reiniciou/ressucitou sozinho, e antes eu tinha rodado o sensors para ver a temperatura. Estava normal, algo em torno de 31ºC. Os problemas de aquecimento não existem mais.

Outra coisa que eu notei: Faz uns 2 dias que a mensagem de erro parou, desde então nada mais aconteceu. Mas não duvido que resolva dar problema daqui uns dias novamente.

Não poderia ser um bug de kernel com o meu hardware?

zekkerj

Sim, pode ser bug do kernel; assim como pode ser bug em qualquer outro componente crítico de software ou hardware. É preciso acompanhar e analisar, antes de afirmar qual é o problema.
Pesquise antes de perguntar, sua dúvida pode já ter sido respondida.
Não respondo dúvidas por MP, coloque sua dúvida no fórum onde ela pode ser pesquisada pelos seus colegas!
Não venha ao fórum apenas para perguntar. Se você sabe a resposta de um problema, porque não ajudar seu colega? ;D

giovanni94

Citação de: zekkerj online 16 de Outubro de 2012, 10:46
Sim, pode ser bug do kernel; assim como pode ser bug em qualquer outro componente crítico de software ou hardware. É preciso acompanhar e analisar, antes de afirmar qual é o problema.

Sim, não descarto nenhuma hipótese. Estou um pouco mais aliviado desde que as mensagens de erro pararam, pelo menos desde então a reinicialização repentina não ocorreu mais.
Citei um bug no kernel pois usei o Win7 nesse computador por alguns meses e nunca ocorreu isso (mesmo jogando por tempos consideráveis coisas "pesadas" como CoD).

Enfim, caso alguma coisa extraordinária ocorra nos próximos dias estarei postando aqui.
Obrigado pela atenção... Caso alguém tenha alguma idéia, toda ajuda é bem vinda (: