Pessoal,
tenho uma aplicação web aqui, que roda em django, cima do NGinx (com uWSGI). Recentemente habilitamos o memcached também. A aplicação se comunica com outros servidores através do serviço de filas SQS (da Amazon Web Services). A cerca de duas semanas, começamos a receber mensagens "[Errno 24] Too many open files" nos logs de um dos componentes da aplicação (Celery).
Desde o início da operação, esse servidor teve o limite de file descriptors alterado para 65k para usuários e 650k para o sistema. O número de fd por processo não foi alterado (achei o valor inicial de 1048576 razoável). Venho acompanhando o número de fd usados (através do /proc/sys/fs/file-nr e lsof) além do número de conexões de rede (através do netstat) e não vi nada anormal. Durante o monitoramento, nunca passou de 3k. Tem mais algum lugar onde eu possa verificar o que pode estar gerando essas mensagens? Pode ser alguma outra coisa - que, por acaso, está gerando essa mensagem? Nos logs do sistema não vi nenhum indício de erro. O que mais posso verificar? Essa máquina é uma instância EC2 da Amazon (se é que essa informação ajuda em alguma coisa).
Abraços,
Luiz