Autor Tópico: Existe OCR para Linux? (mais precisamente, UBUNTU DAPPER)  (Lida 9560 vezes)

Offline Serj Tankian

  • Usuário Ubuntu
  • *
  • Mensagens: 291
  • "I’ll wait here Lost in Hollywood
    • Ver perfil
    • Forum de informática com muitas dicas e suporte a você
Existe OCR para Linux? (mais precisamente, UBUNTU DAPPER)
« Online: 10 de Setembro de 2006, 16:47 »
OCR é um programa que atua como um scanner, ou seja, peguemos o exemplo do ABBY, para Windows: você tem uma apostila em PDF e quer passar pro Word, então digitaliza a imagem do PDF com o ABBY que, na mesma hora, exporta os caracteres para formato WORD.

Existe algum programa destes para Linux? Meu crack para o ABBY no windows expirou e, como estou quase de mala e cuia no linux, preciso de umprograminha destes...

Grato
"Viva!! Viva!! Viva a Sociedade Alternativa! À lei do forte, esta é a nossa lei e alegria do mundo!! Viva!! Viva!!"

Offline Lamego

  • Usuário Ubuntu
  • *
  • Mensagens: 1.943
    • Ver perfil
Re: Existe OCR para Linux? (mais precisamente, UBUNTU DAPPER)
« Resposta #1 Online: 10 de Setembro de 2006, 18:04 »
Serj,
vai no synaptic e procura por "ocr", aparem lá 2 ou 3 programas, pessoalmente nunca utilizei OCR por isso não posso aconselhar melhor.
João Luís Marques Pinto
Mais programs e jogos para o Ubuntu


boi

  • Visitante
Re: Existe OCR para Linux? (mais precisamente, UBUNTU DAPPER)
« Resposta #3 Online: 10 de Setembro de 2006, 21:27 »
Mas então, você quer um OCR mesmo ou apenas um programa que converta de pdf para texto? Se for o último caso, experimente isso no terminal:

Código: [Selecionar]
pdftotext apostila.pdf apostila.txt
O pdftotext faz parte do pacote poppler-utils, se você não tiver instalado, basta dar um apt-get. Também existe o pdftohtml no mesmo pacote.

Offline lueneberg

  • Usuário Ubuntu
  • *
  • Mensagens: 727
    • Ver perfil
    • BrasilLivre
Re: Existe OCR para Linux? (mais precisamente, UBUNTU DAPPER)
« Resposta #4 Online: 10 de Setembro de 2006, 22:35 »
OCR é um programa que atua como um scanner, ou seja, peguemos o exemplo do ABBY, para Windows: você tem uma apostila em PDF e quer passar pro Word, então digitaliza a imagem do PDF com o ABBY que, na mesma hora, exporta os caracteres para formato WORD.

Existe algum programa destes para Linux? Meu crack para o ABBY no windows expirou e, como estou quase de mala e cuia no linux, preciso de umprograminha destes...

Grato

exist o kooka (kde) nunca testei, mais de uma olhada

http://kooka.kde.org/

screen:

http://kooka.kde.org/screenshots/index.php

Offline agente100gelo

  • Administrador
  • Usuário Ubuntu
  • *****
  • Mensagens: 4.369
  • @Ceará
    • Ver perfil
Re: Existe OCR para Linux? (mais precisamente, UBUNTU DAPPER)
« Resposta #5 Online: 16 de Setembro de 2006, 13:03 »
Existe o GOCR (modo texto)
Eu tive uma dificuldade de conversão (provavelmente porque digitalizei em modo colorido), e agora meu scanner deu pau.

Digitalize uma imagem como ppm
Código: [Selecionar]
gocr -o texto.txt imagem.ppm
Digitalizou cerca de 90% do texto. Teve alguns enganos com i com ascentos agudos onde não tinha mas deu pro gasto. Talvez tenha que digitalizar aumentando o contraste para melhorar a perfomance.

No Gimp aparece a chamada para gocr mas não vi como digitalizar direto.
Advogado e analista de sistema cearense.
Twitter: @glaydson

Offline Mitzgitari

  • Usuário Ubuntu
  • *
  • Mensagens: 158
    • Ver perfil
Re: Existe OCR para Linux? (mais precisamente, UBUNTU DAPPER)
« Resposta #6 Online: 24 de Setembro de 2006, 21:38 »
O XSane utiliza o GOCR para o reconhecimento de caractéres.
Embora eu tenha gostado muito das fotos e imagens que eu digitalizei o OCR deixou muito a desejar (Talvez precise de alguma configuração extra, realmente não sei). Tentei buscar na internet uma solução para o problema com o OCR, mas até agora eu não consegui nada. Se conseguir alguma coisa eu posto aqui (Se conseguirem alguma informação neste sentido também postem, está informação é raridade na internet).
Só para constar eu utilizo uma Multifuncional HP 1510.

Offline Serj Tankian

  • Usuário Ubuntu
  • *
  • Mensagens: 291
  • "I’ll wait here Lost in Hollywood
    • Ver perfil
    • Forum de informática com muitas dicas e suporte a você
Re: Existe OCR para Linux? (mais precisamente, UBUNTU DAPPER)
« Resposta #7 Online: 27 de Setembro de 2006, 22:08 »
o xsane só digitaliza de algum scanner, oq eu queria era pegar apostilas que tenho no HD em formato PDF e passar para Word, para poder editá-las
"Viva!! Viva!! Viva a Sociedade Alternativa! À lei do forte, esta é a nossa lei e alegria do mundo!! Viva!! Viva!!"

Offline Alatar

  • Usuário Ubuntu
  • *
  • Mensagens: 2
    • Ver perfil
Re: Existe OCR para Linux? (mais precisamente, UBUNTU DAPPER)
« Resposta #8 Online: 06 de Dezembro de 2006, 19:09 »
Provavelmente você precisa instalar o OCR

Código: [Selecionar]
sudo apt-get install gocr gocr-gtk
Não é uma maravilha não, tive muitos erros.

Offline dudu_ubuntun

  • Usuário Ubuntu
  • *
  • Mensagens: 507
    • Ver perfil
    • O Tempo do Mundo
Re: Existe OCR para Linux? (mais precisamente, UBUNTU DAPPER)
« Resposta #9 Online: 06 de Dezembro de 2006, 23:40 »
Desculpem me meter, mas testei a dica do bo  funcionou perfeitamente, somente as figuras não apareceram no txt, mas isso também nao é um problema mto sério, parabéns pela dica boi ;)

Offline Newhouse

  • Usuário Ubuntu
  • *
  • Mensagens: 39
    • Ver perfil
Re: Existe OCR para Linux? (mais precisamente, UBUNTU DAPPER)
« Resposta #10 Online: 16 de Setembro de 2009, 21:31 »
Desculpem me meter, mas testei a dica do bo  funcionou perfeitamente, somente as figuras não apareceram no txt, mas isso também nao é um problema mto sério, parabéns pela dica boi ;)

Então, mas restaria o problema daqueles PDF de texto digitalizado na forma de imagem... Melhor explicando, imagina que tu pegou um livro e scaneou ele, salvando as páginas em JPG e depois juntou todas elas num PDF, nesse caso converter pra texto não adiantaria, aí só com o OCR mesmo.

Em termos de OCR, parece que a dupla Tesseract e gscan2pdf são uma boa pedida!

http://www.vivaolinux.com.br/dica/OCR-no-Ubuntu-9.04-utilizando-tesseract-e-gscan2pdf