[Resolvido] Tesseract-ocr converte com caracteres estranhos.

Iniciado por mauricio_luciano, 19 de Junho de 2010, 03:30

tópico anterior - próximo tópico

mauricio_luciano

Oi.  :) Eu conheci o Tesseract-ocr quando ainda estava no Karmic e ele funcionava muito bem. Primeiro eu extraia as legendas do dvd em formato de imagem .tif e depois dava o comando...

--> for i in $(ls); do tesseract $i $i -l por; done <--

para converter as imagens em texto, e assim por fim criar o arquivo de legenda. Só que agora no Lucid ele gera uns textos estranhos...

--> http://www.fileupyours.com/files/283001/tess_erro.jpg <--

Alguma ideia ?  :-\

mauricio_luciano

Consegui!  :D   O problema estava nesse comando --> subtitle2pgm -o pt -c 255,255,0,255 < subs-pt <--

só precisei alterar para --> subtitle2pgm -o pt -c 255,0,255,255 < subs-pt <-- deixando a cor da fonte mais forte.

Obrigado. Abraços.  8)