ocr no debian
11 May 2012
para converter um documento pdf em tiff para poder ser utilizado pelo tesseract:
gs -sDEVICE=tiffg4 -r300x300 -sOutputFile=output.tif -- input.pdf
http://www.linuxquestions.org/questions/linux-software-2/convert-pdf-to…
para realizar o ocr:
tesseract input.tif output -l por