15 votos

El Reconocimiento óptico de Caracteres de software de recomendaciones?

He visto algunos ebooks/papers que aparentemente fueron escaneadas de sus versiones en papel, pero el texto en el ebooks/papers puede increíblemente ser copiado. Supongo que el directamente-versiones escaneadas deben haber sido procesados por algún software de Reconocimiento Óptico de Caracteres.

Así que me gustaría saber cuáles son los recomendados de Reconocimiento Óptico de Caracteres softwares? Especialmente aquellos que son para Ubuntu o libre? Si los de Windows son mucho más superiores, por favor hágamelo saber.

Estoy particularmente interesado en los OCRs que puede aceptar un archivo pdf escaneado como entrada y producir como salida de otro archivo pdf que parece el mismo que el de entrada, pero con su texto copiable.

Gracias y saludos!

Por favor límite de un software por respuesta

8voto

Eric Puntos 246

Otro proyecto que debe ser capaz de hacer esto es gscan2pdf Install gscan2pdf. Este proyecto también puede utilizar Tesseract, así como otros OCR de código abierto herramientas.

3voto

Jenn D. Puntos 121

Solución gratuita que existe en los repos, CunieForm (y YAGF como Gnome frontend)

3voto

studiothat Puntos 418

Yo no conozco a ninguna de OCR para Ubuntu, pero para Windows hay uno que tiene las características que usted necesita. Que es ABBYY FineReader esta es la página pero no es gratis

3voto

Eric Puntos 246

Parece que los Decápodos proyecto o vaya a exportar a PDF, para Tesseract de alguna manera, debe exportar la información necesaria para saber donde lo que se encontró texto.

EnMiMaquinaFunciona.com

EnMiMaquinaFunciona es una comunidad de administradores de sistemas en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros sysadmin, hacer tus propias preguntas o resolver las de los demás.

Powered by: