16 votos

Razonable automática de HTML a la conversión de PDF (en entorno UNIX/Linux)

Es allí una manera de generar documentos PDF a partir de archivos HTML automáticamente en Linux, donde el PDF ofrece algún tipo de razonable nivel de semejanza con el archivo de entrada?

Una herramienta de línea de comandos - en contraposición a una interactiva interfaz gráfica de usuario de algún tipo - es la clave.

He intentado htmldoc y algunos primos relacionados, por supuesto. Pero estas herramientas son irremediablemente de la edad de piedra; htmldoc no soporte CSS. Usted no encontrará una gran cantidad de documentos HTML en estos días, que no tienen al menos algo de estilo CSS. Yo realmente no se preocupan por estúpido efectos o menor adornos, pero el problema es que el CSS es el núcleo de la mayoría de los diseños de estos días; no muchas personas están utilizando 6 capas de tablas anidadas más. Por lo tanto, si la herramienta de conversión no tiene conocimiento de CSS que sea, no es sólo un asunto de "el documento no se ve muy bien"; es probable que no cumple el estándar mínimo de usabilidad.

Se ha sugerido a mí por algunas personas para tratar de utilizar el motor de renderizado Gecko para generar imágenes que pueden ser convertidos a Pdf, pero no tengo idea de cómo se van haciendo esta, digamos fácilmente.

No tengo ningún problema en creer que hay buenas herramientas comerciales que hacen esto, pero en realidad estoy buscando un open-source paquete si es posible, ya que el esfuerzo es en sí mismo una fuente abierta de uno y no pagar.

Gracias de antemano!

7voto

helios Puntos 8379

Has visto wkhtmltopdf? No puedo decir lo bien que funciona personalmente, pero parece ser exactamente lo que usted necesita. El único problema puede ser, que con este y cualquier navegador de automatización de soluciones, que va a recoger la hoja de estilo de impresión en lugar de la pantalla, así el PDF puede no ser exactamente lo que usted ve en la pantalla.

2voto

riza Puntos 170

Trate de chm2pdf con python-beautifulsoup.

1voto

chmeee Puntos 4555

Quería generar algunos PNG de páginas HTML desde la línea de comandos. En algún lugar he encontrado este script en ruby que utiliza mozembed para generar una captura de pantalla. Usted puede quitar la línea de escala si no quieres escala.

El único problema que veo es que realmente la página aparece en la pantalla por un momento...

0voto

Tripp Lilley Puntos 156

XHTML2PDF es un conjunto de herramientas de Python, que incluye tanto los scripts de línea de comandos y una biblioteca de Python (por si quieres incrustar este en algo más grande sin los bombardeos a cabo para el guión). Es compatible con HTML/XHTML y CSS, con adicionales específicos del proveedor de estilos CSS para ajustar el formato de salida (por ejemplo, números de página, párrafo flujo, etc.)

Sólo lo he usado un poco de proceso por lotes de un par de documentación HTML, pero funcionó bien, y su conjunto de características parece integrales para mí. El manual está oculto en la página de demostración, sino que es, en sí, un buen ejemplo de la conversión de HTML a doc a PDF.

He tenido una buena relación de enlaces a "antes" y "después" de ejemplos, pero acabo de crear mi cuenta, y, al parecer, sólo los spammers poner más de un enlace en su primer post :-p

0voto

Daniel Provin Puntos 11

trate de dompdf funciona bien a partir de la línea de comandos y por sus ejemplos, funciona con cualquier tipo de html

EnMiMaquinaFunciona.com

EnMiMaquinaFunciona es una comunidad de administradores de sistemas en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros sysadmin, hacer tus propias preguntas o resolver las de los demás.

Powered by: