71 votos

¿Por qué se generan archivos PDF desde MS Word tan grande?

He creado un simple documento de MS Word que contiene sólo esta frase:

Este es un pequeño documento.

Nada más. Entonces me he guardado este documento como DOCX y PDF. Aquí están los tamaños de los archivos:

DOCX: 12 kB
PDF: 89 kB

Esta diferencia es enorme, técnicamente, y empieza realmente me molesta cuando la mayoría de documentos textuales que son decenas de kB en DOCX comenzar a generar los archivos Pdf que son cientos de kB grandes. ¿Por qué es tan ineficiente sobre el formato PDF? O es sólo la Palabra con algunas terribles de salida del algoritmo?

Por CIERTO, el archivo PDF de salida de la configuración se establece para crear el archivo más pequeño posible:

PDF output options

105voto

rene Puntos 959

Si abre el archivo PDF en el bloc de notas++ usted encontrará:

9 0 obj
<</Filter/FlateDecode/Length 79100/Length1 171804>>
stream
xœì}    XTGºvÕ9½/t7Ðl
..... many more bytes  ...   ëH|  
endstream
endobj
10 0 obj

y ese objeto se hace referencia aquí al final de la /FontFile2 instrucción:

6 0 obj
<</Type/FontDescriptor/FontName/ABCDEE+Calibri/Flags 32/ItalicAngle 0/Ascent 750/Descent -250/CapHeight 750/AvgWidth 521/MaxWidth 1743/FontWeight 400/XHeight 250/StemV 52/FontBBox[ -503 -250 1240 750] /FontFile2 9 0 R>>
endobj

Las Fuentes usadas en el documento de Word queda incrustada en el PDF, de modo que el pdf es auto-contenida.

He utilizado esta diapositiva-cubierta para decypher el PDF de instrucciones.

Si desea impedir que las fuentes incrustadas en el archivo PDF, asegúrese de que su documento de Word hace uso de uno de los 14 estándar de tipos de letra disponibles en los visores de PDF, (fuente Wikipedia)

  • Times New Roman > Veces (v3) (normal, cursiva, negrita y negrita cursiva)
  • Courier New > Mensajería (normal, oblicua, bold y bold oblique)
  • Arial > Helvetica (v3) (normal, oblicua, bold y bold oblique)
  • Símbolo Símbolo >
  • Wingdings > Zapf Dingbats

-3voto

Ben Sandeen Puntos 27

Para dar una menor respuesta técnica que puede ayudar es que los archivos Pdf pueden utilizar vectores (es decir: ecuaciones matemáticas para describir todo lo que vea. Todas las las líneas y curvas definidas por ecuaciones matemáticas, y así necesariamente habrá una gran cantidad de información para mantener, especialmente cuando usted tiene las imágenes en el documento.

El beneficio de esto es que, teóricamente, puede ampliar infinitamente cerca sin pérdida de resolución o detalle, ya que las líneas y las curvas no tienen ancho, por lo que puede crecer con su zoom.

Justo como Google reciente cambio de fuente reducido el tamaño del logotipo de ~14KB a ~300B, la simplificación de las fuentes es probable que ayudan a reducir el tamaño del archivo.

EnMiMaquinaFunciona.com

EnMiMaquinaFunciona es una comunidad de administradores de sistemas en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros sysadmin, hacer tus propias preguntas o resolver las de los demás.

Powered by: