Palabra tal vez sólo hace aumentar de imagen y la envía de esa forma como de entrada de la impresora (supongo que Distiller funciona como una impresora). Si es así, entonces es bueno para el normal impresoras, pero ineficaces para falso impresoras de producción de archivos PDF.
Por ejemplo pdfLaTeX correctamente incrusta la imagen en el archivo de salida. Comprobar mi PDF subido a min.nos galería: la Incrustación de imágenes en documentos LaTeX
Lo importante es lo del PDF de la producción de la pila que está utilizando. Si probar otra impresora PDF, como gran y gratuito PDFCreator, no soluciona el problema, entonces usted debe tratar de usar dedicado exportación a PDF, es decir, no funciona como una impresora. AFAIK recientes versiones de Word han de exportación de PDF integrado, de modo que si se implementa correctamente, entonces usted va a obtener un pequeño archivo, gracias a la incrustación de imágenes que se utilizan en el documento.
GRAN EDICIÓN
La galería se ha cambiado el nombre a la Incrustación de imagen PNG en Látex vs Palabra
He mirado más a fondo en mi mytest.pdf
generado por pdfLaTeX y su test2.pdf
generado por Palabra.
mytest.pdf
test2.pdf
Vamos a empezar con la descompresión. Si se mira en el archivo sin comprimir, usted fácilmente irregular comienzo de la secuencia de imágenes (<<...>>stream
línea con los parámetros Width y Height, lo mismo que en test.png
, es decir, 176x295), que termina con endstream
etiqueta. Peek tiempo.
(ADVERTENCIA en este punto pdftk se supone que en la versión 1.41)
test2.pdf
$ pdftk test2.pdf output test2uc.pdf uncompress
$ sed '\,^<</Width 176[^>]*/Height 295[^>]*>>stream$,!d' test2uc.pdf
<</Width 176/BitsPerComponent 8/Interpolate true/Height 295/Filter[/DCTDecode]/Subtype/Image/Length 20003/ColorSpace/DeviceRGB/Type/XObject>>stream
$ sed '1,\,^<</Width 176[^>]*/Height 295[^>]*>>stream$,d;/^endstream$/,$d' test2uc.pdf > test2stream
$ xxd test2stream | head -10
0000000: ffd8 ffe0 0010 4a46 4946 0001 0101 0048 ......JFIF.....H
0000010: 0048 0000 ffe1 005c 4578 6966 0000 4d4d .H.....\Exif..MM
0000020: 002a 0000 0008 0004 0302 0002 0000 0016 .*..............
0000030: 0000 003e 5110 0001 0000 0001 0100 0000 ...>Q...........
0000040: 5111 0004 0000 0001 0000 0b13 5112 0004 Q...........Q...
0000050: 0000 0001 0000 0b13 0000 0000 5068 6f74 ............Phot
0000060: 6f73 686f 7020 4943 4320 7072 6f66 696c oshop ICC profil
0000070: 6500 ffe2 0c58 4943 435f 5052 4f46 494c e....XICC_PROFIL
0000080: 4500 0101 0000 0c48 4c69 6e6f 0210 0000 E......HLino....
0000090: 6d6e 7472 5247 4220 5859 5a20 07ce 0002 mntrRGB XYZ ....
$ file test2stream
test2stream: JPEG image data, JFIF standard 1.01
Así que la Palabra está dando JPEG en vez de PNG en su salida interna para su posterior procesamiento de PDF. Simplemente WOW! Lo mismo puede suceder cuando se envía la salida a la impresora.
test2stream.jpg
mytest.pdf
$ pdftk mytest.pdf output mytestuc.pdf uncompress
$ sed '\,^<</Width 176[^>]*/Height 295[^>]*>>stream$,!d' mytestuc.pdf
<</Width 176/BitsPerComponent 8/Height 295/Subtype/Image/Length 155760/ColorSpace/DeviceRGB/Type/XObject>>stream
$ sed '1,\,^<</Width 176[^>]*/Height 295[^>]*>>stream$,d;/^endstream$/,$d' mytestuc.pdf > myteststream
$ xxd myteststream | head -10
0000000: ebeb ebea eaea ecec eceb ebeb ebeb ebeb ................
0000010: ebeb ebeb ebec ecec ebeb ebeb ebeb ebeb ................
0000020: ebeb ebeb ebeb ebeb ebeb ebeb ebeb ebeb ................
0000030: ebeb ebea eaea eaea eaec ecec eaea eaec ................
0000040: ecec ebeb ebec ecec ebeb ebeb ebeb ebeb ................
0000050: ebeb ebeb ebeb ebeb ebeb ebeb ebeb ebeb ................
0000060: ebeb ebeb ebeb ebeb ebeb ebeb ebeb ebeb ................
0000070: ebeb ebeb ebeb ebeb ebeb ebeb ebeb ebeb ................
0000080: ebea eaea ecec eceb ebeb ebeb ebea eaea ................
0000090: ebeb ebeb ebeb ebeb ebeb ebeb ebeb ebeb ................
$ file myteststream
myteststream: DOS executable (COM)
No COM el archivo, pero no es PNG.
$ du -b test.png test2stream myteststream
57727 test.png
20004 test2stream
155761 myteststream
Lo ves ahora? Secuencia de imágenes (PNG) de PDF producida por pdfLaTeX es, posiblemente, simple formato raw (176*295*3=155760, 1 viene de superfluo newline). Vamos a comprobarlo:
$ convert -depth 8 -size 176x295 rgb:myteststream myteststream.png
Y tenemos nuestra imagen original de vuelta! No, espere. Parece que pdftk 1.41 uncompression es buggy y la imagen era casi el mismo, con algunos defectos. He actualizado a pdftk 1.44, pero esta versión no descomprimir la imagen corriente en todo. Por otra parte pdftk no flujo de salida del diccionario en una línea, por lo que por encima de la extracción usando sed ya no funciona, pero no hay ningún punto en la fijación de ahora.
Entonces, ¿qué podemos hacer acerca de la Palabra? No mucho, a mi entender. Al menos se puede trasplante de imagen incrustada de un PDF a otro. He repetido uncompression de ambos archivos Pdf utilizando los últimos pdftk, abrió en vim, sustituido en test2uc.pdf
<<...>>stream...endstream
con su contraparte de mytestuc.pdf
, guardado como test2fixuc.pdf
comprimido a test2fix.pdf
.
test2fix.pdf
prueba.pdf
Sería un pecado no comprobación de su gran PDF después de todo. Ok, he preparado otro oneliner a jugar con pdftk 1.44 sin comprimir los archivos Pdf a imagen de la lista de los arroyos y el comienzo de su líneas en los archivos. Así que voy a empezar con descomprimir test.pdf
.
(ADVERTENCIA en este punto pdftk se supone que en la versión 1.44)
$ pdftk test.pdf output testuc.pdf uncompress
$ awk '{if(i)h=h$0} /^[0-9]+ [0-9]+ obj $/{i=1;h=""}/^stream$/{i=0;if(h!~/\/Image/)next;print h,":"NR+1}' testuc.pdf
<</ColorSpace /DeviceRGB/Subtype /Image/Length 10443804/Width 707/Type /XObject/BitsPerComponent 8/Height 4924>>stream :619
<</ColorSpace /DeviceRGB/Subtype /Image/Length 11264460/Width 953/Type /XObject/BitsPerComponent 8/Height 3940>>stream :12106
<</ColorSpace /DeviceRGB/Subtype /Image/Length 2813256/Width 953/Type /XObject/BitsPerComponent 8/Height 984>>stream :12910
<</ColorSpace /DeviceRGB/Subtype /Image/Length 11264460/Width 953/Type /XObject/BitsPerComponent 8/Height 3940>>stream :18547
<</ColorSpace /DeviceRGB/Subtype /Image/Length 2813256/Width 953/Type /XObject/BitsPerComponent 8/Height 984>>stream :19312
<</ColorSpace /DeviceRGB/Subtype /Image/Length 4845216/Width 328/Type /XObject/BitsPerComponent 8/Height 4924>>stream :19326
Algo está realmente loco aquí! 6 imágenes raw (al parecer esta vez pdftk no tiene problemas en descomprimir ellos) tomando en conjunto 43444452 bytes! Vamos a revisar test2uc.pdf
y mytestuc.pdf
.
$ awk '{if(i)h=h$0} /^[0-9]+ [0-9]+ obj $/{i=1;h=""}/^stream$/{i=0;if(h!~/\/Image/)next;print h,":"NR+1}' test2uc.pdf
<</Width 176/BitsPerComponent 8/Interpolate true/Height 295/Filter /DCTDecode/Subtype /Image/Length 20003/ColorSpace /DeviceRGB/Type /XObject>>stream :113
przemoc@debian:~/latex/test/img/mod$ awk '{if(i)h=h$0} /^[0-9]+ [0-9]+ obj $/{i=1;h=""}/^stream$/{i=0;if(h!~/\/Image/)next;print h,":"NR+1}' mytestuc.pdf
<</DecodeParms <</Colors 3/Columns 176/Predictor 10/BitsPerComponent 8>>/Width 176/BitsPerComponent 8/Height 295/Filter /FlateDecode/Subtype /Image/Length 54954/ColorSpace /DeviceRGB/Type /XObject>>stream :22
En ambos casos, sólo una secuencia de imágenes. ¿Por qué diablos no podía estar más de ellos?!
$ sed '1,618d;/^endstream $/q' testuc.pdf | convert -depth 8 -size 707x4924 rgb:- testuc-stream1.png
$ sed '1,12105d;/^endstream $/q' testuc.pdf | convert -depth 8 -size 953x3940 rgb:- testuc-stream2.png
$ sed '1,12909d;/^endstream $/q' testuc.pdf | convert -depth 8 -size 953x984 rgb:- testuc-stream3.png
$ sed '1,18546d;/^endstream $/q' testuc.pdf | convert -depth 8 -size 953x3940 rgb:- testuc-stream4.png
$ sed '1,19311d;/^endstream $/q' testuc.pdf | convert -depth 8 -size 953x984 rgb:- testuc-stream5.png
$ sed '1,19325d;/^endstream $/q' testuc.pdf | convert -depth 8 -size 328x4924 rgb:- testuc-stream6.png
La imagen fue cortada a muchas piezas... parece algún tipo de absolutamente estúpido de protección, tal vez introducido por Distiller (y tal vez puede ser desactivado)? Dudo que lo mismo sería escupido por PDFCreator, a menos que la Palabra que realiza esta increíble locura...
testuc-stream1.png y otros (use la flecha derecha para navegar)
Conclusión
Las cosas importantes son:
- se puede ver claramente, que la gran imagen que fue cortado en pedazos es realmente convertidos JPEG, así que mi hipótesis era la correcta,
- porque en PDFCreator también obtiene enorme en el archivo de salida, es la Palabra que proporciona muy grande la imagen de la falsificación de la impresora PDF, y mi anterior suposición era correcta.
Ufff. Esta investigación se llevó algún tiempo. La palabra es pedazo de basura.
Soluciones?
En el mientras tanto, algunas de las sugerencias que se dieron. Permítanme que comente.
El uso de escritor decente PDF de apoyo como LibreOffice (olvídate de OpenOffice, es obsoleto ahora) es una buena solución, a menos que algunos incompabilities hacer que usted no puede trabajar con él.
El uso de la imagen más grande en el mismo cuadro en la página también es que no es mala idea, porque incluso después de JPEG-izing, artefactos serán menos visibles.
Mi otro grosz, aunque es el uso de JPEG desde el principio. De esa manera la Palabra no debería volver a comprimir (nunca se sabe...) y puede proporcionar más alto posible de calidad de JPEG. También hay JPEG sin pérdida de compresión. Los desarrolladores de Redmond, presumiblemente, el pensamiento no es necesario, así que no se sorprenda si la Palabra no manejar esos archivos Jpeg. Bueno, TBH no está ampliamente soportado (incluso en el mundo open source), como la codificación aritmética (o es más bien la situación aun peor en el caso de la codificación aritmética).
convert test.png -quality 100 -resize $((100*300/72))% test-300dpi-mitchell.jpg
convert test.png -quality 100 -filter box -resize $((100*300/72))% test-300dpi-box.jpg
convert test.png -quality 100 test.jpg
(En Windows uso 416 lugar de este $(())
expansión aritmética disponible en POSIX conchas)
Creo que por defecto Mitchell es buena para el escalamiento, pero si realmente quieres pixelatic de la imagen, y luego ir con el Cuadro como @ceving sugerido. Por supuesto, los 2 primeros archivos son útiles sólo si es necesario (por alguna razón) uso de falsos impresoras de PDF.
He subido los tres archivos.
test-300dpi-mitchell.jpg (426 KB)
test-300dpi-box.jpg (581 KB)
test.jpg (74 KB)
Si mi hipótesis es correcta y la Palabra no volver a comprimir JPEG imagen, utilice sólo la última no convertidos y vaya con construido-en PDF de salida, ya que tiene menos shortcommings (por lo menos se evita la innecesaria de lujo).