Estrarre le immagini da un pdf
Vogliamo estrarre tutte le immagini contenute su un documento pdf.
Pdfimages รจ un semplice tool contenuto nel pacchetto poppler-utils
pdfimages [opzione] file.pdf nome_immagine_estratta
dove come opzione potremo inserire
-j per estrarre le immagini nel formato jpeg
-f per indicare da quale pagina estrarre le immagini
(ex. -f 5 per avviare l'elaborazione dalla pagina 5)
-l per indicare l'ultima pagina
(ex. -l 19 fino alla pagina19)
Per esempio se voglio estrarre le immagini in jpeg dal file hsi.pdf e nominarle appunto hsi basta digitare da terminale:
pdfimages -j hsi.pdf hsi
se invece voglio estrarre le immagini del file hsi.pdf in jpeg dalla pagina 3 alla pagina 8 per esempio e rinominare con il nome provahsi basta dare da terminale:
pdfimages -j -f 3 -l 8 hsi.pdf images
non possiamo salvare le immagini in altri formati (se non diamo -j saranno salvare in .ppm)