Avec tidy, htmldoc, pdftk et un peu de python, j’ai généré un pdf de plus de 1000 pages à partir de pages web.
Le résultat à l’air à peu près correct (il ne faut pas être puriste mais ça reste parfaitement utilisable) mais il fait 250Mo…
La question est donc : Dans quelle molinette faut il faire passer un pdf pour compresser les images qu’il contient (il en contient bcp) et/ou réduire la résolution?
Celà dit, je n’ai pas mis d’options particulières dans htmldoc. Le pb vient peut être de là à la base (mais je suis quand même preneur de la réponse)