我正在使用这样的代码来从pdf文件中删除某些页面。删除带有IText的PDF页面导致每次输出新的散列
PdfReader reader = new PdfReader(src);
reader.selectPages("1,2");
PdfStamper stamper = new PdfStamper(reader, new FileOutputStream(dest));
stamper.close();
我的问题是,每次我运行此(同一输入文件,页面相同),输出文件有不同的哈希值(使用MD = MessageDigest.getInstance(“SHA1”))
我需要的东西这样
inputFile.pdf (hash_A)
selectPages("1,2")
outputFile.pdf (hash_B)
inputFile.pdf (hash_A)
selectPages("1,2")
outputFile.pdf (hash_B)
,但我得到这个
inputFile.pdf (hash_A)
selectPages("1,2")
outputFile.pdf (hash_B)
inputFile.pdf (hash_A)
selectPages("1,2")
outputFile.pdf (hash_C)
inputFile.pdf (hash_A)
selectPages("1,2")
outputFile.pdf (hash_D)
代码
public String quitarPagBlancasPDF(String origen, String destino, int blankPdfsize) {
try {
com.itextpdf.text.pdf.PdfReader r = new com.itextpdf.text.pdf.PdfReader(origen);
String paginas = "";
boolean editado = false;
for (int i = 1; i <= r.getNumberOfPages(); i++) {
byte bContent[] = r.getPageContent(i);
if (bContent.length > blankPdfsize) {
paginas += String.valueOf(i) + ",";
} else {
editado = true;
}
}
if (editado) {
r.selectPages(paginas);
PdfStamper stamper = new PdfStamper(r, new FileOutputStream(destino));
stamper.setFullCompression();
stamper.close();
stamper = null;
r = null;
} else {
r = null;
return "Sin Cambios";
}
} catch (Exception e) {
return e.getMessage();
}
return "OK";
}
Pdf包含有关上次更改文档的日期和时间以及唯一ID的信息。这两个因素都会导致不同的散列值。 – mkl