2016-12-05 41 views
0

我正在使用这样的代码来从pdf文件中删除某些页面。删除带有IText的PDF页面导致每次输出新的散列

PdfReader reader = new PdfReader(src); 
reader.selectPages("1,2"); 
PdfStamper stamper = new PdfStamper(reader, new FileOutputStream(dest)); 
stamper.close(); 

我的问题是,每次我运行此(同一输入文件,页面相同),输出文件有不同的哈希值(使用MD = MessageDigest.getInstance(“SHA1”))

我需要的东西这样

inputFile.pdf (hash_A) 
selectPages("1,2") 
outputFile.pdf (hash_B) 

inputFile.pdf (hash_A) 
selectPages("1,2") 
outputFile.pdf (hash_B) 

,但我得到这个

inputFile.pdf (hash_A) 
selectPages("1,2") 
outputFile.pdf (hash_B) 

inputFile.pdf (hash_A) 
selectPages("1,2") 
outputFile.pdf (hash_C) 

inputFile.pdf (hash_A) 
selectPages("1,2") 
outputFile.pdf (hash_D) 

代码

public String quitarPagBlancasPDF(String origen, String destino, int blankPdfsize) { 
     try { 

      com.itextpdf.text.pdf.PdfReader r = new com.itextpdf.text.pdf.PdfReader(origen); 
      String paginas = ""; 
      boolean editado = false; 

      for (int i = 1; i <= r.getNumberOfPages(); i++) { 
       byte bContent[] = r.getPageContent(i); 
       if (bContent.length > blankPdfsize) { 
        paginas += String.valueOf(i) + ","; 
       } else { 
        editado = true; 
       } 

      } 

      if (editado) { 
       r.selectPages(paginas); 
       PdfStamper stamper = new PdfStamper(r, new FileOutputStream(destino)); 
       stamper.setFullCompression(); 

       stamper.close(); 
       stamper = null; 
       r = null; 
      } else { 
       r = null; 

       return "Sin Cambios"; 
      } 
     } catch (Exception e) { 
      return e.getMessage(); 
     } 
     return "OK"; 
    } 
+0

Pdf包含有关上次更改文档的日期和时间以及唯一ID的信息。这两个因素都会导致不同的散列值。 – mkl

回答

0

Finalmentedecidí程序armar未散CON EL contenido德CADApágina德尔PDF对版本SI DOS PDF的儿子iguales

public static String getPdfSha(String origen, String metodo) { 
     try { 

      com.itextpdf.text.pdf.PdfReader r = new com.itextpdf.text.pdf.PdfReader(origen); 
      String Sha = ""; 

      for (int i = 1; i <= r.getNumberOfPages(); i++) { 
       byte bContent[] = r.getPageContent(i); 
       Sha = Sha + Arrays.toString(bContent); 
      } 
      Sha = encriptar(Sha, metodo); 
      return Sha; 

     } catch (Exception e) { 
      return ""; 
     } 
    } 

公共静态字符串encriptar(字符串texto,字符串algoritmo){

String sha; 
try { 
    java.security.MessageDigest md = java.security.MessageDigest.getInstance(algoritmo); 
    byte[] hash = md.digest(texto.getBytes()); 
    java.util.Formatter formatter = new java.util.Formatter(); 
    for (byte b : hash) { 
     formatter.format("%02x", b); 
    } 
    sha = formatter.toString(); 
    formatter = null; 
    hash = null; 
    md = null; 

} catch (java.security.NoSuchAlgorithmException e) { 
    return ""; 

} 
return sha; 

}

+0

** A **英语,请。 ** B **你的散列现在只考虑即时页面内容指示。这对你的任务真的够吗?除此之外,还有更多的pdf。 – mkl