2015-05-09 51 views
0

我想将原始html代码转换为pdf文件。 这是我的控制器代码将原始HTML代码转换为PDF文件

@RequestMapping("getpdf") 
public void doGet(HttpServletRequest request, 
     HttpServletResponse response,String ref){ 


    OutputStream out = null; 
    Document document = new Document(PageSize.A4, 50, 50, 50, 50); 
    java.util.List items = null; 

    ArticalBean abean=serviceLayer.getArtical(Integer.parseInt(ref)); 
     items = new ArrayList(); 
     items.add(abean.getArticle());    


    try { 
     response.setContentType("application/pdf"); 
     PdfWriter.getInstance(document, response.getOutputStream()); 
     document.open(); 
     Paragraph paragraph = new Paragraph("Microweb Systems"); 
     document.add(paragraph); 
     ListItem listItem; 
     com.lowagie.text.List list = new com.lowagie.text.List(true, 15); 
     Iterator i = items.iterator(); 
     while(i.hasNext()) { 
      listItem = new ListItem((String)i.next(), 
        FontFactory.getFont(FontFactory.TIMES_ROMAN, 12)); 

      list.add(listItem); 
     } 
     document.add(list); 

    } catch (Exception e) { 

    } finally { 
     document.close(); 
    } 
    document.close(); 
} 

它的HTML代码转换为PDF但PDF还包含标签

<h1>Hello World</h1> 

有没有什么办法可以去除这些标记和显示只有数据。

我通过DTO提供数据库中的数据。

回答

0

如果我理解你的问题,你想删除标签。

这可以用String.replaceAll(String regex, String replacement)完成。

例如myString.replaceAll("^<[.]*>$" , "");将删除任何标签。 但是,这并不会使pdf看起来像页面在浏览器中所做的那样。