手把手教你使用Java开发在线生成平PDF文档

开发 后端
在实际的业务开发的时候,研发人员往往会碰到很多这样的一些场景,需要提供相关的电子凭证信息给用户,例如网银/支付宝/微信购物支付的电子发票、订单的库存打印单、各种电子签署合同等等,以方便用户查看、打印或者下载。

[[423966]]

一、介绍

在实际的业务开发的时候,研发人员往往会碰到很多这样的一些场景,需要提供相关的电子凭证信息给用户,例如网银/支付宝/微信购物支付的电子发票、订单的库存打印单、各种电子签署合同等等,以方便用户查看、打印或者下载。

例如下图的电子发票!

熟悉这块业务的童鞋,一定特别清楚,目前最常用的解决方案是:把相关的数据信息,通过一些技术手段生成对应的 PDF 文件,然后返回给用户,以便预览、下载或者打印。

不太熟悉这项技术的童鞋,也不用着急,今天我们一起来详细了解一下在线生成 PDF 文件的技术实现手段!

二、案例实现

在介绍这个代码实践之前,我们先来了解一下这个第三方库:iText,对,没错,它就是我们今天的主角。

iText是著名的开放源码站点sourceforge一个项目,是用于生成PDF文档的一个java类库,通过iText不仅可以生成PDF或rtf的文档,而且还可以将XML、Html文件转化为PDF文件。

iText目前有两套版本,分别是iText5和iText7。iText5应该是网上用的比较多的一个版本。iText5因为是很多开发者参与贡献代码,因此在一些规范和设计上存在不合理的地方。iText7是后来官方针对iText5的重构,两个版本差别还是挺大的。不过在实际使用中,一般用到的都比较简单的 API,所以不用特别拘泥于使用哪个版本。

2.1、添加 iText 依赖包

在使用它之前,我们先引人相关的依赖包!

  1. <dependencies> 
  2.     <!-- pdf:start --> 
  3.     <dependency> 
  4.         <groupId>com.itextpdf</groupId> 
  5.         <artifactId>itextpdf</artifactId> 
  6.         <version>5.5.11</version> 
  7.     </dependency> 
  8.     <dependency> 
  9.         <groupId>com.itextpdf.tool</groupId> 
  10.         <artifactId>xmlworker</artifactId> 
  11.         <version>5.5.11</version> 
  12.     </dependency> 
  13.     <!-- 支持中文 --> 
  14.     <dependency> 
  15.         <groupId>com.itextpdf</groupId> 
  16.         <artifactId>itext-asian</artifactId> 
  17.         <version>5.2.0</version> 
  18.     </dependency> 
  19.     <!-- 支持css样式渲染 --> 
  20.     <dependency> 
  21.         <groupId>org.xhtmlrenderer</groupId> 
  22.         <artifactId>flying-saucer-pdf-itext5</artifactId> 
  23.         <version>9.1.16</version> 
  24.     </dependency> 
  25.     <!-- 转换html为标准xhtml包 --> 
  26.     <dependency> 
  27.         <groupId>net.sf.jtidy</groupId> 
  28.         <artifactId>jtidy</artifactId> 
  29.         <version>r938</version> 
  30.     </dependency> 
  31.     <!-- pdf:end -->     
  32. </dependencies> 

2.2、简单实现

老规矩,我们先来一个hello world,代码如下:

  1. public class CreatePDFMainTest { 
  2.  
  3.     public static void main(String[] args) throws Exception { 
  4.         Document document = new Document(PageSize.A4); 
  5.         //第二步,创建Writer实例 
  6.         PdfWriter.getInstance(document, new FileOutputStream("hello.pdf")); 
  7.         //创建中文字体 
  8.         BaseFont bfchinese = BaseFont.createFont("STSong-Light""UniGB-UCS2-H", BaseFont.NOT_EMBEDDED); 
  9.         Font fontChinese = new Font(bfchinese, 12, Font.NORMAL); 
  10.         //第三步,打开文档 
  11.         document.open(); 
  12.         //第四步,写入内容 
  13.         Paragraph paragraph = new Paragraph("hello world", fontChinese); 
  14.         document.add(paragraph); 
  15.         //第五步,关闭文档 
  16.         document.close(); 
  17.     } 

打开hello.pdf文件,内容如下!

2.3、复杂实现

在实际的业务开发中,因为业务场景非常复杂,而且变化快,我们往往不会采用上面介绍的写入内容方式来生成文件,而是采用HTML文件转化为PDF文件。

例如下面这张入库单!

我们应该如何快速实现呢?

首先,我们采用html语言编写一个入库单页面,将其命令为printDemo.html,源代码如下:

  1. <html> 
  2.  <head></head> 
  3.  <body> 
  4.   <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> 
  5.   <title>出库单</title> 
  6.   <div> 
  7.    <div> 
  8.     <table width="100%" border="0" cellspacing="0" cellpadding="0"
  9.      <tbody> 
  10.       <tr> 
  11.        <td height="40" colspan="2"><h3 style="font-weight: bold; text-align: center; letter-spacing: 5px; font-size: 24px;">入库单</h3></td> 
  12.        <td width="12%" height="20" rowspan="2"
  13.         <img style="width: 105px;height: 105px;" src="data:image/jpeg;base64,iVBORw0KGgoAAAANSUhEUgAAAH0AAAB9AQAAAACn+1GIAAAAqElEQVR42u3VMQ7DMAwDQP6A//8lx24qKRRw0s1yu8Uw4OQGIaHsBHUfLzzwAxCAInoZg6dI9dUUBIOyHEG56CmodAaxwtfbboLTVWpeU9+EDAH37m9CmkTYxDGUE0agMIakk3y4Ut8G37iom02M4bPniHWAtqFDTjjSGLrZvXAOmTnL1124C73r6Yo8Ane61k6eQeVjIM2h482D1RwScrpNjuH5R/0b3s6ZZNyKlt3iAAAAAElFTkSuQmCC" /> 
  14.        </td> 
  15.       </tr> 
  16.       <tr> 
  17.        <td width="50%" height="30">操作人:xxx</td> 
  18.        <td width="50%" height="30" colspan="2">创建时间:2021-09-14 12:00:00</td> 
  19.       </tr> 
  20.      </tbody> 
  21.     </table
  22.    </div> 
  23.    <div style="margin-top: 5px; margin-bottom: 6px; margin-left: 4px"></div> 
  24.    <div> 
  25.     <table width="100%" 
  26.      style="border-collapse: collapse; border-spacing: 0;border:0px;"
  27.       <tr style="height: 25px;"
  28.        <td style="background: #eaeaea; text-align: center; border-left: 1px solid #000000; border-top: 1px solid #000000;" 
  29.         width="10%">序号</td> 
  30.        <td style="background: #eaeaea; text-align: center; border-left: 1px solid #000000; border-top: 1px solid #000000;" 
  31.         width="30%">商品</td> 
  32.        <td style="background: #eaeaea; text-align: center; border-left: 1px solid #000000; border-top: 1px solid #000000;" 
  33.         width="30%">单位</td> 
  34.        <td style="background: #eaeaea; text-align: center; border-left: 1px solid #000000; border-top: 1px solid #000000; border-right: 1px solid #000000;" 
  35.         width="30%">数量</td> 
  36.       </tr> 
  37.       <tr> 
  38.        <td style="text-align: center; border-left: 1px solid #000000; border-top: 1px solid #000000;">1</td> 
  39.        <td style="text-align: center; border-left: 1px solid #000000; border-top: 1px solid #000000;">xxx沐浴露</td> 
  40.        <td style="text-align: center; border-left: 1px solid #000000; border-top: 1px solid #000000;">箱</td> 
  41.        <td style="text-align: center; border-left: 1px solid #000000; border-top: 1px solid #000000; border-right: 1px solid #000000;">3</td> 
  42.       </tr> 
  43.       <tr> 
  44.        <td style="text-align: center; border-left: 1px solid #000000; border-top: 1px solid #000000;">2</td> 
  45.        <td style="text-align: center; border-left: 1px solid #000000; border-top: 1px solid #000000;">xxx洗发水</td> 
  46.        <td style="text-align: center; border-left: 1px solid #000000; border-top: 1px solid #000000;">箱</td> 
  47.        <td style="text-align: center; border-left: 1px solid #000000; border-top: 1px solid #000000; border-right: 1px solid #000000;">4</td> 
  48.       </tr> 
  49.       <tr> 
  50.        <td style="text-align: center; border-left: 1px solid #000000; border-top: 1px solid #000000;">3</td> 
  51.        <td style="text-align: center; border-left: 1px solid #000000; border-top: 1px solid #000000;">xxx洗衣粉</td> 
  52.        <td style="text-align: center; border-left: 1px solid #000000; border-top: 1px solid #000000;">箱</td> 
  53.        <td style="text-align: center; border-left: 1px solid #000000; border-top: 1px solid #000000; border-right: 1px solid #000000;">5</td> 
  54.       </tr> 
  55.       <tr> 
  56.        <td style="text-align: center; border-left: 1px solid #000000; border-top: 1px solid #000000; border-bottom: 1px solid #000000;">4</td> 
  57.        <td style="text-align: center; border-left: 1px solid #000000; border-top: 1px solid #000000; border-bottom: 1px solid #000000;">xxx洗面奶</td> 
  58.        <td style="text-align: center; border-left: 1px solid #000000; border-top: 1px solid #000000; border-bottom: 1px solid #000000;">箱</td> 
  59.        <td style="text-align: center; border-left: 1px solid #000000; border-top: 1px solid #000000; border-right: 1px solid #000000; border-bottom: 1px solid #000000;">5</td> 
  60.       </tr> 
  61.     </table
  62.    </div> 
  63.   </div> 
  64.  </body> 
  65.  
  66. </html> 

 

 

接着,我们将html文件转成PDF文件,源码如下:

 

 

  1. public class CreatePDFMainTest { 
  2.  
  3.  
  4.     /** 
  5.      * 创建PDF文件 
  6.      * @param htmlStr 
  7.      * @throws Exception 
  8.      */ 
  9.     private static void writeToOutputStreamAsPDF(String htmlStr) throws Exception { 
  10.         String targetFile = "pdfDemo.pdf"
  11.         File targeFile = new File(targetFile); 
  12.         if(targeFile.exists()) { 
  13.             targeFile.delete(); 
  14.         } 
  15.  
  16.         //定义pdf文件尺寸,采用A4横切 
  17.         Document document = new Document(PageSize.A4, 25, 25, 15, 40);// 左、右、上、下间距 
  18.         //定义输出路径 
  19.         PdfWriter writer = PdfWriter.getInstance(document, new FileOutputStream(targetFile)); 
  20.         PdfReportHeaderFooter header = new PdfReportHeaderFooter("", 8, PageSize.A4); 
  21.         writer.setPageEvent(header); 
  22.         writer.addViewerPreference(PdfName.PRINTSCALING, PdfName.NONE); 
  23.         document.open(); 
  24.  
  25.         // CSS 
  26.         CSSResolver cssResolver = new StyleAttrCSSResolver(); 
  27.         CssAppliers cssAppliers = new CssAppliersImpl(new XMLWorkerFontProvider(){ 
  28.  
  29.             @Override 
  30.             public Font getFont(String fontname, String encoding, boolean embedded, float sizeint style, BaseColor color) { 
  31.                 try { 
  32.                     //用于中文显示的Provider 
  33.                     BaseFont bfChinese = BaseFont.createFont("STSongStd-Light""UniGB-UCS2-H", BaseFont.NOT_EMBEDDED); 
  34.                     return new Font(bfChinese, size, style); 
  35.                 } catch (Exception e) { 
  36.                     return super.getFont(fontname, encoding, size, style); 
  37.                 } 
  38.             } 
  39.         }); 
  40.  
  41.         //html 
  42.         HtmlPipelineContext htmlContext = new HtmlPipelineContext(cssAppliers); 
  43.         htmlContext.setTagFactory(Tags.getHtmlTagProcessorFactory()); 
  44.         htmlContext.setImageProvider(new AbstractImageProvider() { 
  45.             @Override 
  46.             public Image retrieve(String src) { 
  47.                 //支持图片显示 
  48.                 int pos = src.indexOf("base64,"); 
  49.                 try { 
  50.                     if (src.startsWith("data") && pos > 0) { 
  51.                         byte[] img = Base64.decode(src.substring(pos + 7)); 
  52.                         return Image.getInstance(img); 
  53.                     } else if (src.startsWith("http")) { 
  54.                         return Image.getInstance(src); 
  55.                     } 
  56.                 } catch (BadElementException ex) { 
  57.                     return null
  58.                 } catch (IOException ex) { 
  59.                     return null
  60.                 } 
  61.                 return null
  62.             } 
  63.  
  64.             @Override 
  65.             public String getImageRootPath() { 
  66.                 return null
  67.             } 
  68.         }); 
  69.  
  70.  
  71.         // Pipelines 
  72.         PdfWriterPipeline pdf = new PdfWriterPipeline(document, writer); 
  73.         HtmlPipeline html = new HtmlPipeline(htmlContext, pdf); 
  74.         CssResolverPipeline css = new CssResolverPipeline(cssResolver, html); 
  75.  
  76.         // XML Worker 
  77.         XMLWorker worker = new XMLWorker(css, true); 
  78.         XMLParser p = new XMLParser(worker); 
  79.         p.parse(new ByteArrayInputStream(htmlStr.getBytes())); 
  80.  
  81.         document.close(); 
  82.     } 
  83.  
  84.     /** 
  85.      * 读取 HTML 文件 
  86.      * @return 
  87.      */ 
  88.     private static String readHtmlFile() { 
  89.         StringBuffer textHtml = new StringBuffer(); 
  90.         try { 
  91.             File file = new File("printDemo.html"); 
  92.             BufferedReader reader = new BufferedReader(new FileReader(file)); 
  93.             String tempString = null
  94.             // 一次读入一行,直到读入null为文件结束 
  95.             while ((tempString = reader.readLine()) != null) { 
  96.                 textHtml.append(tempString); 
  97.             } 
  98.             reader.close(); 
  99.         } catch (IOException e) { 
  100.             return null
  101.         } 
  102.         return textHtml.toString(); 
  103.     } 
  104.  
  105.     public static void main(String[] args) throws Exception { 
  106.         //读取html文件 
  107.         String htmlStr = readHtmlFile(); 
  108.         //将html文件转成PDF 
  109.         writeToOutputStreamAsPDF(htmlStr); 
  110.     } 

运行程序,打开pdfDemo.pdf,结果如下!

2.4、变量替换方式

上面的html文件,是我们事先已经编辑好的,才能正常渲染。

但是在实际的业务开发的时候,例如下面的商品内容,完全是动态的,还是xxx-202109入库单的名称,以及二维码,都是动态的。

这个时候,我们可以采用freemarker模板引擎,通过定义变量来动态填充内容,直到转换出来的结果就是我们想要的html页面。

当然,还有一种办法,例如下面这个,我们也可以在html页面里面定义${name}变量,然后在读取完文件之后,我们将其变量进行替换成我们想填充的任何值,这其实也是模板引擎最核心的一个玩法。

  1. <html> 
  2.  <head> 
  3.   <meta charset="utf-8"
  4.   <title></title> 
  5.  </head> 
  6.  <body> 
  7.   <div>您好:${name}</div> 
  8.   <div>欢迎,登录博客网站</div> 
  9.  </body> 
  10. </html> 

 三、总结

itext框架是一个非常实用的第三方pdf文件生成库,尤其是面对比较简单的pdf文件内容渲染的时候,它完全满足我们的需求。

但是对于那种复杂的pdf文档,可能需要我们自己单独进行适配开发。具体的深度玩法,大家可以参阅itext官方API。

鉴于笔者才疏学浅,难免会有理解不到位的地方,欢迎网友批评指出!

四、参考

1、博客园 - JAVA使用ItextPDF

 

责任编辑:武晓燕 来源: Java极客技术
相关推荐

2021-07-14 09:00:00

JavaFX开发应用

2021-02-26 11:54:38

MyBatis 插件接口

2022-12-07 08:42:35

2024-04-02 08:58:13

2024-03-05 18:27:43

2021-08-02 07:35:19

Nacos配置中心namespace

2011-01-10 14:41:26

2011-05-03 15:59:00

黑盒打印机

2019-05-05 11:47:09

TypeScript开发Node.js

2022-07-22 12:45:39

GNU

2022-10-30 10:31:42

i2ccpuftrace

2020-05-15 08:07:33

JWT登录单点

2021-03-12 10:01:24

JavaScript 前端表单验证

2021-12-15 08:49:21

gpio 子系统pinctrl 子系统API

2021-01-19 09:06:21

MysqlDjango数据库

2015-04-02 11:22:29

2011-02-22 13:46:27

微软SQL.NET

2021-12-28 08:38:26

Linux 中断唤醒系统Linux 系统

2023-04-26 12:46:43

DockerSpringKubernetes

2022-07-27 08:16:22

搜索引擎Lucene
点赞
收藏

51CTO技术栈公众号