JAVA的pdf转图片方法

2017-12-13 17:39:58

JAVA中实现pdf转图片可以通过第三方提供的架包,这里介绍几种常用的,可以根据自身需求选择使用。

一、icepdf。有收费版和开源版,几种方法里最推荐的。转换的效果比较好,能识别我手头文件中的中文,就是转换后可能字体的关系部分字间距有点宽。因为,字体支持是要收费的,所以转换的图片会带有官方的水印。去水印的方法可以查看另一篇文章:icepdf去水印方法

1、下载icepdf的架包,并导入项目中,这里用到4个,如下:

icepdf-core.jar、icepdf-viewer.jar、icepdf-pro.jar(貌似是去水印)、icepdf-pro-intl.jar(貌似是去水印)

icepdf-core.jar、icepdf-viewer.jar下载地址:http://download.csdn.net/detail/romantic_pk/9672082

2、附上代码例子:

  1. import java.awt.image.BufferedImage;
  2. import java.awt.image.RenderedImage;
  3. import java.io.File;
  4. import java.io.IOException;
  5. import javax.imageio.ImageIO;
  6. import org.icepdf.core.exceptions.PDFException;
  7. import org.icepdf.core.exceptions.PDFSecurityException;
  8. import org.icepdf.core.pobjects.Document;
  9. import org.icepdf.core.util.GraphicsRenderingHints;
  10. /**
  11.  * pdf文件转图片(icepdf技术)
  12.  * @author songjinzhou
  13.  * @day 2016-11-03
  14.  */
  15. public class PDF2IMGTest {
  16.     public static void main(String[] args) {
  17.         String filePath = "D:/fileUpload/ftpDownload/xxx.pdf";
  18.         Document document = new Document();
  19.         try {
  20.             document.setFile(filePath);
  21.             float scale = 1.1f;// 缩放比例(大图)
  22.             // float scale = 0.2f;// 缩放比例(小图)
  23.             float rotation = 90f;// 旋转角度
  24.             for (int i = 0; i < document.getNumberOfPages(); i++) {
  25.                 BufferedImage image = (BufferedImage) document.getPageImage(i,
  26.                         GraphicsRenderingHints.SCREEN,
  27.                         org.icepdf.core.pobjects.Page.BOUNDARY_CROPBOX,
  28.                         rotation, scale);
  29.                 RenderedImage rendImage = image;
  30.                 try {
  31.                     File file = new File("D:/fileUpload/ftpDownload/icepdf_a" + i + ".jpg");
  32.                     // 这里png作用是:格式是jpg但有png清晰度
  33.                     ImageIO.write(rendImage, "png", file);
  34.                 } catch (IOException e) {
  35.                     e.printStackTrace();
  36.                 }
  37.                 image.flush();
  38.             }
  39.             document.dispose();
  40.         } catch (PDFException e1) {
  41.             e1.printStackTrace();
  42.         } catch (PDFSecurityException e1) {
  43.             e1.printStackTrace();
  44.         } catch (IOException e1) {
  45.             e1.printStackTrace();
  46.         }
  47.         System.out.println("======================完成============================");
  48.     }
  49. }

从转换效果来看png的清晰度会比jpg相对较高。有个小技巧请看如下两行代码,也就是转换成jpg格式但有png清晰度的图片。

  1. File file = new File("D:/fileUpload/ftpDownload/icepdf_a" + i + ".jpg");
  2. ImageIO.write(rendImage, "png", file);

 

二、pdfbox。转换效果还可以,能识别我手中文件大部分内容,有部分内容无法识别。

1、下载pdfbox的架包,并导入项目,这里用到1个jar包,如下:

pdfbox-app-2.0.2.jar      jar包免费下载地址:http://download.csdn.net/detail/romantic_pk/9679121

2、附上代码例子:

  1. import java.awt.image.BufferedImage;
  2. import java.io.File;
  3. import java.io.IOException;
  4. import javax.imageio.ImageIO;
  5. import org.apache.pdfbox.pdmodel.PDDocument;
  6. import org.apache.pdfbox.rendering.PDFRenderer;
  7. public class PDF2IMGTest {
  8.     public static void main(String[] args) {
  9.         File file = new File("c:\\test.pdf");
  10.         try {
  11.             PDDocument doc = PDDocument.load(file);
  12.             PDFRenderer renderer = new PDFRenderer(doc);
  13.             int pageCount = doc.getNumberOfPages();
  14.             for (int i = 0; i < pageCount; i++) {
  15.                 // 方式1,第二个参数是设置缩放比(即像素)
  16.                 BufferedImage image = renderer.renderImageWithDPI(i, 296);
  17.                 // 方式2,第二个参数是设置缩放比(即像素)
  18.                 // BufferedImage image = renderer.renderImage(i, 2.5f);
  19.                 ImageIO.write(image, "PNG", new File("C:\\pdfbox_image.png"));
  20.             }
  21.         } catch (IOException e) {
  22.             e.printStackTrace();
  23.         }
  24.     }
  25. }

三、jpedal。效果不太理想,貌似对中文支持不太好,下面的lgpl版本是开源版。

1、下载jpedal的架包,并导入项目中,如下:

PdfDecoder decode_pdf = new PdfDecoder(true);
    try {
      decode_pdf.openPdfFile("c:\\test.pdf"); //file
  //   decode_pdf.openPdfFile("C:/jpedalPDF.pdf", "password"); //encrypted file
  //      decode_pdf.openPdfArray(bytes); //bytes is byte[] array with PDF
  //      decode_pdf.openPdfFileFromURL("http://www.mysite.com/jpedalPDF.pdf",false);
  //      decode_pdf.openPdfFileFromInputStream(in, false); 
  
     int start = 1, end = decode_pdf.getPageCount();
     for(int i = start; i < end+1; i++){
       BufferedImage img=decode_pdf.getPageAsImage(i);
       try {
         ImageIO.write(img, "png", new File("C:\\jpedal_image.png"));
       } catch (IOException e) {
         e.printStackTrace();
      } 
     }
     decode_pdf.closePdfFile();
   } catch (PdfException e) {
     e.printStackTrace();
   }
点赞

发表回复

电子邮件地址不会被公开。必填项已用 * 标注