java实现pdf转为word

Installing Spire.Pdf.jar

如果您创建了一个 Maven 项目,您可以使用以下配置轻松地在您的应用程序中导入 jar。对于非 Maven 项目,请从此链接下载 jar 文件  并手动将其添加为应用程序中的依赖项。

<repositories>  
    <repository>  
        <id>com.e-iceblue</id>  
        <name>e-iceblue</name>  
        <url>http://repo.e-iceblue.com/nexus/content/groups/public/</url>  
    </repository>  
</repositories>  
<dependencies>  
    <dependency>  
        <groupId> e-iceblue </groupId>  
        <artifactId>spire.pdf</artifactId>  
        <verson>4.1.2</version>  
    </dependency>  
</dependencies>  

Convert PDF to DOC or DOCX

通过使用这个库,从 PDF 到 Word 或 Excel 的转换非常简单。创建一个 PdfDocument 对象来加载原始 PDF 文档,然后调用 saveToFile() 方法将 PDF 保存为 .doc、.docx、.xls 或 .xlsx 文件格式。

import com.spire.pdf.FileFormat;  
import com.spire.pdf.PdfDocument;  
  
public class ConvertPdfToWord {  
    public static void main(String[] args) {  
        //Create a PdfDocument instance  
        PdfDocument pdf = new PdfDocument();  
        //Load a PDF file  
        pdf.loadFromFile("C:\\Users\\Administrator\\Desktop\\original.pdf");  
        //Save to .docx file  
        pdf.saveToFile("ToWord.docx", FileFormat.DOCX);  
        pdf.close();  
    }  
}  

Convert PDF to XLS or XLSX

import com.spire.pdf.FileFormat;  
import com.spire.pdf.PdfDocument;  
  
public class ConvertPdfToExcel {  
    public static void main(String[] args) {  
        //Create a PdfDocument instance  
        PdfDocument pdf = new PdfDocument();  
        //Load a PDF file  
        pdf.loadFromFile("C:\\Users\\Administrator\\Desktop\\original.pdf");  
        //Save to .xlsx file  
        pdf.saveToFile("ToExcel.xlsx", FileFormat.XLSX);  
        pdf.close();  
    }  
}  

Convert PDF to PNG

将 PDF 转换为图像需要更多的代码,但它并不复杂。加载PDF文件后,调用saveAsImage()方法将特定页面保存为图像数据。然后,使用 ImageIO.write() 方法将数据写入 .png 文件。

import com.spire.pdf.PdfDocument;  
import javax.imageio.ImageIO;  
import java.awt.image.BufferedImage;  
import java.io.File;  
import java.io.IOException;  
  
public class ConvertPdfToImage {  
  
    public static void main(String[] args) throws IOException {  
  
        //Create a PdfDocument instance  
        PdfDocument pdf = new PdfDocument();  
          
        //Load a PDF file  
        pdf.loadFromFile("C:\\Users\\Administrator\\Desktop\\original.pdf");  
  
        //Declare a BufferedImage variable  
        BufferedImage image;  
          
        //Loop through the pages  
        for (int i = 0; i < pdf.getPages().getCount(); i++) {  
              
            //Save the specific page as image data  
            image = pdf.saveAsImage(i);  
              
            //Write image data to png file  
            File file = new File(String.format("out/ToImage-%d.png", i));  
            ImageIO.write(image, "PNG", file);  
        }  
        pdf.close();  
    }  
}  

结论

互联网上有许多解决方案可以以编程方式进行文件格式转换。事实证明,这种情况是可靠的。转换后的文档保留了原始文件的布局和几乎所有内容。除了上面提到的格式,Spire.PDF 还支持将 PDF 转换为 HTML、SVG、PDF/A 等。

 

转载 https://www.c-sharpcorner.com/article/java-convert-pdf-to-word-excel-or-image/

 

上一篇:S7-300 符号IO域的组态 HMI变量指针化的方法以及应用,在一个IO域显示多个温度值的办法


下一篇:更新HMI设备操作系统