Java 读取PDF中的表格

 时间:2026-02-14 18:57:28

1、将jar包下载到本地,解压。然后执行如下步骤来手动导入:

Java 读取PDF中的表格

2、找到本地路径下的jar文件,点击OK,添加到列表,

Java 读取PDF中的表格

3、添加后,勾选选项,点击Apply完成jar导入。

Java 读取PDF中的表格

1、import com.spire.pdf.*;


import com.spire.pdf.utilities.PdfTable;
import com.spire.pdf.utilities.PdfTableExtractor;
import java.io.FileWriter;
import java.io.IOException;
public class ExtractTable {
   public static void main(String[] args)throws IOException {
       //加载PDF文档
       PdfDocument pdf = new PdfDocument();
       pdf.loadFromFile("test.pdf");
       //创建StringBuilder类的实例
       StringBuilder builder = new StringBuilder();
       //抽取表格
       PdfTableExtractor extractor = new PdfTableExtractor(pdf);
       PdfTable[] tableLists ;
       for (int page = 0; page < pdf.getPages().getCount(); page++)
       {
           tableLists = extractor.extractTable(page);
           if (tableLists != null && tableLists.length > 0)
           {
               for (PdfTable table : tableLists)
               {
                   int row = table.getRowCount();
                   int column = table.getColumnCount();
                   for (int i = 0; i < row; i++)
                   {
                       for (int j = 0; j < column; j++)
                       {
                           String text = table.getText(i, j);
                           builder.append(text+" ");
                       }
                       builder.append("\r\n");
                   }
               }
           }
       }
       //将提取的表格内容写入txt文档
       FileWriter fileWriter = new FileWriter("ExtractedTable.txt");
       fileWriter.write(builder.toString());
       fileWriter.flush();
       fileWriter.close();
   }
}

2、执行代码,生成txt文档。如图表格读取结果:

Java 读取PDF中的表格

  • C# 提取PDF中的表格
  • 怎样测试电脑某个端口是否打开?
  • 跟踪路由节点tracert
  • 无线网卡开启或禁用方法
  • 定时任务怎么实现
  • 热门搜索
    我运动我健康手抄报 三年级春节手抄报大全 关于文明的手抄报内容 手抄报边框素材 防电手抄报 学法懂法守法手抄报 古诗手抄报版面设计 古诗配画手抄报 我爱运动手抄报 古诗手抄报图片大全