Java 获取PDF指定区域内的文本

 时间:2026-02-15 22:43:51

1、方法1:通过e-iceblue官网下载。下载后,解压文件,并将lib文件夹下的Spire.Pdf.jar文件导入到java程序。如下图:

Java 获取PDF指定区域内的文本

2、方法2:可通过maven仓库安装导入,配置路径及导入方法可参考链接里的步骤:https://www.e-iceblue.cn/licensing/install-spirepdf-for-java-from-maven-repository.html 。

3、测试文档如下,读取红色矩形框内的文本内容:

Java 获取PDF指定区域内的文本

1、import com.spire.pdf.*;


import java.awt.*;
import java.io.FileWriter;
import java.io.IOException;
public class GetText {
   public static void main(String[] args) {
       //加载PDF文档
       PdfDocument pdf = new PdfDocument();
       pdf.loadFromFile("sample.pdf");
       //获取第一页
       PdfPageBase page = pdf.getPages().get(0);
       //提取指定矩形区域的文本,写入到txt文档
       String text = page.extractText(new Rectangle(60, 60, 500, 100));
       StringBuilder sb = new StringBuilder();
       sb.append(text);

       FileWriter writer;


       try {
           writer = new FileWriter("GetSpecifiedText.txt");
           writer.write(sb.toString());
           writer.flush();
       } catch (IOException e) {
           e.printStackTrace();
       }
       pdf.dispose();
   }
}

2、文本读取结果:

Java 获取PDF指定区域内的文本

  • 如何把数据库中一列添加到comboBox下拉列表中
  • vue中如何监听对象中的对象值的变化
  • SQLServer数据导入Excel表格数据
  • 在VBA中,【CDate】的实例应用!
  • c#操作EXCEL如何根据文本内容和宽度自动换行
  • 热门搜索
    创卫手抄报内容 文明交通手抄报图片 国学经典手抄报图片 消防安全手抄报大全 生活中的小数手抄报 文明旅游手抄报 艺术节手抄报内容 保护环境手抄报大全 关于鸟的手抄报 小学生新年手抄报