一区二区三区在线-一区二区三区亚洲视频-一区二区三区亚洲-一区二区三区午夜-一区二区三区四区在线视频-一区二区三区四区在线免费观看

服務器之家:專注于服務器技術及軟件下載分享
分類導航

PHP教程|ASP.NET教程|Java教程|ASP教程|編程技術|正則表達式|C/C++|IOS|C#|Swift|Android|VB|R語言|JavaScript|易語言|vb.net|

服務器之家 - 編程語言 - Java教程 - Java讀取PDF中的表格的方法示例

Java讀取PDF中的表格的方法示例

2022-02-25 00:53E-iceblue Java教程

本文主要介紹了Java讀取PDF中的表格的方法示例,文中通過示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下

一、概述

本文以Java示例展示讀取PDF中的表格的方法。這里導入Spire.PDF for Javah中的jar包,并使用其提供的相關及方法來實現獲取表格中的文本內容。下表中整理了本次代碼使用到的主要類、方法及解釋,供參考:

 

類型 描述
PdfDocumentClass Represents a pdf document model.
PdfDocument. loadFromFile (string filename)Method Loads a PDF document.
PdfTableExtractorClass Represents the PDF table extractor.
PdfTableClass Defines a PDF table.
PdfTableExtractor. extractTable (int pageIndex)Method Extracts table from page.
PdfTable.getText(int rowIndex,int columnIndex)Method Gets Text in cell.
FileWriter. write()Method Saves extracted text in table to a .txt file.

 

?二、環境配置

  • IntelliJ IDEA 2018(JDK 1.8.0)
  • PDF 測試文檔
  • PDF Jar包:Spire.PDF for Java Version: 4.10.2

Jar包的兩種導入方法:

1. 手動導入

將jar包下載到本地,解壓。然后執行如下步驟來手動導入:?

Java讀取PDF中的表格的方法示例

Java讀取PDF中的表格的方法示例

Java讀取PDF中的表格的方法示例

2. Maven倉庫下載導入

如果使用maven,需在pom.xml中配置maven路徑,指定依賴,如下:

<repositories>
  <repository>
      <id>com.e-iceblue</id>
      <url>https://repo.e-iceblue.cn/repository/maven-public/</url>
  </repository>
</repositories>
<dependencies>
  <dependency>
      <groupId>e-iceblue</groupId>
      <artifactId>spire.pdf</artifactId>
      <version>4.10.2</version>
  </dependency>
</dependencies>

 

三、讀取PDF中的表格

import com.spire.pdf.*;
import com.spire.pdf.utilities.PdfTable;
import com.spire.pdf.utilities.PdfTableExtractor;

import java.io.FileWriter;
import java.io.IOException;

public class ExtractTable {
  public static void main(String[] args)throws IOException {
      //加載PDF文檔
      PdfDocument pdf = new PdfDocument();
      pdf.loadFromFile("test.pdf");

      //創建StringBuilder類的實例
      StringBuilder builder = new StringBuilder();

      //抽取表格
      PdfTableExtractor extractor = new PdfTableExtractor(pdf);
      PdfTable[] tableLists ;
      for (int page = 0; page < pdf.getPages().getCount(); page++)
      {
          tableLists = extractor.extractTable(page);
          if (tableLists != null && tableLists.length > 0)
          {
              for (PdfTable table : tableLists)
              {
                  int row = table.getRowCount();
                  int column = table.getColumnCount();
                  for (int i = 0; i < row; i++)
                  {
                      for (int j = 0; j < column; j++)
                      {
                          String text = table.getText(i, j);
                          builder.append(text+" ");
                      }
                      builder.append("\r\n");
                  }
              }
          }
      }

      //將提取的表格內容寫入txt文檔
      FileWriter fileWriter = new FileWriter("ExtractedTable.txt");
      fileWriter.write(builder.toString());
      fileWriter.flush();
      fileWriter.close();
  }
}

表格內容讀取結果:

Java讀取PDF中的表格的方法示例

注意事項:

1. 注意使用的PDF Jar包版本為4.10.2,低于此版本的jar包不支持讀取表格;

2. 代碼中的文件路徑為 F:\IDEAProject\Table_PDF\test.pdf 和 F:\IDEAProject\Table_PDF\ExtractedTable.txt , 文件路徑可自定義為其他路徑。

到此這篇關于Java讀取PDF中的表格的方法示例的文章就介紹到這了,更多相關Java讀取PDF表格內容請搜索服務器之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持服務器之家!

原文鏈接:https://www.cnblogs.com/Yesi/p/15437619.html

延伸 · 閱讀

精彩推薦
主站蜘蛛池模板: 9久re在线观看视频精品 | 成人先锋| 精品福利一区 | 国产尤物精品视频 | 日本中文字幕一区二区三区不卡 | 欧美交换乱理伦片120秒 | 免费二区 | 隔壁老王国产精品福利 | 亚洲国产午夜看片 | 久久久久夜 | 日韩黄色录像 | 黑人粗长巨茎小说 | 日韩高清一区二区三区不卡 | 亚洲欧美日韩国产一区图片 | 免看一级a一片成人123 | 欧美日韩中文国产一区 | 亚洲一区二区三区免费视频 | 爱爱亚洲 | 短篇最污的乱淫伦小说全集 | h动态图男女啪啪27报 | 日韩精品亚洲专区在线影视 | 亚洲精品国产福利片 | 亚洲福利在线观看 | 国产成人精品视频一区二区不卡 | 韩国久播影院理论片不卡影院 | 亲爱的客栈第二季免费观看完整版 | 日韩欧美在线视频一区二区 | 欧美日韩国产另类一区二区三区 | 天美传媒影视在线免费观看 | 91麻豆国产福利在线观看 | 99久久国产综合精品女小说 | 3d蒂法受辱在线播放 | 百合漫画咱啪全彩抚慰 | 美女靠逼免费网站 | 日本肉体xxxx| 欧美大美bbb和大白屁股 | 我被黑人彻底征服的全文 | 熟睡中的麻麻大白屁股小说 | 桃色视频软件 | 日韩精品免费看 | 青青草在视线频久久 |