校园春色亚洲色图_亚洲视频分类_中文字幕精品一区二区精品_麻豆一区区三区四区产品精品蜜桃

主頁 > 知識庫 > 使用pdfbox實現pdf文本提取和合并功能示例

使用pdfbox實現pdf文本提取和合并功能示例

熱門標簽:地圖標注多少錢一張 福州人工智能電銷機器人加盟 云狐人工智能電話機器人 廣州銷售外呼系統定制 電銷機器人 數據 ai電銷機器人對貸款有幫助嗎 400電話辦理信任翰諾科技 怎樣給陜西地圖標注顏色 宿遷智能外呼系統排名

有時我們需要對PDF文件進行一些處理,提取文本、合并等。以前我們使用A-PDF Text Extractor免費工具,為什么不自己寫一個呢?
現在我們可以使用PDFBox-0.7.3這個開源類庫. 下載解包后引用:

復制代碼 代碼如下:

PDFBox-0.7.3.dll
IKVM.GNU.Classpath.dll

新建一個項目,代碼很簡單:

復制代碼 代碼如下:

public static string ParseToTxtStringUsingPDFBox(string filename){
PDDocument doc = PDDocument.load(filename);
PDFTextStripper stripper = new PDFTextStripper();
return stripper.getText(doc);
}

獲得這個textString,再把它們寫成磁盤文件就可以了, 像這樣的方法:

復制代碼 代碼如下:

public static void WriteToTextFile(string str,string txtpath)
{
if (string.IsNullOrEmpty(txtpath))
throw new ArgumentNullException("Output file path should not be Null");
using (var txtWriter = new StreamWriter(txtpath))
{
txtWriter.Write(str);
txtWriter.Close();
}
}

其它的功能您可以自行發揮了. 這個類庫目前支持:

PDF to text extraction
Merge PDF Documents
PDF Document Encryption/Decryption
Lucene Search Engine Integration
Fill in form data FDF and XFDF
Create a PDF from a text file
Create images from PDF pages
Print a PDF

標簽:大興安嶺 曲靖 延安 焦作 黃南 新疆 宜春 綿陽

巨人網絡通訊聲明:本文標題《使用pdfbox實現pdf文本提取和合并功能示例》,本文關鍵詞  使用,pdfbox,實現,pdf,文本,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《使用pdfbox實現pdf文本提取和合并功能示例》相關的同類信息!
  • 本頁收集關于使用pdfbox實現pdf文本提取和合并功能示例的相關信息資訊供網民參考!
  • 推薦文章
    主站蜘蛛池模板: 龙南县| 塔城市| 嵩明县| 陈巴尔虎旗| 漳平市| 泾川县| 石楼县| 那坡县| 泰州市| 石首市| 琼海市| 昌都县| 安陆市| 淄博市| 郴州市| 铁岭市| 藁城市| 安岳县| 娱乐| 米林县| 三门县| 库尔勒市| 沙坪坝区| 社旗县| 厦门市| 孝感市| 山阳县| 剑河县| 广西| 南宫市| 建瓯市| 长阳| 玉树县| 竹北市| 修水县| 富平县| 郎溪县| 双江| 旬阳县| 芜湖县| 乐亭县|