登录
首页 » 文档处理 » C# 将 PDF 转化成文本格式

C# 将 PDF 转化成文本格式

于 2023-07-08 发布 文件大小:8.73 MB
0 39
下载积分: 2 下载次数: 1

代码说明:

翻译 maninwest@Codeforge 作者: Dan Letecky @CodeProject使用PDFBox 和 IKVM.NET在 .NET 中解析PDF 文件(托管代码)如何解析 PDF文件在 .NET 中提取 PDF 文本有多个方式:·         Microsoft IFilter接口和Adobe IFilter 实现.·         iTextSharp·         PDFBox1. 如何使用Adobe PDF IFilter解析 PDF 文件要使用 IFilter 接口解析 PDF 文件,需要以下条件:·         Windows 2000 或以上版本·         Adobe Acrobat 或 Reader 7.0.5以上版本 (或者单机版 Adobe PDF IFilter [adobe.com])·         IFilter COM wrapper class [dotlucene.net]示例代码using IFilter; // ... public static string ExtractTextFromPdf(string path) { return DefaultParser.Extract(path); } 下载一个示例代码·         Parsing PDF Files using IFilter [squarepdf.net]如果使用Adobe Acrobat Reader 自带的 PDF IFilter ,需要重命名进程为 "filtdump.e

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • 696518资源总数
  • 104349会员总数
  • 32今日下载