| 网站首页 | 业界新闻 | 小组 | 威客 | 人才 | 下载频道 | 博客 | 代码贴 | 在线编程 | 编程论坛
欢迎加入我们,一同切磋技术
用户名:   
 
密 码:  
共有 2156 人关注过本帖
标题:在c#中如何从pdf中提取文字内容
只看楼主 加入收藏
brave2
Rank: 1
等 级:新手上路
帖 子:16
专家分:0
注 册:2007-7-28
收藏
 问题点数:0 回复次数:2 
在c#中如何从pdf中提取文字内容
在c#中有什么办法提取pdf文件中的文字内容?

[[it] 本帖最后由 brave2 于 2008-6-1 22:22 编辑 [/it]]
搜索更多相关主题的帖子: pdf 文字 
2008-06-01 12:42
brave2
Rank: 1
等 级:新手上路
帖 子:16
专家分:0
注 册:2007-7-28
收藏
得分:0 
顶!
2008-06-02 12:27
xiaoge123
Rank: 1
等 级:新手上路
威 望:2
帖 子:13
专家分:1
注 册:2019-1-9
收藏
得分:0 
参考下面的代码提取pdf中的文本,还有就是需要用到Spire.PDF组件,在网上下一个就好
下载参考:https://www.
程序代码:
using System.Text;
using System.Xml;
using Spire.Pdf;
namespace _test
{
    class Program
    {
        static void Main(string[] args)
        {
            PdfDocument doc = new PdfDocument();

            //加载PDF文档
            doc.LoadFromFile("D:\\test.pdf");

            StringBuilder content = new StringBuilder();

            //提取PDF所有页的文本
            foreach (PdfPageBase page in doc.Pages)
            {
                content.Append(page.ExtractText());
            }

            String fileName = "D:\\获取文本.txt";
            File.WriteAllText(fileName, content.ToString());
            }
    }
}
2019-01-10 16:55
快速回复:在c#中如何从pdf中提取文字内容
数据加载中...
 
   



关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.015553 second(s), 7 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved