| 网站首页 | 业界新闻 | 小组 | 威客 | 人才 | 下载频道 | 博客 | 代码贴 | 在线编程 | 编程论坛
欢迎加入我们,一同切磋技术
用户名:   
 
密 码:  
共有 1979 人关注过本帖
标题:【求助】我想用java读取Word 和pdf的文件
取消只看楼主 加入收藏
小霖
Rank: 1
等 级:新手上路
帖 子:20
专家分:2
注 册:2009-4-11
结帖率:100%
收藏
 问题点数:0 回复次数:0 
【求助】我想用java读取Word 和pdf的文件
【问题】网上看大都说用tm-extractors-0.4.jar包  ,此包已下,但我不知道放在那里才能用。

我读取Word文件的代码如下:
import
import
import org.textmining.text.extraction.WordExtractor;//这个说软件包不存在
public class WordReader {

 public static String readDoc(String doc) throws Exception {
  // 创建输入流读取doc文件
  FileInputStream in = new FileInputStream(new File(doc));
  WordExtractor extractor = null;//红字为NetBeans 提示找不到符号
  String text = null;
  // 创建WordExtractor
  extractor = new WordExtractor();
  // 对doc文件进行提取
  text = extractor.extractText(in);
  return text;
 }
 /**
  * @param args
  */
 public static void main(String[] args) {
  // TODO Auto-generated method stub
        try{
         String text = WordReader.readDoc("C://abc.doc");
         System.out.println(text);
        }catch(Exception ex){
         ex.printStackTrace();
        }
 }
}
搜索更多相关主题的帖子: 文件 Word pdf java 
2009-11-05 22:45
快速回复:【求助】我想用java读取Word 和pdf的文件
数据加载中...
 
   



关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.023535 second(s), 8 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved