| 网站首页 | 业界新闻 | 小组 | 威客 | 人才 | 下载频道 | 博客 | 代码贴 | 在线编程 | 编程论坛
欢迎加入我们,一同切磋技术
用户名:   
 
密 码:  
共有 330 人关注过本帖
标题:想写一个用网页提取源码的小程序,求大神解答问题
只看楼主 加入收藏
coolnanlove
Rank: 1
等 级:新手上路
帖 子:17
专家分:7
注 册:2011-12-5
结帖率:66.67%
收藏
已结贴  问题点数:20 回复次数:3 
想写一个用网页提取源码的小程序,求大神解答问题
我想写一个程序提取网页源码,然后筛选需要的信息显示出来,可是提取源码的程序弄出来了,发现要是一些动态网站好像不能提取,比如说12306之类的,但是百度的可以正常提取,提取出来写入文件,我想知道如何正常提取这类网页的源码,就像在这个网页上点击查看源文件那样的完全
程序代码:
import *;
import *;
public class TextUrl {
    public static void main(String args[]) throws Exception{
        try{
            PrintWriter pw = new PrintWriter(new FileWriter("F://fuck.txt"));
            URL url = new URL("http://www.);
            InputStreamReader isr = new InputStreamReader(url.openStream());
            BufferedReader br = new BufferedReader(isr);
            String result = null;
            while((result = br.readLine())!=null) {
                pw.println(result);
                System.out.println(result);
            }
            br.close();
            isr.close();
        }catch(Exception ae) {ae.printStackTrace();}
    }
}

2012-11-28 10:42
申琪
Rank: 2
等 级:论坛游民
帖 子:3
专家分:22
注 册:2012-11-23
收藏
得分:20 
那是网站的设置,人家不让你看,肯定查不了!不是程序问题,那是为了代码的安全性,你自己也可以设置自己的代码不可见,就像有的文字不让复制,这都是网站的设计问题,百度去吧
2012-11-28 17:33
coolnanlove
Rank: 1
等 级:新手上路
帖 子:17
专家分:7
注 册:2011-12-5
收藏
得分:0 
回复 2楼 申琪
那你打开这个网页以后右鼠键网页,查看源代码一样可以查看的呀
2012-11-28 18:02
申琪
Rank: 2
等 级:论坛游民
帖 子:3
专家分:22
注 册:2012-11-23
收藏
得分:0 
不是所有的网站都可以的,只是部分网站,如果你想要那样的程序,很简单,百度网页模版小偷,根本思想就是DOM,只适合小型非盈利的网站使用
2012-11-29 11:01
快速回复:想写一个用网页提取源码的小程序,求大神解答问题
数据加载中...
 
   



关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.017213 second(s), 9 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved