| 网站首页 | 业界新闻 | 小组 | 威客 | 人才 | 下载频道 | 博客 | 代码贴 | 在线编程 | 编程论坛
欢迎加入我们,一同切磋技术
用户名:   
 
密 码:  
共有 1584 人关注过本帖
标题:如何抓取网页
只看楼主 加入收藏
zzjking
Rank: 1
等 级:新手上路
帖 子:69
专家分:0
注 册:2007-7-16
收藏
 问题点数:0 回复次数:4 
如何抓取网页

使用javascript抓取[url=http://news.]http://news.[/url]页面中右边的今日热闻简述。
目的:熟练掌握HTML标签结构,和javascript的对象概念。
要求:新闻页面部下载到本地进行抓取。

 
求助啊~谢谢了~
搜索更多相关主题的帖子: 网页 font 
2007-11-27 16:25
lmhllr
Rank: 8Rank: 8
等 级:贵宾
威 望:44
帖 子:1504
专家分:42
注 册:2005-5-12
收藏
得分:0 
作业?
2007-11-27 16:57
zzjking
Rank: 1
等 级:新手上路
帖 子:69
专家分:0
注 册:2007-7-16
收藏
得分:0 
求助啊~不是作业~是个练习~没思路给点提示也好

2007-11-28 08:48
wakmp
Rank: 1
等 级:新手上路
帖 子:1
专家分:0
注 册:2007-11-29
收藏
得分:0 
javascript 抓不了   得用 asp / php / jsp  这些来抓
2007-11-29 14:40
渚薰
Rank: 6Rank: 6
等 级:贵宾
威 望:22
帖 子:1132
专家分:0
注 册:2006-8-6
收藏
得分:0 
用asp的DOMDocument对象
即dom=Server.createObject("Msxml2.DOMDocument");
具体对象的方法请baidu下

如果是java,就用HttpClient包,请到apache官网上搜索下

整体思路就是,通过服务器获取远端资源(完整的HTML代码),然后解析HTML代码
asp下,解析HTML代码没有现成的程序,或者你自己网上搜索下
可以利用正则表达式,或者把获取的HTML代码,通过js来的DOM来解析

在java下,有现成的HtmlParse可用

个人ajax技术专题站: " target="_blank">http://www. 我不会闲你烦,只会闲你不够烦!
2007-11-30 09:55
快速回复:如何抓取网页
数据加载中...
 
   



关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.016751 second(s), 8 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved