|
网站首页
|
业界新闻
|
小组
|
威客
|
人才
|
下载频道
|
博客
|
代码贴
|
在线编程
|
编程论坛
|
登录
注册
短消息
我发表的主题
我参与的主题
我收藏的贴子
我上传的附件
我下过的附件
编辑个人资料
我的博客
用户控制面板
搜索
道具
恢复默认风格
碧海青天
秋意盎然
棕红预览
粉色回忆
蓝雅绿
紫色淡雅
青青河草
e点小镇
橘子红了
红红夜思
水晶紫色
雪花飘飘
新年快乐
风格
短消息
论坛展区
帮助
编程论坛
→
WEB开发
→
『 JavaScript论坛 』
→ 如何抓取网页
我的收件箱(0)
欢迎加入我们,一同切磋技术
用户名:
密 码:
共有
1588
人关注过本帖
标题:
如何抓取网页
只看楼主
加入收藏
zzjking
等 级:
新手上路
帖 子:69
专家分:0
注 册:2007-7-16
楼主
收藏
问题点数:0 回复次数:4
如何抓取网页
使用
javascript
抓取
[url=http://news.]
http://news.
[/url]
页面中右边的今日热闻简述。
目的:熟练掌握
HTML
标签结构,和
javascript
的对象概念。
要求:新闻页面部下载到本地进行抓取。
求助啊~谢谢了~
搜索更多相关主题的帖子:
网页
font
2007-11-27 16:25
举报帖子
使用道具
赠送鲜花
lmhllr
等 级:
贵宾
威 望:
44
帖 子:1504
专家分:42
注 册:2005-5-12
第
2
楼
收藏
得分:0
作业?
2007-11-27 16:57
举报帖子
使用道具
赠送鲜花
zzjking
等 级:
新手上路
帖 子:69
专家分:0
注 册:2007-7-16
第
3
楼
收藏
得分:0
求助啊~不是作业~是个练习~没思路给点提示也好
2007-11-28 08:48
举报帖子
使用道具
赠送鲜花
wakmp
等 级:
新手上路
帖 子:1
专家分:0
注 册:2007-11-29
第
4
楼
收藏
得分:0
javascript 抓不了
得用 asp / php / jsp
这些来抓
2007-11-29 14:40
举报帖子
使用道具
赠送鲜花
渚薰
等 级:
贵宾
威 望:
22
帖 子:1132
专家分:0
注 册:2006-8-6
第
5
楼
收藏
得分:0
用asp的DOMDocument对象
即dom=Server.createObject("Msxml2.DOMDocument");
具体对象的方法请baidu下
如果是java,就用HttpClient包,请到apache官网上搜索下
整体思路就是,通过服务器获取远端资源(完整的HTML代码),然后解析HTML代码
asp下,解析HTML代码没有现成的程序,或者你自己网上搜索下
可以利用正则表达式,或者把获取的HTML代码,通过js来的DOM来解析
在java下,有现成的HtmlParse可用
个人ajax技术专题站:
" target="_blank">http://www.
我不会闲你烦,只会闲你不够烦!
2007-11-30 09:55
举报帖子
使用道具
赠送鲜花
5
1/1页
1
快速回复:
如何抓取网页
数据加载中...
关于我们
|
广告合作
|
编程中国
|
清除Cookies
|
TOP
|
手机版
编程中国
版权所有,并保留所有权利。
Powered by
Discuz
, Processed in 0.012527 second(s), 7 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved