| 网站首页 | 业界新闻 | 小组 | 威客 | 人才 | 下载频道 | 博客 | 代码贴 | 在线编程 | 编程论坛
欢迎加入我们,一同切磋技术
用户名:   
 
密 码:  
共有 2449 人关注过本帖
标题:[求助]做个HTML解析器,20000个论坛币!!急!!
只看楼主 加入收藏
live41
Rank: 10Rank: 10Rank: 10
等 级:贵宾
威 望:67
帖 子:12442
专家分:0
注 册:2004-7-22
收藏
得分:0 
以下是引用yms123在2007-3-23 22:18:00的发言:
如果是这样的话,也可以效仿DOM结构(当然不用Javascript来写),用Java建立一个仿造DOM的HTML解析类。
或者用C#建也可以。

老兄,关键呢? 谁也知道要搭建一个这样的解析类

现在楼主就是要搭建这样的解析类的简化版先

2007-03-23 22:59
live41
Rank: 10Rank: 10Rank: 10
等 级:贵宾
威 望:67
帖 子:12442
专家分:0
注 册:2004-7-22
收藏
得分:0 
关键上算法,配对,识别,容错

<a href=...></a>

<a href=... /> 是一样的,配对容错要做的很多

还有算法,为什么要另起一个索引int,而且要全局,就是为了让所有方法中共一个遍历的当然位置
2007-03-23 23:01
live41
Rank: 10Rank: 10Rank: 10
等 级:贵宾
威 望:67
帖 子:12442
专家分:0
注 册:2004-7-22
收藏
得分:0 
我花了一周的时间去弄个css解析类,弄得头晕的是那些单位,有相对大小和绝对大小,还要换算是不同的……

如果那么容易,说弄个dom就弄个dom,还用得自己写算法吗?

谁也知道弄个dom,其实dom的核心就是那棵解析好的html树啊
2007-03-23 23:04
rainic
Rank: 6Rank: 6
等 级:贵宾
威 望:27
帖 子:2367
专家分:0
注 册:2005-8-9
收藏
得分:0 
<a href=...></a>
<a href=... /> 是一样的,配对容错要做的很多
=================================
是不一样的

<br>
<br />是一样的
<img ... />
<img ..></img>是一样的.不过"<img ..></img>"这个已经不用了

2007-03-23 23:30
live41
Rank: 10Rank: 10Rank: 10
等 级:贵宾
威 望:67
帖 子:12442
专家分:0
注 册:2004-7-22
收藏
得分:0 
以下是引用rainic在2007-3-23 23:30:05的发言:
<a href=...></a>
<a href=... /> 是一样的,配对容错要做的很多
=================================
是不一样的

<br>
<br />是一样的
<img ... />
<img ..></img>是一样的.不过"<img ..></img>"这个已经不用了

怎么不一样法?

2007-03-23 23:38
live41
Rank: 10Rank: 10Rank: 10
等 级:贵宾
威 望:67
帖 子:12442
专家分:0
注 册:2004-7-22
收藏
得分:0 
http://www.zhtv.com/NewsList/zhtvnews.aspx

这个页面的<a href=... />怎么解析?
2007-03-23 23:43
live41
Rank: 10Rank: 10Rank: 10
等 级:贵宾
威 望:67
帖 子:12442
专家分:0
注 册:2004-7-22
收藏
得分:0 

不要告诉我区别是写法不同和写法标准问题

2007-03-23 23:53
live41
Rank: 10Rank: 10Rank: 10
等 级:贵宾
威 望:67
帖 子:12442
专家分:0
注 册:2004-7-22
收藏
得分:0 
kao,居然溜了~

我去睡觉了~
2007-03-24 00:00
rainic
Rank: 6Rank: 6
等 级:贵宾
威 望:27
帖 子:2367
专家分:0
注 册:2005-8-9
收藏
得分:0 
是哦...

<a href=... />都没有结束的时候的...一直到下一个<a>还结束...

2007-03-24 00:08
live41
Rank: 10Rank: 10Rank: 10
等 级:贵宾
威 望:67
帖 子:12442
专家分:0
注 册:2004-7-22
收藏
得分:0 
以下是引用rainic在2007-3-24 0:08:52的发言:
是哦...

<a href=... />都没有结束的时候的...一直到下一个<a>还结束...

你错了,你又错

首先,我还没睡,

其次,不是一直到下一个<a>还没结束,你仔细留意页面

http://www.zhtv.com/NewsList/zhtvnews.aspx

2007-03-24 00:14
快速回复:[求助]做个HTML解析器,20000个论坛币!!急!!
数据加载中...
 
   



关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.025057 second(s), 7 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved