| 网站首页 | 业界新闻 | 小组 | 威客 | 人才 | 下载频道 | 博客 | 代码贴 | 在线编程 | 编程论坛
欢迎加入我们,一同切磋技术
用户名:   
 
密 码:  
共有 2449 人关注过本帖
标题:[求助]做个HTML解析器,20000个论坛币!!急!!
只看楼主 加入收藏
tianykun
Rank: 4
等 级:禁止访问
威 望:11
帖 子:3727
专家分:0
注 册:2005-11-13
收藏
得分:0 

我JAVA,J2EE是混的啊。。。。
上学期都搞VHDL啊。。。。

离开这里,离开你的视野,归隐到属于我的地方,无论何处
2007-03-23 21:54
tianykun
Rank: 4
等 级:禁止访问
威 望:11
帖 子:3727
专家分:0
注 册:2005-11-13
收藏
得分:0 
http://bbs.bc-cn.net/viewthread.php?tid=124231&star=at#
我在网上就找到这个了。。。

离开这里,离开你的视野,归隐到属于我的地方,无论何处
2007-03-23 21:56
live41
Rank: 10Rank: 10Rank: 10
等 级:贵宾
威 望:67
帖 子:12442
专家分:0
注 册:2004-7-22
收藏
得分:0 
没发现有什么解析的语句
2007-03-23 22:02
live41
Rank: 10Rank: 10Rank: 10
等 级:贵宾
威 望:67
帖 子:12442
专家分:0
注 册:2004-7-22
收藏
得分:0 
你先用一个string变量储存起整个源文件

然后用一个int变量做index,逐字扫描

当遇到<,压盏,到>出盏,然后分析出tag name和attributes到一个类,

然后类里面有一个arraylist做为叶子结点,

这样便可以将简单的解析到树状结构体,用你最熟悉的语言java去写吧……
2007-03-23 22:04
live41
Rank: 10Rank: 10Rank: 10
等 级:贵宾
威 望:67
帖 子:12442
专家分:0
注 册:2004-7-22
收藏
得分:0 

string source = "";

int idx = 0;

struct Attribute{
string attriName;
string attriValue;
}

class TagNode{
string tagName;
Attribute[] attriList;
TagNode[] childNodes;
} //如果是C#的话,可以用ArrayList代替数组

暂时就这么先弄个,自己写个超简单的html代码先试试

男人不要让人觉得蠢,我的原则是,男人可以样衰,但不可以蠢!


[此贴子已经被作者于2007-3-23 22:09:06编辑过]

2007-03-23 22:06
tianykun
Rank: 4
等 级:禁止访问
威 望:11
帖 子:3727
专家分:0
注 册:2005-11-13
收藏
得分:0 


离开这里,离开你的视野,归隐到属于我的地方,无论何处
2007-03-23 22:08
live41
Rank: 10Rank: 10Rank: 10
等 级:贵宾
威 望:67
帖 子:12442
专家分:0
注 册:2004-7-22
收藏
得分:0 
我去冲凉了,8
2007-03-23 22:09
tianykun
Rank: 4
等 级:禁止访问
威 望:11
帖 子:3727
专家分:0
注 册:2005-11-13
收藏
得分:0 
好。。谢谢。。。
我试下。。。。。

离开这里,离开你的视野,归隐到属于我的地方,无论何处
2007-03-23 22:11
yms123
Rank: 16Rank: 16Rank: 16Rank: 16
等 级:版主
威 望:209
帖 子:12488
专家分:19042
注 册:2004-7-17
收藏
得分:0 
如果是这样的话,也可以效仿DOM结构(当然不用Javascript来写),用Java建立一个仿造DOM的HTML解析类。
或者用C#建也可以。
2007-03-23 22:18
rainic
Rank: 6Rank: 6
等 级:贵宾
威 望:27
帖 子:2367
专家分:0
注 册:2005-8-9
收藏
得分:0 
看完了...都不知道要什么样的结果...其实是不是把&lt;td&gt;&lt;/td&gt;之类东西之间的内容取出来?

2007-03-23 22:26
快速回复:[求助]做个HTML解析器,20000个论坛币!!急!!
数据加载中...
 
   



关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.041072 second(s), 7 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved