将段html代码弄成全局的,在弄个全局的位置变量
int m_idx
然后就开始扫描,不断m_idx++,遇到空白符号\r\n\t之类就跳过
遇到“<”开始压盏,遇到“>”停止压盏,并将读取到的东西弹出,最好压盏的时候一并处理标签名字和值
正如老千说的,java提供了方便的接口,不用自己写
另外用正则解析html是不可行的,遇到大页面的时候会处理很久很久很久……
int m_idx
然后就开始扫描,不断m_idx++,遇到空白符号\r\n\t之类就跳过
遇到“<”开始压盏,遇到“>”停止压盏,并将读取到的东西弹出,最好压盏的时候一并处理标签名字和值
正如老千说的,java提供了方便的接口,不用自己写
另外用正则解析html是不可行的,遇到大页面的时候会处理很久很久很久……
[此贴子已经被作者于2007-3-8 14:45:03编辑过]