| 网站首页 | 业界新闻 | 小组 | 威客 | 人才 | 下载频道 | 博客 | 代码贴 | 在线编程 | 编程论坛
欢迎加入我们,一同切磋技术
用户名:   
 
密 码:  
共有 427 人关注过本帖
标题:求助高人,HTML标签匹配的问题
取消只看楼主 加入收藏
dqy583698062
Rank: 1
等 级:新手上路
帖 子:2
专家分:0
注 册:2011-4-4
结帖率:0
收藏
 问题点数:0 回复次数:0 
求助高人,HTML标签匹配的问题
public String getContent()
    {
        String str = null;
        String tempStr =null;
        String regex = "<body.*?>(.*?)<\\/body>";
        Pattern pt=(regex);
        Matcher mt=pt.matcher(strContent);
         while(mt.find()){
             str = mt.group();
         }
        String regex1 = "<div id.*?</div>";
        Pattern p=(regex1);
        Matcher m=p.matcher(str);
        while(m.find()){
            str = m.group();
            tempStr+=str;
        }
      //  System.out.println();
     //   tempStr = tempStr.replaceAll("<style[^>]*?>.*?</style>","");
     //   tempStr = tempStr.replaceAll("<script[^>]*?>.*?<\\/script>","");
     //   tempStr = tempStr.replaceAll("<noscript[^>]*?>.*?</noscript>", "");
        tempStr = tempStr.replaceAll("<a href=.*?</a>", "").replaceAll("<a target.*?</a>","").replaceAll("\\s*", "");
        tempStr = tempStr.replaceAll("\\&[a-zA-Z]{1,10};", "").replaceAll(   
                "<[^>]*>", "").replaceAll("\\s*", "").replaceAll("null", "");
        length = tempStr.length();
     //    System.out.println(tempStr);

        return tempStr;
    }

请问:tempStr = tempStr.replaceAll("<a href=.*?</a>", "").replaceAll("<a target.*?</a>","").replaceAll("\\s*", "");
        tempStr = tempStr.replaceAll("\\&[a-zA-Z]{1,10};", "").replaceAll(   
                "<[^>]*>", "").replaceAll("\\s*", "").replaceAll("null", "");
        length = tempStr.length();
是什么意思啊?感谢!!!
搜索更多相关主题的帖子: null 
2011-04-16 14:49
快速回复:求助高人,HTML标签匹配的问题
数据加载中...
 
   



关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.017296 second(s), 8 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved