求助高人,HTML标签匹配的问题
public String getContent(){
String str = null;
String tempStr =null;
String regex = "<body.*?>(.*?)<\\/body>";
Pattern pt=(regex);
Matcher mt=pt.matcher(strContent);
while(mt.find()){
str = mt.group();
}
String regex1 = "<div id.*?</div>";
Pattern p=(regex1);
Matcher m=p.matcher(str);
while(m.find()){
str = m.group();
tempStr+=str;
}
// System.out.println();
// tempStr = tempStr.replaceAll("<style[^>]*?>.*?</style>","");
// tempStr = tempStr.replaceAll("<script[^>]*?>.*?<\\/script>","");
// tempStr = tempStr.replaceAll("<noscript[^>]*?>.*?</noscript>", "");
tempStr = tempStr.replaceAll("<a href=.*?</a>", "").replaceAll("<a target.*?</a>","").replaceAll("\\s*", "");
tempStr = tempStr.replaceAll("\\&[a-zA-Z]{1,10};", "").replaceAll(
"<[^>]*>", "").replaceAll("\\s*", "").replaceAll("null", "");
length = tempStr.length();
// System.out.println(tempStr);
return tempStr;
}
请问:tempStr = tempStr.replaceAll("<a href=.*?</a>", "").replaceAll("<a target.*?</a>","").replaceAll("\\s*", "");
tempStr = tempStr.replaceAll("\\&[a-zA-Z]{1,10};", "").replaceAll(
"<[^>]*>", "").replaceAll("\\s*", "").replaceAll("null", "");
length = tempStr.length();
是什么意思啊?感谢!!!