版主,来改标题(快速提取电话号码)
快速提取网页中的电话号码要求 :
1. 给定一个网页或是一个网址,从网页文件中提取出电话号码放到一个txt文件中
2. 特殊电话号码不提取。例如:110,120,400****之类的电话
3. 提取手机号或者固定电话号。手机号11位,手机区号不需要;固定电话号码7位或8位,区号3位或4位,中间‘-’连接符可省略
4. 速度越快越好,但要保证一定的正确率,不要求100%能提取出所有合法的电话号码
5. 最后按执行速度和正确率给分
6. 对各个网页通用(该条属补充要求)
7. 想起来再补充
注:大家还有什么要补充的跟帖说明。
后记:去年还是前年,忘记了,应朋友邀请写了一个从网页或是网址中提取电话号码的一段小代码。当时随便一写,应付了事。速度非常慢,根据网页大小需要1-6分钟不等。今天突然想起来想看看那段代码,却又找不到了。正好发在这里给大家当个练习。
所以,我这个也没有标准答案。大家尽情发挥吧!!!
附测试文件:
桌面.rar
(13.25 KB)
[ 本帖最后由 taohua300 于 2012-10-20 14:22 编辑 ]