谁可以提供些资料啊?
百度的搜索页面的内容是怎么实现的?不是要讨论技术,是想大家帮忙找些资料, 算作灌水吧
例如一个页面,它怎么识别出哪一块是标题,哪一块是主要内容,哪些是广告要跳过之类的
vips算法没有例子啊~~晕死
[此贴子已经被作者于2006-10-18 9:27:02编辑过]
我在写网页关键内容提取程序
例如:
http://tech.sina.com.cn/t/2006-10-17/13151187980.shtml
给这样一个网页,要里面的标题《手机用户将可以不改号选择运营商所有资费套餐》及里面内容“新浪科技讯 10月17日,……”之类的整篇文章
而其他的都需要,怎么从众多标签中提取出关键内容啊?