关于链接外部网页或文献的问题。
请问各位大神 如何编一个程序 自动在网页或文献中检索关键字?
现在的搜索引擎都是这样子:抓源码,把关键字存起来,搜索的时候直接告诉你那个网页有这个关键字,并且提供一小段摘要,至于它是怎么抓的我不知道.
你自己写,提供两种思路:
1,你要写个东西自己抓它,就必须打开网页,然后源码,[请注意,这里是要打开网页的,或者说获取网页的数据,跟你直接打开网页的速度是一样的,一个大型网站如果这样的话,你认为切实际吗?],然后比对关键字,提供
这里你就相当于自己写引擎了.你要有足够的宽带来实现
2.调用网站内嵌的搜索引擎,...这个搜集是最及时的,并且十分强大,但它具有单一性,专门针对某个或者某类网站,比如说DZ![填入关键字跟网站]
3,调用百度或者股沟,百度搜集中文站的是最及时的,但是问题在于它广告很多而且准确性不如谷歌,所以建议用一些聚搜引擎比如115等