哈哈哈哈,老K有得忙了
可惜不是你,陪我到最后
把他们都爬下来,爬的时候匹配一下就行了
uri类有提供base地址的,匹配那个http://aaa.aaa.aaa//bbb的爬下来
我没试过flashget生成的树,不过如果是目录树,那估计是根据不断采集到的新url的斜杠来动态判断而已
把他们都爬下来,爬的时候匹配一下就行了
uri类有提供base地址的,匹配那个http://aaa.aaa.aaa//bbb的爬下来
我没试过flashget生成的树,不过如果是目录树,那估计是根据不断采集到的新url的斜杠来动态判断而已
你的意思还是需要整站爬,才能得到目录树。而我的意思是:是不是有简单快捷的方法先得到目录树,然后根据目录树决定爬什么