抓取page时遇到的javascript问题
大家好,我在使用工具抓取网页时遇到了问题:
我要抓取的网页中包含下面的代码片段
<div class="jsmenu" id="searchmenu">
<ul>
<li id="1_1" class="">
<a href="javascript:ChangeTab('quick',1);SubmitTab('','SCAB','quick','',1);" title="AAA">search</a>
</li>
<li id ="1_2" class="active">
<a href="javascript:ChangeTab('normol',2);SubmitTab('','SCAB','normol','',2);" title="BBB">standar</a>
</li>
<li id="1_3" class ="">
<a href="javascript:ChangeTab('special',3);SubmitTab('','SCAB','special','',3);" title="CCC">special</a>
</li>
</ul>
... ... ....
我尝试了很多工具,诸如 TeleportUltra 、Offline_Explorer_Enterprise 等 都无法下载
<a href="javascript:ChangeTab 。。。 对应的链接页面,这些工具似乎都不会 解析 <a href="javascript:ChangeTab 的内容
不能打开并下载这些页面。还有其他什么工具可以用吗,或者编程的思路也行。
希望大家能指点指点我,先谢谢各位了。
另外,我的目标是 抓取 http URL 对应页面的所有内容,包括 css,js,images等,还要 上面提到的 <a href="javascript:ChangeTab
里面的内容,也就是整个页面的镜像 ,full page