编程高手看过来~~
需求:拟开发一段程序,实现如下功能。根据初步构想列了几种方案,难易程度有所不同,我最希望能实现方案1和3的要求,当然,还要结合费用人力等情况来考虑,所以如果有感兴趣者可以根据自己的能力给我一个解决方案,包括下列要求能实现到哪一步,以及所需时间报价等。1、针对搜索引擎:
当在GOOGLE等搜索引擎中搜索某一关键字后,能将所有GOOGLE中显示的网页内容,按某一特定格式存储到本地计算机中。
方案一:
例如:按图1在输入“化学事故”后,能将所有(或是限定多少页也可以)含此关键字的网页正文(图2)分别读取并存储(存储内容为:如网址、日期、正文等)。最后形成一个数据库文件,格式不限。
方案二:
将上一步的内容做些简化,退一步,只要求将GOOGLE中显示出的内容做提取即可
如:只对类似下面内容做整理就可以了。
2、针对论坛
方案三:
对某一论坛下的全部贴子做提取,比如只需提供一个网页的链接地下,所有内容包括下一级的页面。如图3,能将各版块下的贴子全部提取,包括每个贴子的回复。如果有难度可以退而求次,比如在图4这样一个级别下提取,甚至图5的级别,如果要实现都需要多少时间多少成本。
以上分别以搜索引擎及论坛单独写了下需求,实际两者可能并不冲突,方案一和方案三也许可以通过一个程序实现
图1
图2(点开其中第一条是如下内容)
图3
图4
图5
有感兴趣的朋友,可以与QQ:123 568 359 联系,进一步了解相关情况。