| 网站首页 | 业界新闻 | 小组 | 威客 | 人才 | 下载频道 | 博客 | 代码贴 | 在线编程 | 编程论坛
欢迎加入我们,一同切磋技术
用户名:   
 
密 码:  
共有 667 人关注过本帖
标题:编程高手看过来~~
只看楼主 加入收藏
susushuning
Rank: 1
等 级:新手上路
帖 子:1
专家分:0
注 册:2009-7-28
收藏
 问题点数:0 回复次数:0 
编程高手看过来~~
需求:拟开发一段程序,实现如下功能。根据初步构想列了几种方案,难易程度有所不同,我最希望能实现方案1和3的要求,当然,还要结合费用人力等情况来考虑,所以如果有感兴趣者可以根据自己的能力给我一个解决方案,包括下列要求能实现到哪一步,以及所需时间报价等。

1、针对搜索引擎:
当在GOOGLE等搜索引擎中搜索某一关键字后,能将所有GOOGLE中显示的网页内容,按某一特定格式存储到本地计算机中。

方案一:
例如:按图1在输入“化学事故”后,能将所有(或是限定多少页也可以)含此关键字的网页正文(图2)分别读取并存储(存储内容为:如网址、日期、正文等)。最后形成一个数据库文件,格式不限。

方案二:
将上一步的内容做些简化,退一步,只要求将GOOGLE中显示出的内容做提取即可
如:只对类似下面内容做整理就可以了。
 

2、针对论坛
方案三:
对某一论坛下的全部贴子做提取,比如只需提供一个网页的链接地下,所有内容包括下一级的页面。如图3,能将各版块下的贴子全部提取,包括每个贴子的回复。如果有难度可以退而求次,比如在图4这样一个级别下提取,甚至图5的级别,如果要实现都需要多少时间多少成本。

以上分别以搜索引擎及论坛单独写了下需求,实际两者可能并不冲突,方案一和方案三也许可以通过一个程序实现

图1
 

图2(点开其中第一条是如下内容)
 

图3
 

图4
 

图5
 


有感兴趣的朋友,可以与QQ:123 568 359 联系,进一步了解相关情况。

方案二.jpg (14.84 KB)
图片附件: 游客没有浏览图片的权限,请 登录注册


图1.jpg (67.49 KB)
图片附件: 游客没有浏览图片的权限,请 登录注册


图2.jpg (140.41 KB)
图片附件: 游客没有浏览图片的权限,请 登录注册


图3.jpg (138.39 KB)
图片附件: 游客没有浏览图片的权限,请 登录注册


图4.jpg (158.11 KB)
图片附件: 游客没有浏览图片的权限,请 登录注册


图5.jpg (121.04 KB)
图片附件: 游客没有浏览图片的权限,请 登录注册
搜索更多相关主题的帖子: 编程 搜索引擎 整理 
2009-07-28 17:49
快速回复:编程高手看过来~~
数据加载中...
 
   



关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.017251 second(s), 10 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved