请人开发一个软件
语种:c++平台:windows
功能要求:
1,能自动识别主流WEB日志文件格式
2, 分析出各URL的状态码 (如:404 500),只匹配已添加的状态码 用户与蜘蛛要分开。状态码可自行添加,(可以添对状态码的说明)
3, 分析出各类爬虫及他们访问的页面,对于重复的URL 数量相加,(爬虫可自定义添加)(可添加对爬虫的说明)
4,分析出从搜索引擎来的用户、关键字及搜索引擎的名字及次数 (搜索引擎可自定义添加,可添加说明)
5,用户可选择保存报告位置
6,不能占用太多内存,以致机器崩溃
生成HMTL报告:
1,展示出来访问蜘蛛及对应蜘蛛访问的URL个数
2,展示出 来源搜索引擎,关键字及对应的数量,可选择这三个维度展示,如:按关键字展示,按数量展示,按搜索引擎展示
3,展示出 出错的 URL 蜘蛛与用户分开展示
界面要求:
1,用户自行添加LOG日志,要有文件对话供用户选择文件(还可自行添加文件地址 参考:可用TEXTBOX 一行一个文件地址)
2,多线程处理 防止界面假死
3,界面/报告要清爽,明了,要有进度条显示进度
4,处理速成度要快,最好能达10万条/秒左右
联系
QQ:251414041
手机:13968038592
合适者可以长期合作