| 网站首页 | 业界新闻 | 小组 | 威客 | 人才 | 下载频道 | 博客 | 代码贴 | 在线编程 | 编程论坛
欢迎加入我们,一同切磋技术
用户名:   
 
密 码:  
共有 703 人关注过本帖
标题:求助!怎么对服务器日志文件进行统计分析?主要是IP,端口,时间。
只看楼主 加入收藏
xqf126
Rank: 1
等 级:新手上路
帖 子:6
专家分:0
注 册:2012-8-15
结帖率:50%
收藏
已结贴  问题点数:20 回复次数:6 
求助!怎么对服务器日志文件进行统计分析?主要是IP,端口,时间。
需要统计分析的内容是每条记录的访问时间,访问的目标IP,目标端口,访问类型这4个属性。这样的记录每分钟大约有4万条,而且是没有规律的,有没有好的办法按时间分别统计下IP的访问量,端口的访问量,以及访问类型(学生和教师两类)?涉及数据结构和算法,需要一个有效的解决方法。求大师指点!
搜索更多相关主题的帖子: 访问量 统计 
2012-08-15 21:30
寒风中的细雨
Rank: 17Rank: 17Rank: 17Rank: 17Rank: 17
等 级:贵宾
威 望:66
帖 子:1710
专家分:8645
注 册:2009-9-15
收藏
得分:0 
日志文件  输出格式应该是比较有规律的吧
你现在用的是什么方法  进行分析处理的?
2012-08-21 08:33
xqf126
Rank: 1
等 级:新手上路
帖 子:6
专家分:0
注 册:2012-8-15
收藏
得分:0 
回复 2楼 寒风中的细雨
终于有人关注了,好开心呵呵。
字段从左到右依次是:
1) 流水号
2) 访问时间
3) 访问的目标url或IP
4) 登录账号
5) 源MAC
6) 源IP
7) 目标端口
8) 访问类型:0表示DNS请求,1表示同步请求(如开始拨号或登录请求),2表示get请求,3表示post请求
9) 访问目标IP
10) 源端口
11) 保留数值
65535    65535    2010-01-05 17:10:35    116.225.75.16    08460134    001E68250AB3    10.0.156.30    15703    1    116.225.75.16    13291    0
这就是其中一条记录,这样的记录服务器会自动记录在txt文档中,一分钟大概就有3万多条。
一直想不出好的解决方法,自己想了一个笨方法,就是建立一个数组分别存储目标ip,端口,类型,时间。IP访问量的统计只需统计到前三段,如a.b.c.x。然后按每小时读取日志,读取时对数组中的记录进行查找,查找采用并行查找(对a,b,c同时进行匹配),若匹配成功,则访问量加1,若不成功,则添加新记录,同时按访问量进行排序。对于端口与访问类型的统计,打算嵌套两个数组用相同的方法统计。把结果的top100记录生成图表,并记录到数据库中。
    但是感觉这样的效率太低了,对服务器的开销也有些大。求指点啊!
2012-08-21 09:32
寒风中的细雨
Rank: 17Rank: 17Rank: 17Rank: 17Rank: 17
等 级:贵宾
威 望:66
帖 子:1710
专家分:8645
注 册:2009-9-15
收藏
得分:20 
1、把txt导入到数据库表中  然后直接用SQL语句操作



2、用内存映射文件 避免 耗时的文件I/O操作    字符串匹配就用C++自带的就行   top100的选取用堆排序
2012-08-21 11:39
xqf126
Rank: 1
等 级:新手上路
帖 子:6
专家分:0
注 册:2012-8-15
收藏
得分:0 
回复 4楼 寒风中的细雨
这是一种不错的方法,但会占用不少内存的,还有其他的方法吗?
2012-08-22 09:58
寒风中的细雨
Rank: 17Rank: 17Rank: 17Rank: 17Rank: 17
等 级:贵宾
威 望:66
帖 子:1710
专家分:8645
注 册:2009-9-15
收藏
得分:0 
回复 5楼 xqf126
时间  空间   最末了就只能投钱了
2012-08-22 15:58
xqf126
Rank: 1
等 级:新手上路
帖 子:6
专家分:0
注 册:2012-8-15
收藏
得分:0 
回复 6楼 寒风中的细雨
不能用内存映射文件吧,这个程序也必须是在服务器端不停运行的程序,记录在不停的生成,程序也应是在不停的读取并做统计处理,求解答
2012-08-28 17:40
快速回复:求助!怎么对服务器日志文件进行统计分析?主要是IP,端口,时间。
数据加载中...
 
   



关于我们 | 广告合作 | 编程中国 | 清除Cookies | TOP | 手机版

编程中国 版权所有,并保留所有权利。
Powered by Discuz, Processed in 0.017301 second(s), 9 queries.
Copyright©2004-2024, BCCN.NET, All Rights Reserved