php正则解析apache日志文件文件

可以把日志按小时滚动,采用php正则分析日志的方式进行解决

$logline =’127.0.0.1 – – [22/may/2015:17:09:13 +0800] “get /sale/images/y-select.png http/1.1” 200 1095′;
$pattern = ‘/^(?p[0-9.]+) – – \[(?p[^\]]+)\]+ “get (?p[^ ]+) http\/1.[1|0|2]” (?p[0-9.]+) (?p[0-9.]+)/i’;
preg_match($pattern, $log, $match);
//var_dump($match);
$ip = $match[‘ip’];
$time = strtotime($match[‘time’]);
$url = $match[‘url’];
$status = $match[‘status’];
$size = $match[‘size’];
printf(“ip:%s 访问时间:%s url:%s 状态:%s 文件尺寸:%s”,$ip,$time,$url,$status,$size);

也可是这样

运用正则表达式分隔apache日志文件

www.myexception.cn 网友分享于:2015-08-26 浏览:17次

使用正则表达式分隔apache日志文件 通用日志格式的apache日志文件示例:127.0.0.1 – frank [10/oct/2000:13:55:36 -0700] “get /apache_pb.gif http/1.0” 200 2326组合日志格式的apache日志文件示例:127.0.0.1 – frank [10/oct/2000:13:55:36 -0700] “get /apache_pb.gif http/1.0” 200 2326 “http://www.example.com/start.html” “mozilla/4.08 [en] (win98; i ;nav)”客户端的ip地址。 由客户端identd进程判断的rfc1413身份(identity),输出中的符号”-“表示此处的信息无效。 http认证系统得到的访问该网页的客户标识(userid),如果网页没有设置密码保护,则此项将是”-“。 服务器完成请求处理时的时间。 客户的动作\请求的资源\使用的协议。 服务器返回给客户端的状态码。 返回给客户端的不包括响应头的字节数.如果没有信息返回,则此项应该是”-“。 “referer”请求头。 “user-agent”请求头。 用来提取信息的正则表达式组成: ^ :匹配每一行的开头。 ([0-9.]+)\s :匹配ip地址。 ([\w.-]+)\s :匹配identity,由数字字母下划线或点分隔符组成。 ([\w.-]+)\s :匹配userid,由数字字母下划线或点分隔符组成。 (\[[^\[\]]+\])\s :匹配时间。 “((?:[^”]|\”)+)”\s :匹配请求信息,双引号中可能出现转义的双引号\”。 (\d{3})\s :匹配状态码。 (\d+|-)\s :匹配响应字节数或-。 “((?:[^”]|\”)+)”\s :匹配”referer”请求头,双引号中可能出现转义的双引号\”。 “((?:[^”]|\”)+)” :匹配”user-agent”请求头,双引号中可能出现转义的双引号\”。 $ :匹配行尾。 最终的表达式如下: ^([0-9.]+)\s([\w.-]+)\s([\w.-]+)\s(\[[^\[\]]+\])\s”((?:[^”]|\”)+)”\s(\d{3})\s(\d+|-)\s”((?:[^”]|\”)+)”\s”((?:[^”]|\”)+)”$

以上就介绍了php正则解析apache日志文件文件,包括了方面的内容,希望对php教程有兴趣的朋友有所帮助。

Posted in 未分类

发表评论