问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

使用AWK分析Nginx访问日志中响应最慢的10个url该怎...

发布网友 发布时间:2022-04-22 05:39

我来回答

1个回答

热心网友 时间:2024-09-29 16:31

我在服务器上有每天切割nginx日志的习惯,所以针对每天各大搜索引擎来访,总能记录一些404页面信息,传统上我只是偶尔分析下日志,但是对于很多日志信息的朋友,人工来筛选可能不是一件容易的事情,这不我个人自己慢慢研究了一点点,针对谷歌、百度、搜搜、360搜索、宜搜、搜狗、必应等搜索引擎的404访问生成为一个txt文本文件,直接上代码test.php。 复制代码 代码如下: <?php //访问test.php?s=google $domain=''; $spiders=array('baidu'=>'Baiduspider','360'=>'360Spider', 'google'=>'Googlebot','soso'=>'Sosospider','sogou'=> 'Sogou web spider','easou'=>'EasouSpider','bing'=>'bingbot'); $path='/home/nginx/logs/'.date('Y/m/').(date('d')-1).'/access_www.txt'; $s=$_GET['s']; if(!array_key_exists($s,$spiders)) die(); $spider=$spiders[$s]; $file=$s.'_'.date('ym').(date('d')-1).'.txt'; if(!file_exists($file)){ $in=file_get_contents($path); $pattern='/GET (.*) HTTP\/1.1" 404.*'.$spider.'/'; preg_match_all ( $pattern , $in , $matches ); $out=''; foreach($matches[1] as $k=>$v){ $out.=$domain.$v."\r\n"; } file_put_contents($file,$out); } $url=$domain.'/silian/'.$file; echo $url; 好就这样了。没有什么高深的技术,只有动手写的过程。

热心网友 时间:2024-09-29 16:33

我在服务器上有每天切割nginx日志的习惯,所以针对每天各大搜索引擎来访,总能记录一些404页面信息,传统上我只是偶尔分析下日志,但是对于很多日志信息的朋友,人工来筛选可能不是一件容易的事情,这不我个人自己慢慢研究了一点点,针对谷歌、百度、搜搜、360搜索、宜搜、搜狗、必应等搜索引擎的404访问生成为一个txt文本文件,直接上代码test.php。 复制代码 代码如下: <?php //访问test.php?s=google $domain=''; $spiders=array('baidu'=>'Baiduspider','360'=>'360Spider', 'google'=>'Googlebot','soso'=>'Sosospider','sogou'=> 'Sogou web spider','easou'=>'EasouSpider','bing'=>'bingbot'); $path='/home/nginx/logs/'.date('Y/m/').(date('d')-1).'/access_www.txt'; $s=$_GET['s']; if(!array_key_exists($s,$spiders)) die(); $spider=$spiders[$s]; $file=$s.'_'.date('ym').(date('d')-1).'.txt'; if(!file_exists($file)){ $in=file_get_contents($path); $pattern='/GET (.*) HTTP\/1.1" 404.*'.$spider.'/'; preg_match_all ( $pattern , $in , $matches ); $out=''; foreach($matches[1] as $k=>$v){ $out.=$domain.$v."\r\n"; } file_put_contents($file,$out); } $url=$domain.'/silian/'.$file; echo $url; 好就这样了。没有什么高深的技术,只有动手写的过程。
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
每年交100社保可以改500的吗 在学校上学买了保险暑假做了包皮手术保险公司报销吗 ...放假了要在家附近的医院做手术。请问学校的保险给保吗? ...外地学生,在学校参加了医疗保险,如果在家乡做手术,可以报销医疗费么... fm2010问题,高手进! 请FM2010高手帮我看看配置能玩吗? 有哪些小诗集? 如何去除塑料新杯异味 这周日就是情人节了~如果有人送我东西,我应该回什么呢? 崇左碧园未来城开发商是哪家公司? oa2011调用文字处理软件接口失败 要好听的词语 糖水桃子的制作方法 电脑上RCA插口是做什么的 桃&#15157;如果制作?方法? 唯一后面加什么词语好听 耳麦接口的线断了怎么接 好听的词语大全 nginx 查看每秒有多少访问量 什么时候用接口(interface),接口是用来做什么的 带‘唯’的词语有什么,如‘唯一’ 唯字能组什么词并住音 怎么查看 linux nginx访问次数 “唯”字能组成哪些词语? 如何关闭nginx,apache的默认访问日志 词语 含有 唯 的词语 nginx中访问日志里如何判断下载文件是否成功? 唯怎么组四字词语? nginx访问日志求解 最后面的IP是什么 唯怎么组词语? NLP(自然语言处理)技术的NLP 相关API调用举例 好听词语都有哪些 java处理字符流和字节流的接口分别是什么 好听的词语有哪些 nginx 是如何处理访问请求的 来自网页的消息:打开公文失败调用文字处理软件接... 一些唯美、好听的词语 地埋线断了接好后怎样处理接口 桃罐头制作方法 劳动合同(新劳动合同法)终止的法定条件 红布包成三角形,可以辟邪的叫什么 多渠道平台接入接口规范 包括哪些 按2001年以前劳动法规定分公司有权解除劳动合同吗 总线与接口的区别 2001年协议解除劳动合同,但养老保险一直没能转出... 什么是IDE接口 2001年单位破产解除劳动合同失业但从未给我交过社... 怎么写api接口 如何在本地浏览器访问nginx 2001年前老劳动法补偿金实施细则