Apacheのアクセスログを調査するとき何かと使うのでメモです。
アクセスログからIPのみを抽出してカウント
awk 'match($0,/[0-9]+\.[0-9]+\.[0-9]+\.[0-9]+/) { print substr($0, RSTART, RLENGTH) }' "/var/log/apache/access.log" | sort -u
表示例
3 xxx.xxx.xxx.xxx
2 yyy.yyy.yyy.yyy
1 zzz.zzz.zzz.zzz
と、煩雑なその他のログを探すことなく件数とIPをカウントします。
更にステータスコードも表示
awk 'match($0, /[0-9]+\.[0-9]+\.[0-9]+\.[0-9]+/) { ip = substr($0, RSTART, RLENGTH) } match($0, /" [0-9]{3} /) { status = substr($0, RSTART+2, 3); print ip, status }' /var/log/apache/access.log | sort | uniq -c | sort -nr
表示例
5 xxx.xxx.xxx.xxx 200
3 yyy.yyy.yyy.yyy 404
2 zzz.zzz.zzz.zzz 500
ステータスコードが入るので、アクセス制御の有無やそれを突破してきたIPも調べられます。
コメントを残す