日本免费全黄少妇一区二区三区-高清无码一区二区三区四区-欧美中文字幕日韩在线观看-国产福利诱惑在线网站-国产中文字幕一区在线-亚洲欧美精品日韩一区-久久国产精品国产精品国产-国产精久久久久久一区二区三区-欧美亚洲国产精品久久久久

Web服務(wù)器日志統(tǒng)計分析完全解決方案( 二 )


218.75.41.11 - - [06/Dec/2002:00:00:000000] "GET /2/face/shnew/ad/via20020915logo.gif HTTP/1.1" 304 0 "http://www.mpsoft.net/" "Mozilla/4.0 (compatible; MSIE 5.0; Windows 98; DigExt)"
61.187.207.104 - - [06/Dec/2002:00:00:000000] "GET /images/logolun1.gif HTTP/1.1" 304 0 "http://www2.beareyes.com.cn/bbs/b.htm" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)"
211.150.229.228 - - [06/Dec/2002:00:00:000000] "GET /2/face/pub/image_top_l.gif HTTP/1.1" 200 260 "http://www.beareyes.com/2/lib/200201/12/20020112004.htm" "Mozilla/4.0 (compatible; MSIE 5.5; Windows NT 5.0)"
從上面的日志文件可以看出日志記錄會記錄客戶端的IP地址、訪問發(fā)生的時間、訪問請求的頁面、web服務(wù)器對于該請求返回的狀態(tài)信息、返回給客戶端的內(nèi)容的大小(以字節(jié)為單位)、該請求的引用地址、客戶瀏覽器類型等信息 。
三、apache日志的配置和管理
本文中我們假設(shè)我們的apache運行有兩個虛擬主機:www.secfocus.com和www.tomorrowtel.com 。我們需要對這兩個虛擬主機分別進行訪問日志分析和統(tǒng)計 。
Apache配置文件中,我們需要關(guān)心的和日志相關(guān)的配置有兩個:
CustomLog /www/logs/access_log common
ErrorLog /www/logs/error_log
CustomLog用來指示apache的訪問日志的存放位置(這里保存在/www/logs/access_log中)和格式(這里為common);ErrorLog用來指示apache錯誤信息日志的存放位置 。
對于不配置虛擬主機的服務(wù)器來說,只需要直接在httpd.conf中查找CustomLOg的配置進行修改即可;而對于具有多個虛擬服務(wù)器的web服務(wù)器來說,需要分離各個虛擬服務(wù)器的訪問日志,以便對各個虛擬服務(wù)器進行訪問統(tǒng)計和分析 。因此這就需要在虛擬服務(wù)器配置中進行獨立的日志配置,示例:
NameVirtualHost 75.8.18.19
ServerName www.secfocus.com
ServerAdmin secfocus@secfocus.com
DocumentRoot /www/htdocs/secfocus/
CustomLog "/www/log/secfocus" combined
Alias /usage/ "/www/log/secfocus/usage/"
ServerName www.tomorrowtel.com
ServerAdmin tomorrowtel @ tomorrowtel.com
DocumentRoot /www/htdocs/ tomorrowtel
CustomLog "/www/log/tomorrowtel " combined
Alias /usage/ "/www/log/tomorrowtel/usage/"
這里需要注意的是每個虛擬主機的定義都有一個CustomLog命令,用來指定該虛擬主機訪問日志的存放文件;而Alias命令用來讓日志分析生成的報表能通過www.secfocus.com/usage/的方式來訪問 。通過上面的配置就完成了日志文件的保存 。
但是下來遇到的一個問題就是日志文件的輪循,因為日志是一直在增大的,如果不進行處理那么日志文件會越來越大,會影響web服務(wù)器運行效率;速率,還可能過大耗盡服務(wù)器硬盤空間,導(dǎo)致服務(wù)器無法正常運行,另外如果單個日志文件大于操作系統(tǒng)單文件尺寸的的限制,從而更進一步影響web服務(wù)的運行 。而且日志文件如果不進行輪循也不變于日志統(tǒng)計分析程序的運行,因為日志統(tǒng)計分析都是以天為單位進行統(tǒng)計分析的,跨越很長時間日志會使得日志統(tǒng)計分析程序運行特別慢 。因此這里就需要對web服務(wù)器日志文件每天進行輪循 。
四、web服務(wù)器日志輪循
web服務(wù)器日志輪循比較好的方式有三種:第一種方法是利用Linux系統(tǒng)自身的日志文件輪循機制:logrotate;第二種方法是利用apache自帶的日志輪循程序rotatelogs;第三種是使用在apache的FAQ中推薦發(fā)展已經(jīng)比較成熟的一個日志輪循工具cronolog 。
對于大型的WEB服務(wù)來說,其往往使用實用負載均衡技術(shù)提高web站點服務(wù)能力,這樣后臺有多個服務(wù)器提供WEB服務(wù),這大大方便了服務(wù)的分布規(guī)劃和擴展性,但多個服務(wù)器的分布就需要對日志進行合并統(tǒng)一進行統(tǒng)計分析 。因此為了保證統(tǒng)計的精確性就需要嚴格按照每天的時段來自動生成日志文件 。

推薦閱讀