
【基本介紹】
Piwik中文版是一款以PHP5+MySQL技術(shù)為基礎(chǔ)打造的開(kāi)源網(wǎng)站訪問(wèn)統(tǒng)計(jì)工具,Piwik中文版綠色小巧,采用了插件擴(kuò)展及開(kāi)放API架構(gòu),可以讓用戶根據(jù) 自已的實(shí)際需求創(chuàng)建更多的功能。
【官方介紹】
Piwik 是一套基于 PHP5+MySQL 技術(shù)構(gòu)建的開(kāi)源網(wǎng)站訪問(wèn)統(tǒng)計(jì)系統(tǒng),前身是 phpMyVisites。Piwik 可以給你詳細(xì)的統(tǒng)計(jì)信息,比如網(wǎng)頁(yè)瀏覽人數(shù),訪問(wèn)最多的頁(yè)面,搜索引擎關(guān)鍵詞等等流量分析功能。此外,它還采用了插件擴(kuò)展及開(kāi)放 API 架構(gòu),可以讓用戶根據(jù)自已的實(shí)際需求創(chuàng)建更多的功能。
【功能特色】
1.Piwik中文版是一個(gè)PHP與MySQL的開(kāi)放源代碼的Web統(tǒng)計(jì)軟件.。它給你一些對(duì)于你網(wǎng)站的實(shí)用統(tǒng)計(jì)報(bào)告,例如網(wǎng)頁(yè)瀏覽人數(shù), 訪問(wèn)最多的頁(yè)面, 搜索引擎關(guān)鍵詞等等 Piwik具有許多不同功能的插件,你可以添加新的功能或是移除你不需要的功能,同樣可以安裝在你的服務(wù)器上面,數(shù)據(jù)就保存在你自己的服務(wù)器上面。2.Piwik 支持插件,你可以通過(guò)插件擴(kuò)展 Piwik 的功能,或者取消一些不需要的功能。用戶的界面支持 Ajax 技術(shù)是可定制的,你可以輕松拖放控件,定制自己需要的報(bào)告。
3.用戶單獨(dú)具有自己的統(tǒng)計(jì)數(shù)據(jù),而不是寄存在服務(wù)商那里,這樣就可以更靈活的使用統(tǒng)計(jì)數(shù)據(jù),不需要擔(dān)心數(shù)據(jù)丟失問(wèn)題。
4.Piwik 是安裝在服務(wù)器端的統(tǒng)計(jì)工具,安裝過(guò)程很簡(jiǎn)單,但是需要服務(wù)器支持 PHP5.1 與 MySQL 。安裝時(shí)上傳 Piwik 到服務(wù)器端,而后打開(kāi)瀏覽器,Piwik 會(huì)自動(dòng)運(yùn)行安裝,整個(gè)過(guò)程不超過(guò) 5 分鐘。
5.現(xiàn)在 Piwik 已支持中文。

【安裝步驟】
注意:安裝Piwik的前提必須要安裝Apache +PHP和MySQL,PHP 版本5.1.3 或以上,MySQL 版本 4.1 或以上
安裝步驟:
準(zhǔn)備工作
將下載的 piwik 安裝包上傳到服務(wù)器,具體什么位置不限,記住路徑即可。我將 piwik 上傳Apache部署的根目錄下,(如我實(shí)在本機(jī)測(cè)試,所以就將Piwik放在C:\Program Files\Apache Software Foundation\Apache2.2\htdocs的目錄下),

接著,在瀏覽器輸入http://localhost:81/piwik/index.php(當(dāng)然你也可以是域名訪問(wèn))。
開(kāi)始安裝
1.打開(kāi) piwik 安裝文件中的 index.php 文件,具體路徑為http://localhost:81/piwik/index.php,你的路徑根據(jù)域名和安裝位置有所不同
進(jìn)入歡迎頁(yè),如圖:

2、點(diǎn)擊 next 進(jìn)入安裝環(huán)境檢測(cè)環(huán)節(jié),具體需要什么樣的環(huán)境請(qǐng)看這里,一切順利的話就可以直接進(jìn)入下一步了。
3、鏈接數(shù)據(jù)庫(kù),這和 wordpress 的數(shù)據(jù)庫(kù)連接過(guò)程基本相同。第一項(xiàng)和最后一項(xiàng)不用改動(dòng),剩下依次填入數(shù)據(jù)庫(kù)用戶名,數(shù)據(jù)庫(kù)密碼和數(shù)據(jù)庫(kù)名即可。


4、點(diǎn)擊 next 繼續(xù),添加用戶信息。填寫(xiě)用戶名,密碼,核對(duì)密碼和電子郵件地址。這一步也可以在 piwik 后臺(tái)完成。

5、登記需要統(tǒng)計(jì)的網(wǎng)站,填寫(xiě)網(wǎng)址即可。

6、點(diǎn)擊 Go 繼續(xù),生成網(wǎng)站統(tǒng)計(jì)代碼,并將代碼添加到網(wǎng)頁(yè)的適當(dāng)位置。

7、安裝結(jié)束。

【使用方法】
剛裝好的Piwik是空空如也的,此時(shí)我們需要這個(gè)系統(tǒng)幫我們統(tǒng)計(jì)數(shù)據(jù)。目前Piwik支持兩種采集用戶訪問(wèn)記錄的方式: JS追蹤和訪問(wèn)日志追蹤。JS追蹤可定制型高,可以獲取到用戶的分辨率,瀏覽器插件等等,還可以捕獲自定義變量。訪問(wèn)日志追蹤(如apache的accesslog)可以追蹤到用戶的錯(cuò)誤請(qǐng)求(如40X錯(cuò)誤,有助于捕獲到惡意用戶和爬蟲(chóng),蜘蛛等等),目前這兩種追蹤得到的數(shù)據(jù)還不支持合并。JS追蹤
在管理設(shè)置-網(wǎng)站-右邊即可看到"顯示跟蹤代碼",如下圖所示:

將此代碼復(fù)制到web項(xiàng)目的footer中即可(即所有頁(yè)面都嵌入這段相同的js代碼,用于捕獲用戶的信息,如分辨率,瀏覽器UA,IP等),還可以按照官方文檔,捕獲自定義變量。
log追蹤
log追蹤無(wú)需修改web項(xiàng)目,但是必須要有登錄服務(wù)器并讀取accesslog的權(quán)限。
log追蹤的過(guò)程是解析webserver的accesslog,然后通過(guò)piwik的API上傳,最終在piwik頁(yè)面上展示。
這個(gè)過(guò)程不用自己去實(shí)現(xiàn)了,piwik的壓縮包中已經(jīng)帶有一個(gè)python腳本可以幫助我們完成這個(gè)工作了,該腳本存儲(chǔ)于piwik目錄下的misc/log-analytics/import_logs.py。
將這個(gè)腳本遠(yuǎn)程拷貝到目標(biāo)服務(wù)器上,按照腳本的參數(shù)格式執(zhí)行即可,我的命令行:
1./import_logs.py --url=http://192.168.1.106/piwik/ --idsite=1 --recorders=2 --token-auth=319fb461d3225905039551e861edde60 --enable-static --enable-bots --enable-http-errors --enable-http-redirects /var/log/apache2/access.log
使用--help參數(shù)即可看到這個(gè)腳本的命令行,只有一個(gè)--url參數(shù)是必須的,指明piwik的訪問(wèn)路徑。
這里對(duì)我使用的參數(shù)做一下簡(jiǎn)介:
--idsite表明抓取到的信息上傳到哪個(gè)序號(hào)對(duì)應(yīng)的網(wǎng)站(這里的參數(shù)為1,代表解析的數(shù)據(jù)會(huì)統(tǒng)計(jì)到first_web這個(gè)網(wǎng)站中)
--token-auth這個(gè)參數(shù)是管理員的訪問(wèn)token,在系統(tǒng)頁(yè)面最頂上的API點(diǎn)開(kāi)即可看到,如下圖所示。這個(gè)參數(shù)可以使用--login=LOGIN --password=PASSWORD這兩個(gè)參數(shù)替代,必須是管理員的賬戶和密碼。

--recorders使用多線程解析,默認(rèn)為1,官方建議這個(gè)參數(shù)和核心數(shù)一致。
--enable-static --enable-bots --enable-http-errors這三個(gè)參數(shù)基本上把a(bǔ)pache的accesslog能抓取到的全部信息都抓全了,抓取靜態(tài)資源(jpg,png,js,css等非html的訪問(wèn)),抓取bots(不知道這個(gè)是什么,猜測(cè)是否是機(jī)器人?),抓取html錯(cuò)誤碼(如40X請(qǐng)求等等)
/var/log/apache2/access.logapache的accesslog存放路徑,常見(jiàn)的webserver如nginx,lighthttpd等,腳本自帶有解析引擎,無(wú)需別的參數(shù),如果非常見(jiàn)webserver的話,加上--log-format-regex這個(gè)參數(shù)來(lái)自定義日志格式抓取。
當(dāng)腳本執(zhí)行完畢時(shí),即可在piwik中看到網(wǎng)站的訪問(wèn)記錄了,使用也很方便。長(zhǎng)期使用可以寫(xiě)入crontab即可。
注意:
log解析的方式追蹤比較慢,不適合實(shí)時(shí)追蹤用戶訪問(wèn)記錄,建議每過(guò)幾小時(shí)執(zhí)行一次crontab,來(lái)定時(shí)解析log。
如果開(kāi)啟了--enable-static --enable-bots --enable-http-errors這三個(gè)參數(shù),解析過(guò)程將會(huì)很緩慢(我這邊大概十幾條每秒),不要讓crontab太頻繁,會(huì)直接讓mysql數(shù)據(jù)庫(kù)超出連接而掛掉,我是每4小時(shí)執(zhí)行一次crontab。

































