如何過濾 Google Analytics 報表中黑客植入的數據

越來越多的黑客利用 Google Analytics 記錄 Traffic 流量來源的資料,將自己要宣傳的網址或訊息植入了我們的 Google Analytics 報告中,令 Google Analytics 的數據看來像是多了流量或多人瀏覽, 其實這些都是一些俗稱 ghost traffic 的流量,不但影響了數據的準確性,亦令報告看起來很不準確,而且有越來越多的跡象,令人十分厭煩。

frustrated-by-hackers-figure

以下提供兩個方法可以 將這些數據隔除,讓報告更加準確專業:

第一種方法是設置 Filter

在 Google Analytics 的 Account > Property > View 中 建立一個 View , 可以名為 Spam Filtered View 來過濾各種黑客流量。 可以在 Filter Type 中選  Custom ,然後用 Exclude > Filter Field > Campaign Source > Filter Pattern 然後輸入例如"reddit.com" 的 Filter 來隔濾源自 "reddit.com" 或其他 domain name 域名的流量。

filter ghost domain

你也可以用 IP address 來隔濾這些黑客的流量,做法是選濾用 Predefined > Exclude > traffic from the IP addresses > that are equal to 然後輸入例如 sharebutton 的 IP  184.168.221.13.  (sharebutton 有多個 IP, 網上有許多網站可以幫你找出某個 domain name 域名所擁有的 IP 地址)

filter-4-traffic-from-ip

但是黑客會利用虛假的 Domain name 同時也會用不同的 IP address,所以你要不斷地增加這些 Filter 規則。另一種Filter 是利用 regular expression 。這種方法是只要寫一行句子就能隔濾發現的黑客域名,但是由於黑客可能用許多不同的域名 domain name 又會不斷轉換 IP address 因此這種 Filter 也是不能完全杜絕這些令人煩惱的流量。

如果用只准許來自真實的 Hostname 才讓數據流入報表的方式,這方法比較一勞永逸,做法如下:

filter from real hosts

 

(regular expression 的寫法是: yourmaindomain\.com|blog\.google|google\.org|mail.google\.com|books.google\.com|apple\.com|webcache.googleusercontent\.com|yahoo\.com|baidu\.com .....)

非常重要: 如果利用設置 Filter來隔濾不想要的數據,一設好,這些數據就不會入到 Google Analytics, 也無法回複,所以設罝時要特別小心,最好就是不要在 Master View 設置,而是另建立一個 View,這樣才比較保險。另外,當你設好了一個新的 View,要等一天才就看到數據出現。如果你想知道設好的 View 有沒有效,可以用  Filter Verification  來測試一下這個 Filter 有沒有設錯。

第二種方法是利用Google Analytics 中強大的 Segment 功能

我個人認為,這方法既不需要不斷忙碌地設置 Filter,又不會影響 Google Analytics 原始的數據。做法就是在 Segment 內的 condition 中設置 hostname contains www. yourdomain. com, google. com 等來自真實 hostname 的訪客數據,當你應用這個自設的 Segment 時來做分析,在你的報告中只會顯示來自真實的 hostname 而來的數據,不是來自黑客的虛假 host 的訪問,這是由於黑客許多時是利用虛假的 hostname 來訪問你的網站,因此, 如果你只採納來自真實 host 資料, 這樣就可以從報告中移除所有黑客非真實 host 的訪問數據,設置方法如下:

在 Report 介面的中央,按 + Add Segment > Advanced > Conditions > Filter Sessions Include > Hostname > contains 然後將真實的 hostname 填入,你只需要好填一項 yahoo.com,就已經包括了其他 blog.yahoo.com , finance.yahoo.com。

filter ghost traffic by segment

除了以上兩種方法還有沒有其他方法,當然有,就是在 . htaccess 寫入隔濾的程式語句,可是這就要勞動 IT 人員協助。

分享就是收獲: