怎样通过对比的方法判断一个统计系统是否存在漏统计 其实就是为了纠正一个错误的看法:IP少就是有漏统计。 正确的看法应该是:PV少才是有漏统计。 PV就是页面浏览, 很显然, 不论这些浏览行为的行为人是谁,只要页面被浏览,统计系统就应该统计到一次PV。 所以如果甲乙两个统计系统对同一个网站的统计,甲认为是10个PV,而乙认为是11个PV, 那么很显然甲漏掉了某一次页面被浏览的行为。 那么IP的区别如何是怎么回事呢? 现在先假设甲乙两个统计系统得到了相同的PV(如果有某个PV少,则一定是有漏的,那就不好对比了), 而甲统计到3个IP,而乙统计到2个IP, 这时候如果你认为是乙漏统计了一个IP的行为, 那么设想一下,乙漏掉的这个IP至少应该有一次浏览吧?如果乙漏掉了这个IP的行为,那么乙应该最多只能统计到9个PV而不是10个。 既然乙统计到了10个PV,说明乙并没有漏掉任何一次页面被访问的行为。 那么甲统计为什么比乙统计多统计到了一个IP呢? 其实可以这样理解, 同样是10个PV,甲认为是3个IP,其实就是10个PV中其实中7次甲认为是“已经来访过的IP的浏览行为” 而同样的道理,乙却是认为有8次都是“已经来访过的IP的浏览行为”, 那就是说,存在其中一次浏览行为,甲认为是一个新的IP的行为,而乙认为是一个曾经来访过的IP的行为, 这是什么原因呢,很显然是乙记忆的时间比较长。 比如, 我要啦记忆凌晨之后所有的IP的行为,只要某个IP凌晨之后访问过你的网站,则这个IP在第二天凌晨前的所有浏览行为都不会被认为是一个新的IP产生的行为,因为我要啦认为这个IP不是一个新的IP。 而一些别的统计系统记忆的时间没有这么长,一个IP在早上访问了你的网站之后,到晚上再来访问的时候,这个统计系统已经不知道这是一个早上曾经来访过的IP了,所以就将这次浏览行为认为是一个新的IP的浏览行为,从而为这一天多记了一个IP。 记录多长时间的IP用来区分是否是一个新的IP,不同的统计系统有不同的方法,所以才会有IP数据的不同。 我要啦认为IP这个数据主要用来回答“今天有多少个IP访问”的问题,所以我要啦认为不应当把一个IP在一天之内的多次行为记录为多个IP。如果同一个IP在早上访问和晚上访问被记为两个IP,则当你看到报表上的 2 IP 的时候,就无法知道这究竟是一个IP的早晚的两次访问,还是两个IP各自的访问。 所有的统计系统都可能存在漏统计现象,这是多个方面综合作用的结果,需要统计提供者和站长的共同努力加以避免。 怀疑一个统计系统存在漏统计的心情可以理解,但是用【IP少就是有漏统计】的【错误方法】进行简单的判断是不理智的,这容易让自己不了解IP量的真实情况。
|