存档

‘网站分析’ 分类的存档

GA _gaq _gat的两种嵌入方式详解

2010年8月18日 Robbins 没有评论

 

GA tag支持两种嵌入方式:同步嵌入和异步嵌入,下面分别讲解一下两种不同的嵌入方式的区别和不同的应用场景

 

同步嵌入

同步嵌入的代码如下:

 

<script type=”text/javascript”>

var gaJsHost = ((“https:” == document.location.protocol) ? “https://ssl.” : “http://www.”);

document.write(unescape(“%3Cscript src=’” + gaJsHost + “google-analytics.com/ga.js’ type=’text/javascript’%3E%3C/script%3E”));

</script>

 

<script type=”text/javascript”>

try {

var pageTracker = _gat._getTracker(“UA-12684530-1″);

pageTracker._trackPageview();

} catch(err) {}</script>

 

异步嵌入

异步嵌入的代码如下:

 

<script type=”text/javascript”>

var _gaq = _gaq || [];

_gaq.push(['_setAccount', 'UA-XXXXX-X']);

_gaq.push(['_trackPageview']);

 

(function() {

var ga = document.createElement(’script’);

ga.src = (‘https:’ == document.location.protocol ? ‘https://ssl’ : ‘http://www’) + ‘.google-analytics.com/ga.js’;

ga.setAttribute(‘async’, ‘true’);

document.documentElement.firstChild.appendChild(ga);

})();

</script>

 

同步的track代码调用很简单也很直白,通过_gat对象的_getTracker(“UA-12684530-1″)方法调用创建了一个pageTracker的对象,然后在trackEvent或tracsaction甚至设置customVariable的时候,直接使用pageTracker对象调用相应的方法就可以了。

 

如: pageTracker._trackEvent, pageTracker.——setCutomVar, pageTracker._trackPageView

 

但是,异步的track代码调用就不那么直白了。在解释如何进行异步的track的时候,我们需要看看借个GA对象的来龙去脉:

 

_gat

GA tag里面定义了一个字符串:var gaTrackerName = “_gat”, 然后通过window[gaTrackerName] = Z把_gat变成了window对象下的一个全局子对象。ok, 这个时候你看到了有趣的东西: Z. 这个是GA tag混淆后的缩写,原来Google的开发人员叫它啥,我们就不知道了,但是,我们看看Z这个对象里面都有啥吧:

 

一个至关重要的方法:Z._getTracker = function(i, l) {

return new Z.Tracker(i, l)

};

10个子对象。10个对象就不一一列举,但是有2个不能不看:Z.Tracker 和 Z.GlobalVariables

至此,你大致可以明了,Z这个东西就是定义了GA tag所有功能函数的一个类,而_gat就是它的一个实例了。

 

_gaq

同样的,GA tag里面也定义了一个变量:var ba = “_gaq”, 但是把_gaq转换成window下的一个全局对象就略显复杂一些:

 

首先,GA tag初始化的时候会调用一个叫na的方法:

 

function na() {

var i = window[ba],

l = false;

if (i && typeof i.push == “function”) {

l = i.constructor == Array;

if (!l) return

}

window[ba] = $;

l && $.push.apply($, i)

}

 

好吧,你看到了,window[ba] = $, 这样,_gaq就变成了$这个对象,这个对象是GA里定义的和Z同级的全局对象,让我们看看它的定义吧:

 

$ = {

ca: {},

_createAsyncTracker: function(i, l) {…},

_getAsyncTracker: function(i) {

i = i || “”;

var l = $.ca[i];

if (!l) {

l = new Z.Tracker;

$.ca[i] = l;

ka = true

}

return l

},

push: function() {

for (var i = arguments,

l = 0,

g = 0; g < i[x]; g++) try {

if (typeof i[g] === “function”) i[g]();

else {

var t = “”,

k = i[g][0],

p = k.lastIndexOf(“.”);

if (p > 0) {

t = O(k, 0, p);

k = O(k, p + 1)

}

var f = $._getAsyncTracker(t);

f[k].apply(f, i[g].slice(1))

}

} catch(h) {

l++

}

return l

}

};

 

看到了,$这个东东有3个方法:push, _getAsyncTracker,和_createAsyncTracker(这里省略了实现)。这里引出了一个对于异步tag嵌入最最重要的方法: push。所谓异步调用,无非就是把tag的加载和tag的track调用分离,那么看到push的方法实现你就明白了该如何使用这个异步调用的tag了。让我们来点实际的调用代码看看:

_gaq.push(['_setAccount', 'UA-XXXXX-X']);

_gaq.push(['_setClientInfo', false]);

_gaq.push(['_setAllowHash', false]);

_gaq.push(['_setDetectFlash', false]);

_gaq.push(['_setDetectTitle', false]);

_gaq.push(['_trackPageview']);

_gaq.push(function() {

var pageTracker = _gaq._createAsyncTracker(‘UA-XXXXX-1′);

pageTracker._trackPageview();

 

var pageTrackerB = _gaq._createAsyncTracker(‘UA-XXXXX-2′,’b');

pageTrackerB._trackPageview();

});

GA tag没有加载的时候,_gaq是一个数组,你push进去的东西会存储起来直到tag加载。当tag加载之后,na方法将被调用:

 

var i = window[ba],//数组里面的值赋给了i

$.push.apply($, i)//解析并执行push到数组里的方法

前面说完了技术实现的不同,很明显,异步的tag调用要更复杂一点,那么Goolge提供异步嵌入的目的在哪呢? 异步的嵌入方式相比同步的嵌入方式主要有下面的好处:

 

tag 无需同步加载,不会阻塞浏览器处理整个页面DOM的过程,可以加快页面的加载速度

所有的函数都是先push进数组缓存起来,待GA 的tag完整加载后执行,将会避免因GA tag加载无法完成而导致客户端页面出错的状况发生。想象一下,在同步嵌入的方式下,如果GAtag的下载失败了(网络抖了一下或其他原因),后续的var pageTracker = _gat._getTracker(“UA-12684530-1″);必定失败,那么,如果你在其他地方调用pageTacker的方法如:pageTacker._trackEvent,必定会出现javascript错误,严重时可能导致表单无法提交或者视频广告无法播放。

分类: 网站分析 标签:

IIS日志详解

2010年8月5日 Robbins 1 条评论

做seo分析日志是seoer不可少的一个工作,很多人看到了403,201等都晕了,不太了解起含义,下面将这些代码的详细解释和大家一起分享下。

 

IIS日志

  默认位置:%systemroot%\system32\logfiles\ 可自由设置。

 

  日志格式:ex+年份的末两位数字+月份+日期

 

  文件后缀:.log

 

  如2010年7月30日的日志生成文件是ex020810.log

 

  IIS日志是每个服务器管理者都必须学会查看的,服务器的一些状况和访问IP的来源都会记录在IIS日志中,所以IIS日志对每个服务器管理者非常的重要,seoer也不例外,这点同时也可方便网站管理人员查看网站的运营情况。

IIS日志文件详解:

  找到日志打开,发现日志的前几行如下

 

  #Software: Microsoft Internet Information Services 5.1 //iis版本

 

  #Version: 1.0 //版本

 

  #Date: 2010-07-30 00:53:58 //创建时间

 

  #Fields: date time c-ip cs-username s-sitename s-computername s-ip s-port cs-method cs-uri-stem cs-uri-query sc-status sc-win32-status sc-bytes cs-bytes time-taken cs-version cs-host cs(User-Agent) cs() cs(Referer) //日志格式

 

  下面的日志我在本地上测试的,扩展属性全部选中。

 

  2010-07-30 01:06:43 192.168.0.102 – W3SVC1 MGL 192.168.0.102 80 GET /css/rss.xslt – 304 0 140 358 0 HTTP/1.1 192.168.0.102 Mozilla/4.0+(compatible;+MSIE+7.0;+Windows+NT+5.1;+Trident/4.0;+InfoPath.2;+360SE) ASPSESSIONIDACRRDABA=IDDHCBBBHBMBODAGCIDKAGLM -

 

  下面对日志格式进行详细解答。

 

  Fields: date 2010-07-30 \\爬行日期

 

  time 01:06:43 \\时间

 

  s-sitename W3SVC1 \\服务器名称

 

  s-computername MGL \\ 网站名称

 

  s-ip 192.168.0.102 \\网站IP

 

  cs-method GET \\获取方法

 

  cs-uri-stem /css/rss.xslt \\文件的URL

 

  cs-uri-query – \\?后面的参数

 

  s-port 80 \\服务器端口

 

  cs-username – \\用户名

 

  c-ip 192.168.0.102 \访问者(蜘蛛)ip

 

  cs-version HTTP/1.1 \\协议版本

 

  cs(User-Agent) Mozilla/4.0+(compatible;+MSIE+7.0;+Windows+NT+5.1;+Trident/4.0;+InfoPath.2;+360SE)

 

  \\用户代理,即用户所用的浏览器(这个最重要)

 

  cs() ASPSESSIONIDACRRDABA=IDDHCBBBHBMBODAGCIDKAGLM \\发送或接收的 内容(如果有)

 

  cs(Referer) – \\选择该选项可以记录用户访问的前一个站点。此站点提供与当前站点的链接。

 

  cs-host 192.168.0.102 \\主机头的内容。我本地访问的是IP,这个应该是网站域名。

 

  sc-status 304 \\协议状态(200是正常的 404 是找不到文件,304未改变。更多请查看IIS返回日志详解)

 

  sc-substatus 0 \\协议子状态

 

  sc-win32-status 0 \\win32状态

 

  sc-bytes 140 \\发送的字节数

 

  cs-bytes 358 \\接受的字节数

 

  time-taken 0 \\所用时间

 

  200 0 0 4600 316 140返回200正常,4600发送的字节数,316接受的字节数 140所用时间。这个时间应该是毫秒级别的。

IIS日志返回代码含义

1xx(临时响应)表示临时响应并需要请求者继续执行操作的状态代码。代码 说明

100 (继续) 请求者应当继续提出请求。 服务器返回此代码表示已收到请求的第一部分,正在等待其余部分。

101 (切换协议) 请求者已要求服务器切换协议,服务器已确认并准备切换。

2xx (成功)表示成功处理了请求的状态代码。代码 说明

200 (成功) 服务器已成功处理了请求。 通常,这表示服务器提供了请求的网页。

201 (已创建) 请求成功并且服务器创建了新的资源。

202 (已接受) 服务器已接受请求,但尚未处理。

203 (非授权信息) 服务器已成功处理了请求,但返回的信息可能来自另一来源。

204 (无内容) 服务器成功处理了请求,但没有返回任何内容。

205 (重置内容) 服务器成功处理了请求,但没有返回任何内容。

206 (部分内容) 服务器成功处理了部分 GET 请求。

3xx (重定向) 表示要完成请求,需要进一步操作。 通常,这些状态代码用来重定向。代码 说明

300 (多种选择) 针对请求,服务器可执行多种操作。 服务器可根据请求者 (user agent) 选择一项操作,或提供操作列表供请求者选择。

301 (永久移动) 请求的网页已永久移动到新位置。 服务器返回此响应(对 GET 或 HEAD 请求的响应)时,会自动将请求者转到新位置。

302 (临时移动) 服务器目前从不同位置的网页响应请求,但请求者应继续使用原有位置来进行以后的请求。

303 (查看其他位置) 请求者应当对不同的位置使用单独的 GET 请求来检索响应时,服务器返回此代码。

304 (未修改) 自从上次请求后,请求的网页未修改过。 服务器返回此响应时,不会返回网页内容。

305 (使用代理) 请求者只能使用代理访问请求的网页。 如果服务器返回此响应,还表示请求者应使用代理。

307 (临时重定向) 服务器目前从不同位置的网页响应请求,但请求者应继续使用原有位置来进行以后的请求。

4xx(请求错误) 这些状态代码表示请求可能出错,妨碍了服务器的处理。代码 说明

400 (错误请求) 服务器不理解请求的语法。

401 (未授权) 请求要求身份验证。 对于需要登录的网页,服务器可能返回此响应。

403 (禁止) 服务器拒绝请求。

404 (未找到) 服务器找不到请求的网页。

405 (方法禁用) 禁用请求中指定的方法。

406 (不接受) 无法使用请求的内容特性响应请求的网页。

407 (需要代理授权) 此状态代码与 401(未授权)类似,但指定请求者应当授权使用代理。

408 (请求超时) 服务器等候请求时发生超时。

409 (冲突) 服务器在完成请求时发生冲突。 服务器必须在响应中包含有关冲突的信息。

410 (已删除) 如果请求的资源已永久删除,服务器就会返回此响应。

411 (需要有效长度) 服务器不接受不含有效内容长度标头字段的请求。

412 (未满足前提条件) 服务器未满足请求者在请求中设置的其中一个前提条件。

413 (请求实体过大) 服务器无法处理请求,因为请求实体过大,超出服务器的处理能力。

414 (请求的 URI 过长) 请求的 URI(通常为网址)过长,服务器无法处理。

415 (不支持的媒体类型) 请求的格式不受请求页面的支持。

416 (请求范围不符合要求) 如果页面无法提供请求的范围,则服务器会返回此状态代码。

417 (未满足期望值) 服务器未满足"期望"请求标头字段的要求。

5xx(服务器错误)这些状态代码表示服务器在尝试处理请求时发生内部错误。 这些错误可能是服务器本身的错误,而不是请求出错。代码 说明

500 (服务器内部错误) 服务器遇到错误,无法完成请求。

501 (尚未实施) 服务器不具备完成请求的功能。 例如,服务器无法识别请求方法时可能会返回此代码。

502 (错误网关) 服务器作为网关或代理,从上游服务器收到无效响应。

503 (服务不可用) 服务器目前无法使用(由于超载或停机维护)。 通常,这只是暂时状态。

504 (网关超时) 服务器作为网关或代理,但是没有及时从上游服务器收到请求。

505 (HTTP 版本不受支持) 服务器不支持请求中所用的 HTTP 协议版本。

网站分析的迷茫及思考

2010年8月5日 Robbins 4 条评论

网站分析是个新兴的领域特别是中国来说,中国互联网的快速发展及电子商务网站的快速崛起,对网站投资回报率及投资效果就有了更高的要求。网络广告的投放也越来越被很多企业接受,网络广告的可监控性及廉价促使了网络广告行业的快速的发展。然后网络广告的监控真的准确吗?监控的结果真的可信吗?

网站分析迷茫一:网站分析数据的真实性永远不可能和实际情况一样,毕竟统计工具都是有局限性的。要想做到真正的精确估计有点不现实,起码是最近几年不现实。难倒我们放弃吗,当然不是,网站数据分析更准确的说是一种趋势分析,目的是为了让我们网站达到我们最终目标。总在工具上纠结并不是我们要做的。

网站分析迷茫二:网站分析并没有固定的KPI,每个网站的KPI都不尽相同,即使是相同类型的网站。网站发展规模发展阶段和推广活动都会影响网站的KPI。KPI的制订没有固定格式,但却有可循的方法。明确的网站目标是建立KPi维度的前提。

网站分析迷茫三:多渠道推广如何相对准确的监控,这个问题一直困扰着我,直到现在还没有想到更好的方法,如果有高人在此领域有好的研究请一定赐教。为什么说难监控,难到哪里?线上渠道往往和下线的渠道同时进行,特别是季节性较强的一些行业,如招生行业。刚进6月铺天盖地的广告都在你眼前晃,网络广告,报纸,电视,公交 ,站牌…..。这么多广告这么高密度的投放,我们如何监控到底哪种广告的投资回报率高呢?哪种广告的效果更好呢?网络广告我们可以利用统计工具做相应的统计分析,可得到相对准确的投资回报率。但报纸,电视这些传统的媒体我们如何监控这些影响或如何评估?在此期间我们的网站的直接流量和品牌相关的关键词如何区分是哪部分的来源呢?多渠道的推广客户群体必然有很多重合的部分,是哪种媒体或广告影响用户的线上的搜索行为呢?期待你的回答与参与。

我的一点思考:网站分析最重要的是网站目标的制订,也许你的目标是增加注册,也许是增加销售。现阶段的网站目标是网站分析的前提,有了这个前提我们才能制订网站分析的kPI。有了目标还应该有好的工具是监控跟踪这些KPI指标。剩下的就是体现网站分析师的一个关键工作了,解读报告提出可行性的建议。可以总结一下网站分析的大致流程:分析报告—>>发现并详细描述问题—>>提出改进意见(并预测改进后的结果)—>>立刻执行你的建议—>>测试结果(对照前面的结果)—>>分析报告。不断的执行这个循环,优化这个循环离我们的目标将越来越近。

分类: 网站分析 标签:

Google analytics 退出率 跳出率 二跳率概念理解

2010年7月17日 Robbins 1 条评论

Google analytics 的跳出率与退出率其实这两个比较区分,对于二跳率估计平时用的比较少。这些指标是衡量网站的用户深度的重要指标,有助于我们评估网站的用户体验和广告效果。下面就这些基本度量单位分享下我自己的理解。

 

1、跳出率

跳出率是指仅浏览了该页面就离开网站的用户比例。参考:Google的解释

例如,100个人进入该页面,5个人直接从该页面离开该网站,则跳出率为5%。

跳出率可以很直观的看出网站对用户的黏性,和用户体验的好坏。当然我们应对具体的网站和具体的页面做具体的分析,不同类型的网站或页面他们的跳出率是有很大的差别。如购物成功后返回的感谢页面跳出率往往都很高,这不能说明该页面有问题。博客网站和sns网站的跳出率也不同。

2、退出率

退出率是指从该进入页面离开网站的次数占该网页总浏览次数的比例。

例如,20个人从该页面离开网站,该页面的总浏览量为200次,则退出率为10%。

从图中我们可以看出跳出率与退出率是息息相关的,页面的跳出率越高退出率也会越高。退出率包含跳出率的那一部分。那么可以思考一下用(退出率-跳出率)也就是用户至少访问了2个或2个以上的页面离开了网站所占得比例。

 

3、二跳率

当用户从外部链接到达网站时,被称为第一次跳转,如果用户再点击某一链接或按钮从而进入网站深层页面,则被称为“二跳”,外部来的用户中进行了二跳的用户的比例被称为“二跳率”。例如,上图中100人进入网站,85人浏览了更多页面,则“二跳率”为85%。

用户任务完成度分析

2010年7月10日 Robbins 没有评论

 

  欢迎来到艾泽拉斯大陆……如果你玩过魔兽世界,也许你在里面完成过无数个任务;当用户在访问网站时,其实他们也在试图完成某些特定的任务。

  也许大家都比较熟悉网站目标(Goal),因为很多网站分析工具都提供了基于目标的分析,网站目标更多地是从网站的角度去定义的,比如电子商务网站的目标就是促成有效的交易;而用户任务(Task)则是从用户的角度去定义的,用户会有自己的目标,比如用户上电子商务网站可能只是为了查询某些商品的信息,询价,或者只是单纯的逛逛。所以每个用户带着自己的任务访问网站,这些任务可能各不相同,这无疑给分析带来了一定的难度。

关于任务完成度的定义

  其实跟前面一篇文章——用Engagement衡量用户活跃度中的Engagement度量类似,用户任务也是一个非标准度量,而且根据网站的不同和用户访问目的的不同而显得千差万别。但用户任务完成度(Task Completion)与Engagement也存在着差异,Engagement定义的是用户的行为或动作,只要发生我们就认为用户参与了;而任务完成度定义的是结果,只有当用户的某个需求被实现时(如购买成功、获取到了相关信息、通过网站解决了某个问题……)才能认为用户完成了任务。

  用户的Engagement不会直接影响网站目标,那么用户的任务完成度是否会对网站目标有直接影响呢?如果说网站目标(Goals)是从网站的角度衡量网站的商业目的(Business Objectives)是否实现的话,那么任务完成度(Task Completion)则是从用户的角度衡量用户的期望(User Expectation)是否达到。所以只有当网站目标与用户的任务一致时,我们才能认为用户任务完成度会对网站目标产生直接影响,因为两者衡量的都是结果,所以这种直接的影响有些时候甚至是可以划等号的。

  既然用户访问网站的目的各不相同,每个人都带着各自的任务,那么我们如何获悉用户访问网站到底是来做什么的呢?

如何获取用户的任务信息

  用户任务是一个非标准度量,并且是由用户自己决定的,我们似乎无法从点击流日志的用户行为分析中辨认用户到底是以什么样目的访问网站,我们需要直接向用户寻求答案。

  前几天在Justin Cutroni的博客Analytics Talk看到了一个有意思的在线问卷调查,其实就是简单的2-3个问题,关于你为何来到这个网站,你完成了预期的任务吗,以及你对这次网站浏览的满意度如何,最后再加上一个可以自由填写的反馈,Justin Cutroni使用的是http://www.4qsurvey.com/这个网站提供的在线问卷服务,好像蓝鲸的博客也提供了在线问卷,他使用的是http://polldaddy.com/,还有一个提供反馈的功能http://www.kampyle.com/。其实这些都是收集用户信息的好办法,通过调查问卷(Survey)的方式让用户来告诉你答案。

  如果我们需要分析用户的任务完成度,可以设计一个简单的在线问卷,提供在线问卷调查的网站很多,国内的国外的、免费的收费的,其实操作都比较简单,但首先我们需要注意一下几个问题:

  1. 什么时候向用户提供调查问卷?如果是分析任务完成情况,那么很明显要在用户离开网站的时候;
  2. 以何种方式提供问卷?比较常见的是弹出窗口或跳转链接,但无论用什么方式建议都先礼貌地问下用户是否愿意填写问卷;
  3. 在用户完成问卷时不要忘记感谢用户的支持,或者让用户留下邮箱以告知他们调查分析的结果,这些都是他们应得的,当然也可以借机推广你的网站;
  4. 问卷的设计,这是个复杂的问题,完全可以写本书了,这里只是提供用户任务完成分析的问卷设计,我的建议是如果不是一次全面系统的网站分析问卷调查,那么尽量减少问卷中的问题数量,而且尽量要一开始就告诉用户问卷的长度及可能占用他们多少时间。其实如果只是分析用户任务完成度,3个问题就足够了:

task-completion-survey

分析用户的任务完成度

  基于从问卷调查中获得的数据,我们可以借用一些图表来分析用户的任务完成情况。

  首先,必须明确用户任务也是基于用户在网站上的一次访问(Visit)。一般用户一次访问只是为了完成一个任务,所以对于大部分网站而言,更偏向于衡量一次访问的任务是否完成而不是完成的百分比。所以这里的任务完成度(Task Completion) 的定义并不是每次访问用户完成任务的程度,而是所有的用户访问中完成任务的访问占所有访问的比重,即

任务完成度 = 完成任务的访问数 / 总访问数

  可以基于任务类型进行细分,以电子商务网站为例,假如问卷中的任务选项包括:

  • 购买商品
  • 查询商品信息
  • 售前售后咨询
  • 其它

  根据问卷采集的数据可以得到下图:

task-completion-segment

  基于任务类型的细分,可以分析每类任务的用户访问量所占比例(左侧饼图),以及每类任务的完成情况(右侧柱状图,总高度为每类任务的总访问量,,蓝色区块的高度为完成任务的访问数,可以看出每个任务类型中完成的访问数所占比重)。如果网站中进行的是长期的问卷调查,同样可以对每类任务的完成度进行趋势分析,如下图:

task-completion-trend

  趋势分析可以有效地掌握用户在网站中完成任务的变化情况,进而衡量网站在运营优化上面取得的成果。

  接下来该由你来做些什么了,你可以尝试用你的方法寻找更恰当的图表来展示和分析数据。

文章原文地址:http://webdataanalysis.net/web-quantitative-analysis/task-completion-analysis/

Google Analytics cookie 内容详解

2010年7月6日 Robbins 1 条评论

今天看了一篇不错的网站分析的关于ga 的文章,特转载过来与大家一起分享。
在WiKi上的解释是:指某些网站为了辨别用户身份而储存在用户本地终端(Client Side)上的数据(通常经过加密)。

分为两种类型,第一方和第三方。Google Analytics使用第一方

Google Analytics设置了5个不同的,_utma, _utmb, _utmc, _utmz和 _utmz。分别用来存储不同的信息。所有的统一使用_u-t-m开头,所以我们看到这三个字母就知道是google的

下面逐个介绍Google Analytics的和功能。

_utma的主要功能:识别唯一身份访客

_utma的生存周期为2年。其中第二组的随机唯一ID和第三组的时间戳联合组成了访问者ID,Google Analytics通过这个ID来辨别网站的唯一访问者。而后面的几个时间戳用户计算网站停留时间和访问次数。

_utma 存储的内容:127635166.1360367272.1264374807.1264374807.1264374807.1
第一组数字被叫做“域哈希”,是GA表示这个域的唯一代码。同一域中每个的第一组数据都是“域哈希”,并且值都是一样的。
第二组数字是一个随机产生的唯一ID。
第三,四,五组数字是时间戳,其中第三组数字表示初次访问的时间。第四组数字表示上一次访问的时间,第五组数字表示本次访问开始的时间。
第六组数字是访问次数计数器。这个数字随着访问次数的增加而增加。
PS:上面的三个时间戳数字相同,并且最后的访问次数计数器是1,表示这是第一次访问。

_utmb的主要功能:和_utmc一起决定访客的Session

_utmb的生存周期为30分钟,当访问者在你的网站持续30分钟静止时,utmb将被删除。Google Analytics使用_utmb 和_utmc一起辨别一个session。

_utmb 存储的内容:127635166.2.10.1264374807
第一组数字和_utma一样,是“域哈希”。
后面的几组数字是一些附加值。

_utmc的主要功能:和_utmb一起决定访客的Session

_utmc是一个临时,当用户关闭浏览器时_utmc将一起被删除

_utmc和_utmb一起来识别一个session,当用户访问一个网站时,Google Analytics会检查这两个,如果缺少其中任何一个,Google Analytics都将认为这是一个新的session。
_utmc的内容:127635166 代表“域哈希”。

_utmz的主要功能:存储流量来源信息和链接标记的变量值。

_utmz的生存周期是6个月,_utmz中存储了所有流量的来源信息。
_utmz的内容中一共有4组数字:127635166.1264374807.1.1
第一组数字是“域哈希”。
第二组数字是时间戳。
第三组数字是session number。
第四组数字是campaign number 记录通过不同来源访问网站的次数。
utmcsr=(direct)|utmccn=(direct)|utmcmd=(none)
这些信息代表流量的来源,因为我是直接输入域名直接访问的,所以来源和媒介都是direct

_utmv的主要功能:自定义访问者的属性。

_utmz的生存周期是2年,存储通过_setVar()自定义用户属性。
_utmz的内容:127635166.user
第一组数字是“域哈希”。
第二个值user是通过_setVar()设置的用户属性。
PS:_utmv只有在调用了_setVar()时才会出现。
此外,还有两个 __utmx和__utmxx。这两个不是由Google Analytics设置的,而是由Google的Website Optimizer用来做A/B测试或多变量测试用的。如果在访问某个页面后看到这两个,那就说明这个页面正在进行页面优化测试,而你访问的页面可能是测试中的某一个版本。

原文地址:(http://bluewhale.cc/2010-01-24/google-analytics-.html)作者:蓝鲸

google analytics 其他一些基本度量

2010年7月4日 Robbins 1 条评论

Average Pageviews
平均页面浏览数,是指在每次访问(Visit)中,平均有多少个页面被浏览了。也就是说,Average Pageviews = Pageviews / Visits。这个量度是通过两个基本量度计算得到的。平均页面浏览数,可以反映出网站的粘度。一般的来说,这个量度越大,说明网站的结构越清晰,内容越 吸引人。如果这个量度接近于1,那么,绝大部分的访问者,到了这个网站,只看了第一页就离开了。要么是内容糟糕透了,访客看了第一眼就不想看第二眼,要么 就是网站结构太差,访客找不到继续下去的链接。

Time on Site
Time on Site,顾名思义,就是访客在网站上花费的时间(注意是访客而不是一次访问,想想中间的区别)。这个时间是怎么得到的呢?比如,当一个访客在1:00的 时候到达了页面1,过了一会,在1:05的时候又到达了页面2,在1:12的时候到了页面3,在页面3上停留了一会,于1:16关闭浏览器结束了访问。那 么,数据采集服务器在1:00接收到数据,知道一个访客来了;1:05的时候又收到一次数据,那么1:05-1:00,呵呵,这个访客在网站上呆了5分 钟;1:12的时候收到数据,那么这个访客已经呆了12分钟了。但是注意了,用户离开关闭浏览器,并不会发送数据给采集服务器,那么页面3上的停留时间是 得不到的。在报表中看到Time on Site这个量度,实际是除了最后一个页面以外,前面所有页面的停留时间。一般的,Time on Site越长,说明网站的粘度越强。不过也有例外,Google就希望Time on Site越短越好,Time on Site越短,说明用户越快找到了他要的网站。

Bounce Rate
Bounce Rate,中文是跳出率,一般是用来衡量网站推广效果的一个量度。跳出率也是通过基本量度计算得到的,Bounce Rate = Single Access / Entries。其中,Single Access是指只访问了这个页面就离开的次数,Entries是访问者从这个页面进入网站的次数,也就是说这个页面是这次访问的第一个页面。 Single Access、Entries、Bounce Rate都是针对页面的量度。跳出率主要针对首页和登陆页。什么是登陆页呢?登陆页不是登录页,英文叫“Landing Page”,是指广告链接到网站的那一页。首页和登陆页是网站的入口,占据了网站绝大部分的Entries。Bounce Rate是用来衡量广告推广的效果。Bounce Rate越高,说明越多的访客到达第一个网页就离开了,那广告推广的效果就比较差,因为没有多少访客留下来。

New Visit
New Visit是统计的新的访问的数量。如何区别新的访问呢?Absolute Unique Visitor那一节,当浏览器中没有的时候,访问网站,一定时间内就会被认为是新的访问。这个主要用来衡量吸引到新用户的数量。

google analytics 基本度量 UV

2010年7月4日 Robbins 没有评论

上次我写了关键谷歌分析工具中的基本度量单位 访问次数(visit),今天来讲将谷歌的另外一个重要的度量单位唯一独立访问者(Absolute Unique Visitor)我们通畅称之为UV,谷歌为了让统计更为得准确更接近事实采用了的形式来作为UV统计的依据,UV是和客户端的是共存的关系,只要不删除那么UV都不会增加。Vistors,即分配的数,
一个算一个vistor,在vistor在,变vistor变,所以如果你清理电脑的后,再次访问网 站,算一个新的vistor。大家可以思考一个问题网吧等公场所都是多个客户端公用一个公用IP。UV是怎么计算的呢?IP又是怎么算?如果有个很无聊的人访问网站期间不停的清除cookies 又不停的访问改网站。UV与PV怎么计算的?

google analytics 基本度量 visit

2010年7月3日 Robbins 没有评论

很早就开始用google analytics 但真正认真研究是从最近开始,以前从事SEO的工作更多的是使用国内的一些免费的统计软件,cnzz 51啦都是不错的工具,相信很做站长都很熟悉这些工具。那时候我更多的关注的是 ip与pv 及alexa排名,公司的网络推广方式基本是靠SEO为主。现在公司模式以竞价广告位主,SEO只是降低网络营销的一种手段,所以现在我更关心网站的ROI,如何降低网络广告的成本提升用户转化率成为迫切的话题。我先从我这些天的一些学习心得谈起,对很多朋友来说这些都太简单,都是很基础的内容,高手可以飘过。

首先我们先来了解一下google analytics的历史吧! Google Analytics的前身Urchin是一款商业级的web分析软件,自Urchin被Google收购后改为了免费服务。

google analytics统计方式采用在网站中插入一段JavaScript代码的方式,这样当用户浏览相应网页时,记录下相应的行为。我们还是先了解google analytics中最常见度量单位!

访问次数(visit):谷歌广告给的解释非常的简单“访问者进行的唯一会话次数”,我们应该如何去理解呢?我的理解是visit是ga的一次session,ga的session过期时间默认是30分钟。三十分钟内我们对某网站的访问都算一次visit ,超过三十分钟session将会被丢弃,再访问将做为新的visit 这时的visit要加1。不同的浏览器的是不一样的,如果你在三十分钟内的用别的浏览器访问visit也将加1。以上是我对visit的理解,如果你认为与我的想法不同欢迎留言讨论!

分类: 网站分析 标签: