存档

2010年8月 的存档

GA _gaq _gat的两种嵌入方式详解

2010年8月18日 Robbins 没有评论

 

GA tag支持两种嵌入方式:同步嵌入和异步嵌入,下面分别讲解一下两种不同的嵌入方式的区别和不同的应用场景

 

同步嵌入

同步嵌入的代码如下:

 

<script type=”text/javascript”>

var gaJsHost = ((“https:” == document.location.protocol) ? “https://ssl.” : “http://www.”);

document.write(unescape(“%3Cscript src=’” + gaJsHost + “google-analytics.com/ga.js’ type=’text/javascript’%3E%3C/script%3E”));

</script>

 

<script type=”text/javascript”>

try {

var pageTracker = _gat._getTracker(“UA-12684530-1″);

pageTracker._trackPageview();

} catch(err) {}</script>

 

异步嵌入

异步嵌入的代码如下:

 

<script type=”text/javascript”>

var _gaq = _gaq || [];

_gaq.push(['_setAccount', 'UA-XXXXX-X']);

_gaq.push(['_trackPageview']);

 

(function() {

var ga = document.createElement(’script’);

ga.src = (‘https:’ == document.location.protocol ? ‘https://ssl’ : ‘http://www’) + ‘.google-analytics.com/ga.js’;

ga.setAttribute(‘async’, ‘true’);

document.documentElement.firstChild.appendChild(ga);

})();

</script>

 

同步的track代码调用很简单也很直白,通过_gat对象的_getTracker(“UA-12684530-1″)方法调用创建了一个pageTracker的对象,然后在trackEvent或tracsaction甚至设置customVariable的时候,直接使用pageTracker对象调用相应的方法就可以了。

 

如: pageTracker._trackEvent, pageTracker.——setCutomVar, pageTracker._trackPageView

 

但是,异步的track代码调用就不那么直白了。在解释如何进行异步的track的时候,我们需要看看借个GA对象的来龙去脉:

 

_gat

GA tag里面定义了一个字符串:var gaTrackerName = “_gat”, 然后通过window[gaTrackerName] = Z把_gat变成了window对象下的一个全局子对象。ok, 这个时候你看到了有趣的东西: Z. 这个是GA tag混淆后的缩写,原来Google的开发人员叫它啥,我们就不知道了,但是,我们看看Z这个对象里面都有啥吧:

 

一个至关重要的方法:Z._getTracker = function(i, l) {

return new Z.Tracker(i, l)

};

10个子对象。10个对象就不一一列举,但是有2个不能不看:Z.Tracker 和 Z.GlobalVariables

至此,你大致可以明了,Z这个东西就是定义了GA tag所有功能函数的一个类,而_gat就是它的一个实例了。

 

_gaq

同样的,GA tag里面也定义了一个变量:var ba = “_gaq”, 但是把_gaq转换成window下的一个全局对象就略显复杂一些:

 

首先,GA tag初始化的时候会调用一个叫na的方法:

 

function na() {

var i = window[ba],

l = false;

if (i && typeof i.push == “function”) {

l = i.constructor == Array;

if (!l) return

}

window[ba] = $;

l && $.push.apply($, i)

}

 

好吧,你看到了,window[ba] = $, 这样,_gaq就变成了$这个对象,这个对象是GA里定义的和Z同级的全局对象,让我们看看它的定义吧:

 

$ = {

ca: {},

_createAsyncTracker: function(i, l) {…},

_getAsyncTracker: function(i) {

i = i || “”;

var l = $.ca[i];

if (!l) {

l = new Z.Tracker;

$.ca[i] = l;

ka = true

}

return l

},

push: function() {

for (var i = arguments,

l = 0,

g = 0; g < i[x]; g++) try {

if (typeof i[g] === “function”) i[g]();

else {

var t = “”,

k = i[g][0],

p = k.lastIndexOf(“.”);

if (p > 0) {

t = O(k, 0, p);

k = O(k, p + 1)

}

var f = $._getAsyncTracker(t);

f[k].apply(f, i[g].slice(1))

}

} catch(h) {

l++

}

return l

}

};

 

看到了,$这个东东有3个方法:push, _getAsyncTracker,和_createAsyncTracker(这里省略了实现)。这里引出了一个对于异步tag嵌入最最重要的方法: push。所谓异步调用,无非就是把tag的加载和tag的track调用分离,那么看到push的方法实现你就明白了该如何使用这个异步调用的tag了。让我们来点实际的调用代码看看:

_gaq.push(['_setAccount', 'UA-XXXXX-X']);

_gaq.push(['_setClientInfo', false]);

_gaq.push(['_setAllowHash', false]);

_gaq.push(['_setDetectFlash', false]);

_gaq.push(['_setDetectTitle', false]);

_gaq.push(['_trackPageview']);

_gaq.push(function() {

var pageTracker = _gaq._createAsyncTracker(‘UA-XXXXX-1′);

pageTracker._trackPageview();

 

var pageTrackerB = _gaq._createAsyncTracker(‘UA-XXXXX-2′,’b');

pageTrackerB._trackPageview();

});

GA tag没有加载的时候,_gaq是一个数组,你push进去的东西会存储起来直到tag加载。当tag加载之后,na方法将被调用:

 

var i = window[ba],//数组里面的值赋给了i

$.push.apply($, i)//解析并执行push到数组里的方法

前面说完了技术实现的不同,很明显,异步的tag调用要更复杂一点,那么Goolge提供异步嵌入的目的在哪呢? 异步的嵌入方式相比同步的嵌入方式主要有下面的好处:

 

tag 无需同步加载,不会阻塞浏览器处理整个页面DOM的过程,可以加快页面的加载速度

所有的函数都是先push进数组缓存起来,待GA 的tag完整加载后执行,将会避免因GA tag加载无法完成而导致客户端页面出错的状况发生。想象一下,在同步嵌入的方式下,如果GAtag的下载失败了(网络抖了一下或其他原因),后续的var pageTracker = _gat._getTracker(“UA-12684530-1″);必定失败,那么,如果你在其他地方调用pageTacker的方法如:pageTacker._trackEvent,必定会出现javascript错误,严重时可能导致表单无法提交或者视频广告无法播放。

分类: 网站分析 标签:

IIS日志详解

2010年8月5日 Robbins 1 条评论

做seo分析日志是seoer不可少的一个工作,很多人看到了403,201等都晕了,不太了解起含义,下面将这些代码的详细解释和大家一起分享下。

 

IIS日志

  默认位置:%systemroot%\system32\logfiles\ 可自由设置。

 

  日志格式:ex+年份的末两位数字+月份+日期

 

  文件后缀:.log

 

  如2010年7月30日的日志生成文件是ex020810.log

 

  IIS日志是每个服务器管理者都必须学会查看的,服务器的一些状况和访问IP的来源都会记录在IIS日志中,所以IIS日志对每个服务器管理者非常的重要,seoer也不例外,这点同时也可方便网站管理人员查看网站的运营情况。

IIS日志文件详解:

  找到日志打开,发现日志的前几行如下

 

  #Software: Microsoft Internet Information Services 5.1 //iis版本

 

  #Version: 1.0 //版本

 

  #Date: 2010-07-30 00:53:58 //创建时间

 

  #Fields: date time c-ip cs-username s-sitename s-computername s-ip s-port cs-method cs-uri-stem cs-uri-query sc-status sc-win32-status sc-bytes cs-bytes time-taken cs-version cs-host cs(User-Agent) cs(Cookie) cs(Referer) //日志格式

 

  下面的日志我在本地上测试的,扩展属性全部选中。

 

  2010-07-30 01:06:43 192.168.0.102 – W3SVC1 MGL 192.168.0.102 80 GET /css/rss.xslt – 304 0 140 358 0 HTTP/1.1 192.168.0.102 Mozilla/4.0+(compatible;+MSIE+7.0;+Windows+NT+5.1;+Trident/4.0;+InfoPath.2;+360SE) ASPSESSIONIDACRRDABA=IDDHCBBBHBMBODAGCIDKAGLM -

 

  下面对日志格式进行详细解答。

 

  Fields: date 2010-07-30 \\爬行日期

 

  time 01:06:43 \\时间

 

  s-sitename W3SVC1 \\服务器名称

 

  s-computername MGL \\ 网站名称

 

  s-ip 192.168.0.102 \\网站IP

 

  cs-method GET \\获取方法

 

  cs-uri-stem /css/rss.xslt \\文件的URL

 

  cs-uri-query – \\?后面的参数

 

  s-port 80 \\服务器端口

 

  cs-username – \\用户名

 

  c-ip 192.168.0.102 \访问者(蜘蛛)ip

 

  cs-version HTTP/1.1 \\协议版本

 

  cs(User-Agent) Mozilla/4.0+(compatible;+MSIE+7.0;+Windows+NT+5.1;+Trident/4.0;+InfoPath.2;+360SE)

 

  \\用户代理,即用户所用的浏览器(这个最重要)

 

  cs(Cookie) ASPSESSIONIDACRRDABA=IDDHCBBBHBMBODAGCIDKAGLM \\发送或接收的 Cookie 内容(如果有)

 

  cs(Referer) – \\选择该选项可以记录用户访问的前一个站点。此站点提供与当前站点的链接。

 

  cs-host 192.168.0.102 \\主机头的内容。我本地访问的是IP,这个应该是网站域名。

 

  sc-status 304 \\协议状态(200是正常的 404 是找不到文件,304未改变。更多请查看IIS返回日志详解)

 

  sc-substatus 0 \\协议子状态

 

  sc-win32-status 0 \\win32状态

 

  sc-bytes 140 \\发送的字节数

 

  cs-bytes 358 \\接受的字节数

 

  time-taken 0 \\所用时间

 

  200 0 0 4600 316 140返回200正常,4600发送的字节数,316接受的字节数 140所用时间。这个时间应该是毫秒级别的。

IIS日志返回代码含义

1xx(临时响应)表示临时响应并需要请求者继续执行操作的状态代码。代码 说明

100 (继续) 请求者应当继续提出请求。 服务器返回此代码表示已收到请求的第一部分,正在等待其余部分。

101 (切换协议) 请求者已要求服务器切换协议,服务器已确认并准备切换。

2xx (成功)表示成功处理了请求的状态代码。代码 说明

200 (成功) 服务器已成功处理了请求。 通常,这表示服务器提供了请求的网页。

201 (已创建) 请求成功并且服务器创建了新的资源。

202 (已接受) 服务器已接受请求,但尚未处理。

203 (非授权信息) 服务器已成功处理了请求,但返回的信息可能来自另一来源。

204 (无内容) 服务器成功处理了请求,但没有返回任何内容。

205 (重置内容) 服务器成功处理了请求,但没有返回任何内容。

206 (部分内容) 服务器成功处理了部分 GET 请求。

3xx (重定向) 表示要完成请求,需要进一步操作。 通常,这些状态代码用来重定向。代码 说明

300 (多种选择) 针对请求,服务器可执行多种操作。 服务器可根据请求者 (user agent) 选择一项操作,或提供操作列表供请求者选择。

301 (永久移动) 请求的网页已永久移动到新位置。 服务器返回此响应(对 GET 或 HEAD 请求的响应)时,会自动将请求者转到新位置。

302 (临时移动) 服务器目前从不同位置的网页响应请求,但请求者应继续使用原有位置来进行以后的请求。

303 (查看其他位置) 请求者应当对不同的位置使用单独的 GET 请求来检索响应时,服务器返回此代码。

304 (未修改) 自从上次请求后,请求的网页未修改过。 服务器返回此响应时,不会返回网页内容。

305 (使用代理) 请求者只能使用代理访问请求的网页。 如果服务器返回此响应,还表示请求者应使用代理。

307 (临时重定向) 服务器目前从不同位置的网页响应请求,但请求者应继续使用原有位置来进行以后的请求。

4xx(请求错误) 这些状态代码表示请求可能出错,妨碍了服务器的处理。代码 说明

400 (错误请求) 服务器不理解请求的语法。

401 (未授权) 请求要求身份验证。 对于需要登录的网页,服务器可能返回此响应。

403 (禁止) 服务器拒绝请求。

404 (未找到) 服务器找不到请求的网页。

405 (方法禁用) 禁用请求中指定的方法。

406 (不接受) 无法使用请求的内容特性响应请求的网页。

407 (需要代理授权) 此状态代码与 401(未授权)类似,但指定请求者应当授权使用代理。

408 (请求超时) 服务器等候请求时发生超时。

409 (冲突) 服务器在完成请求时发生冲突。 服务器必须在响应中包含有关冲突的信息。

410 (已删除) 如果请求的资源已永久删除,服务器就会返回此响应。

411 (需要有效长度) 服务器不接受不含有效内容长度标头字段的请求。

412 (未满足前提条件) 服务器未满足请求者在请求中设置的其中一个前提条件。

413 (请求实体过大) 服务器无法处理请求,因为请求实体过大,超出服务器的处理能力。

414 (请求的 URI 过长) 请求的 URI(通常为网址)过长,服务器无法处理。

415 (不支持的媒体类型) 请求的格式不受请求页面的支持。

416 (请求范围不符合要求) 如果页面无法提供请求的范围,则服务器会返回此状态代码。

417 (未满足期望值) 服务器未满足"期望"请求标头字段的要求。

5xx(服务器错误)这些状态代码表示服务器在尝试处理请求时发生内部错误。 这些错误可能是服务器本身的错误,而不是请求出错。代码 说明

500 (服务器内部错误) 服务器遇到错误,无法完成请求。

501 (尚未实施) 服务器不具备完成请求的功能。 例如,服务器无法识别请求方法时可能会返回此代码。

502 (错误网关) 服务器作为网关或代理,从上游服务器收到无效响应。

503 (服务不可用) 服务器目前无法使用(由于超载或停机维护)。 通常,这只是暂时状态。

504 (网关超时) 服务器作为网关或代理,但是没有及时从上游服务器收到请求。

505 (HTTP 版本不受支持) 服务器不支持请求中所用的 HTTP 协议版本。

网站分析的迷茫及思考

2010年8月5日 Robbins 4 条评论

网站分析是个新兴的领域特别是中国来说,中国互联网的快速发展及电子商务网站的快速崛起,对网站投资回报率及投资效果就有了更高的要求。网络广告的投放也越来越被很多企业接受,网络广告的可监控性及廉价促使了网络广告行业的快速的发展。然后网络广告的监控真的准确吗?监控的结果真的可信吗?

网站分析迷茫一:网站分析数据的真实性永远不可能和实际情况一样,毕竟统计工具都是有局限性的。要想做到真正的精确估计有点不现实,起码是最近几年不现实。难倒我们放弃吗,当然不是,网站数据分析更准确的说是一种趋势分析,目的是为了让我们网站达到我们最终目标。总在工具上纠结并不是我们要做的。

网站分析迷茫二:网站分析并没有固定的KPI,每个网站的KPI都不尽相同,即使是相同类型的网站。网站发展规模发展阶段和推广活动都会影响网站的KPI。KPI的制订没有固定格式,但却有可循的方法。明确的网站目标是建立KPi维度的前提。

网站分析迷茫三:多渠道推广如何相对准确的监控,这个问题一直困扰着我,直到现在还没有想到更好的方法,如果有高人在此领域有好的研究请一定赐教。为什么说难监控,难到哪里?线上渠道往往和下线的渠道同时进行,特别是季节性较强的一些行业,如招生行业。刚进6月铺天盖地的广告都在你眼前晃,网络广告,报纸,电视,公交 ,站牌…..。这么多广告这么高密度的投放,我们如何监控到底哪种广告的投资回报率高呢?哪种广告的效果更好呢?网络广告我们可以利用统计工具做相应的统计分析,可得到相对准确的投资回报率。但报纸,电视这些传统的媒体我们如何监控这些影响或如何评估?在此期间我们的网站的直接流量和品牌相关的关键词如何区分是哪部分的来源呢?多渠道的推广客户群体必然有很多重合的部分,是哪种媒体或广告影响用户的线上的搜索行为呢?期待你的回答与参与。

我的一点思考:网站分析最重要的是网站目标的制订,也许你的目标是增加注册,也许是增加销售。现阶段的网站目标是网站分析的前提,有了这个前提我们才能制订网站分析的kPI。有了目标还应该有好的工具是监控跟踪这些KPI指标。剩下的就是体现网站分析师的一个关键工作了,解读报告提出可行性的建议。可以总结一下网站分析的大致流程:分析报告—>>发现并详细描述问题—>>提出改进意见(并预测改进后的结果)—>>立刻执行你的建议—>>测试结果(对照前面的结果)—>>分析报告。不断的执行这个循环,优化这个循环离我们的目标将越来越近。

分类: 网站分析 标签: