LOGO莫国仲网络营销博客
莫国仲
选择,比努力更重要。商务合作QQ:1132329184

网络营销!尽心尽力、国仲每天都在进步。

热点: 优化工具webQQ云服务 毕业5年决定你的一生企业网站诊断seo网站运营总监COOIntel IDF

小感悟:一件事情专注着做,持续做,就很难被超越。
首页 > 数据分析 > cnzz、log等WEB数据分析方法中被统计的用户访问量(ip、pv、uv)差异产生原因分析

cnzz、log等WEB数据分析方法中被统计的用户访问量(ip、pv、uv)差异产生原因分析

发布:2011-3-7 次阅读17 条评论
分享到:

最近合作公司根据服务器访问日志提供的周报、月报中发现IP数巨大,跟用cnzzgoogle统计的多出一倍。合作公司说是每60分钟更新一次,但我还是很纳闷,为何数差距这么大?于是就找资料研究,搞了大半天。

通常我们会用如下的一些工具来做WEB网站访问日志的分析。

  • 1. 免费的google/yahoo 分析的ip地址量,访问人次和页面访问量
  • 2. awstats 分析出的访问人次和页面访问量
  • 3. 自己通过shell脚本做的原始weblog统计得到的ip量和页面访问量

这几者之间方法机制的存在着差别,就需要好好分析一些,提升一下自己在通过方式 3 得到的数据的精确性,同时也有助于发现一些存在的问题。

  • 1.google/yahoo是通过页面脚本来做统计,这样就使得那些被浏览器加载并被用户看到的页面被统计到(当然不是绝对的,但基本上就是这样了),而那些在服务器端通过发送 Header Location: /xxxurl 跳转的页面不会被统计,同时那些使用ajax和服务器进行数据交互的访问也不会被统计记录。
  • 2.awstats分析的是日志文件,采用方法基本上是基于对日志记录行的 正则表达式 匹配所进行的分析统计。这样一些不被google/yahoo统计的中间页面访问也会被当作pv进入统计。
  • 3.自己的方式比较灵活,采用的分析机制基本同于awstats,但是更具有灵活性,自己想怎么分析就怎么分析(当然前提是weblog可以提取那些信息供分析)

工具 ip量 唯一访问者数 访问人次 pv量
google X X X
awstat X X X
yahoo X X X X

注: awstats也有唯一访问数的统计,不过只能在摘要和按月历史统计中才能看到,不能以按天的方式看到,为了方便这边对比看到某一天的数据,我单独以某天的日志做一个配置,得到的按月数据等同于按天。

对几种工具的统计的情况对比(以实际统计中某几天的数据做对比)
统计结果呈现出: ip量 < 唯一人数 < 访问人次
对PV量的统计
google 和 yahoo 差不多, awstats 统计出的 页面数 比google和yahoo统计出来的数量要多出约两倍左右。产生这个现象的原因: google和yahoo都是采用的在页面嵌入脚本的方式,这样统计出来的就都是在用户浏览器上显示的页面,所以他们统计出的结果差不多。和awstat统计结果发生大偏差的原因:

  • 1.这个页面有可能是通过中间跳转过来的,被awstats分析了,但是没有浏览器的页面统计脚本执行,不会被google/yahoo记录。
  • 2.是在一个页面里面还嵌入了一个另外的页面,对google/yahoo还只是一个页面执行了统计脚本。
  • 3.还有就可能是这个页面中忘记放用来统计的js代码。

访问人次:
这个项只有 google和awstas有,其中google得到的人次要比awstats多。这个可以解释为他们用来识别两次访问间的时间间隔不同。google的判断时间间隔小,所以得到的总访问次数多。
唯一人数:
这个的结果是 yahoo < awstats < google
这个结果的不同可能是由于采用了不同的鉴别唯一用户的算法。估计采用了公网ip+ua+内网ip等的不同组合,从而得到的唯一用户数也不同。

IP访问量
这个只有 yahoo 提供,其他方式中没有该项,但是是可以反映出 ip地址量少于 唯一用户数的 。

对方式3自己写shell脚本做分析,在pv上得到的数据和awstats更接近一些,因为所使用的数据源和分析方式类似。
awstats使用缓冲记录运算获得的用户停留时间等信息不好获得,但是可以做出其他的一些按照ip为基准而awstat等工具未提供的统计,比如

  • 某个业务模块下的ip访问量
  • 只有一次web日志的ip量,有两,三,四次日志记录的ip量,5-10次,10次以上日志记录的ip量等
  • 有文件访问但是没有正常网页访问的ip量
  • 全部是失败访问确没有成功访问的ip量
  • 其他一些 awstats和google/yahoo统计上没有的数据

分享到:

分类:数据分析    标签:        

相关文章:

  • 评论(17)
发表评论 TrackBack

  • My Gravatar Icon

    17楼 3638721 回复该留言

    Post:2011-4-29 9:50:08

    今天给大家推荐一个可以赚钱的转址服务--Ref.so, 我觉得很好用,身边的几个朋友都在用。
    Ref.so 的用户名可用字母,数字和下划线组成,比如我注册的账号是:3638721 。

    Ref.so转址服务特点:
    1. 使用Ref.so转址服务生成的短地址永久有效,安全稳定.
    2. 使用Ref.so短地址可以让链接看起来更加简短,整洁,好记.
    3. 可随时更换短地址对应的目标地址,不需到各网站逐一修改.
    4. 短址分享不仅链接简单,还可按照访问量获取佣金,分享、赚钱两不误.

    Ref.so 转址赚钱政策:
    1. Ref.so 提供转址同时还可以赚钱,最高可达6元/1千独立ip访问
    2. Ref.so 具有20%的高额下线提成机制,不影响下线自身收益。
    3. 账户收益满10元即可申请支付,每周二统一审核,发放佣金。
    4. 千脑合作伙伴,支付信誉好,支付宝支付即时到账,无手续费。
    5. 更多详细赚钱政策,详见官方说明:http://www.ref.so/user/forPartners.html

    Ref.so 转址服务官方地址:http://www.ref.so/

  • My Gravatar Icon

    16楼 xuzhouweb 回复该留言

    Post:2011-4-28 15:26:57

    文章值得学习
  • My Gravatar Icon

    15楼 大金中央空调 回复该留言

    Post:2011-4-22 14:09:05

    这篇文章很不错。虽然未经博主同意,但我们http://www.zcm-cn.com以进行了转载。希望博主见谅。
  • My Gravatar Icon

    14楼 宁波停车棚 回复该留言

    Post:2011-4-20 15:06:25

    这个真不懂,哈哈。就来看看博主吧。
  • My Gravatar Icon

    13楼 电炉 回复该留言

    Post:2011-4-15 15:27:19

    好像没有一个工具是绝对准确的
  • My Gravatar Icon

    12楼 四九网博 回复该留言

    Post:2011-4-13 15:19:44

    每个意念都是一场祈祷!值得学习!
  • My Gravatar Icon

    11楼 nikeshox 回复该留言

    Post:2011-4-6 11:23:18

    有一段时间没有更新lo
  • My Gravatar Icon

    10楼 rlidc 回复该留言

    Post:2011-4-5 0:52:04

    常用这些,却没有仔细去思考!谢谢博主指点!http://rlidc.com
  • My Gravatar Icon

    9楼 雪凰 回复该留言

    Post:2011-4-1 17:42:03

    博主的文章真好,支持! http://www.gjj-sh.com
  • My Gravatar Icon

    8楼 nikeshoxshoes 回复该留言

    Post:2011-3-30 13:03:04

    嘻嘻 俺来更换网址
  • My Gravatar Icon

    7楼 图图网 回复该留言

    Post:2011-3-24 23:11:14

    恩,其实这个问题我也考虑过,不顾博主分析很透彻
  • My Gravatar Icon

    6楼 CarriageBolts 回复该留言

    Post:2011-3-24 16:21:40

    好纠结的一些个名词啊。。。有点看不大来啊
  • My Gravatar Icon

    5楼 nikeshoxshoes 回复该留言

    Post:2011-3-21 15:13:15

    有结果没啊
  • My Gravatar Icon

    4楼 雕刻机 回复该留言

    Post:2011-3-18 9:49:13

    到底是用哪个统计工具最好
    laomo 于 2011-5-15 12:21:44 回复
    用哪个其实关系都不大,都差不多的其实,关键是看业务需要了。一般是将网页嵌入统计的方式与log日志分析相结合的方式。
  • My Gravatar Icon

    3楼 若水 回复该留言

    Post:2011-3-17 15:01:00

    现在那种统计比较准确呢
  • My Gravatar Icon

    2楼 压铸机 回复该留言

    Post:2011-3-15 15:49:48

    还有雅虎和谷歌的统计结果也相差的非常大
  • My Gravatar Icon

    1楼 powercord 回复该留言

    Post:2011-3-9 13:33:20

    嗯这个东西应该好好分析一下
发表评论

无觅相关文章插件,快速提升流量