共计 2758 个字符,预计需要花费 7 分钟才能阅读完成。
网站的存在离不开 URL,URL 与网站内容形影不离。URL 用于唯一地标识网站的页面、内容或资源的“位置”,所以很多时候它只是被看做一种识别码,就像是商品上的条形码,对于用户来说,这些识别码是没有任何意义的,用户不需要关心它们到底代表着什么。但对于网站分析而言,URL 并不只是网站内容的识别码这么简单,其实它可以在分析过程中发挥更大价值。
URL 与网站内容
URL 由协议、域名、请求地址三部分组成,完整地 URL 唯一确定了一个请求的资源,可以是页面、内容模块、文件或多媒体资源等。对于网站而言,URL 的用处是对资源的唯一定位,所以方式可以有很多,用资源的唯一描述(资源名称或简称等),资源的唯一识别码(ID、数字标记等),也可以是动态参数,这样就导致了各网站的 URL 会存在很大的差异。
比如浏览 网易首页 => 体育频道 => 意甲 => 米兰新闻,它们的 URL 依次为http://www.163.com/=> http://sports.163.com/=> http://sports.163.com/yj/=> http://sports.163.com/special/00051NSK/moremilan.html,其实对于用户而言对于前三个页面的 URL 还可以读懂,而最后一个可能就难以理解了;而在去看一下淘宝的 URL,在进入首页后点击任一一个商品分类,可能展现出来的 URL 就已经很难读懂了。
无论怎么样,这些 URL 对于网站而言都是有效的,因为它们都能做到唯一地识别网站的内容,既然如此,那么是不是 URL 就不再需要进行另外的整理设计了呢?还是先看看 URL 在网站分析中扮演着怎样的角色。
URL 在网站分析中的用处
我们知道,在网站分析中一般都是用页面的 URL 地址来唯一地标识一个页面(当然现在 GA 上也有根据页面标题显示的报表,但是网站的页面标题是可以重复的,所以无法“唯一标识”),我们根据 URL 地址来查看该页面的 Pageviews、Unique Pageviews、Exit Rate 等。但不知道大家有没有发现 Google Analytics 的 Content 模块下还有一张有趣的报表——Content Drilldown(内容下钻,关于下钻的概念可以参考文章——数据立方体与 OLAP),这张报表中的 Page 列就像是一个树形结构可以不断地向下展开直到底层节点,其实在 GA 的其他报表上也有类似的下钻功能,比如 Visitors—Browser Capabilities—Browsers 这张报表也支持从浏览器类型到浏览器版本的下钻操作。
也许你看了页面下钻的报表后,已经有点理解为什么 URL 的设计会对网站分析产生影响,下面就来看一下我的博客的实例:
顶部导航中的“文章专题推荐”中分类罗列的一些相应的文章,并且在该页面下还根据文章分类设置了 4 个子页面:“电子商务分析”、“网站用户分析”、“用户体验分析”、“其他文章推荐”,URL 也是按照页面的层次结构进行设计的,如下图:所以 Google Analytics 页面下钻的实现方式是将页面的 URL 根据”/”进行切分,从左向右分级存放,同时将下一层的数据向上汇总到上一层,这样报表上既可以查看每个页面的数据,也可以查看根据 URL 的结构向上逐层汇总的聚合数据。这对网站分析是十分有用的,因为我们同时获得了细分数据和汇总数据,从而可以从不同的数据粒度上进行分析。也许你会说不就是将同一类型的页面的数据加起来吗,在分析的时候自己加一下就行,也许上面例子中的 2 层并且只有 4 个子页面是很好处理,但如果网站页面超过 3 层,每层可能会有上百个子页面,那么如果没有这类下钻功能就会变得难以应付了。
可能有的朋友会问,那有没有不通过 URL 来区分个页面类型和层级的?如果你是用第三方工具,就需要进行额外的设置来让网站分析工具可以识别和区分你的网站页面,比如在页面上加入 Google Analytics 的自定义参数(Custom Variables)区分页面类型,但是如果无法自动添加这类 JS 代码的话,那么对于一个页面繁多的网站这个工作量就会相当庞大。如果你用自己的分析工具或者基于网站数据仓库,也许你需要维护一张页面的维表,可以包括 [页面 ID,页面 URL,页面描述,上级页面,页面层级] 这些属性,从而建立起具有层级关系的页面结构树,当然如果你的网站时常变动,那么要维护这张维表也是一件十分头疼的事情。
下面就以我的博客作为实例来说明下 URL 结构设计对于网站分析的影响是如何体现的。
我的博客的 URL 设计
得益于 Wordpress 这个强大的开放内容管理系统,让博客的 URL 定制变得不再复杂。Wordpress 的后台控制界面中提供了“固定链接设置”的功能,用户可以根据自己的需要设计适合自己网站的 URL 结构,比如我的博客的固定链接是 /%category%/%postname%/,也就是 / 文章分类 / 文章名 /,可以再来看一下我之前一篇文章——优化网站信息架构中的我画的 Wordpress 的简要信息架构图:通过上图结合我的 URL 结构设置,可以理解为我将信息架构中的一个分支——分类目录——作为 URL 结构设计的主依据,这样做有什么好处?在 GA 的页面钻取的分析报告中我既可以查看每篇文章的数据,同时可以查看每个文章分类的汇总数据:图中左侧的数据对应我的博客侧边栏分类目录中每个分类的汇总数据,右侧的数据对应“网站定量分析(web-quantitative-analysis)”分类下面各文章的细分数据。同时,当用户使用博客侧边栏的各索引(根据分类目录、文章标签、日期归档)时,Wordpress 也提供了非常友好的 URL 结构,比如分类目录用了 /category/ 分类名、文章标签用了/tag/ 标签名、日期归档用了如/2010/09/ 这类年月的结构来罗列相应的文章列表,这样就可以在 GA 中同样可以使用跟上面一样的下钻来分析有多少用户试图使用这些功能来索引博客文章,并且查看了哪些分类、标签或者日期归档,有兴趣的朋友可以到自己的 Google Analytics 上面试试。
这是我的博客的 URL 设计,每个网站可以根据自身的特点和需要设计适合自己的 URL 结构,从而有效地简化和提升网站分析中页面数据的细分和汇总。
总结
层次清晰、结构规范的 URL 不但可以为网站分析节省更多的工作量,同时可以提高 URL 的可读性,有效地提升对搜索引擎的友好度,增加网站 SEO 的效果。而清晰的 URL 结构需要基于对网站信息架构的系统有效的梳理,一旦做好了这些,一定会让网站建设的各个方面都受益匪浅。
需要注意的是,URL 的设计和规则需要在网站开发阶段就进行明确定义,写入相关的设计规范和文档中,因为一旦网站上线后要想再对 URL 的结构进行调整将会是一件极度麻烦并且得不偿失的事情。
丸趣 TV 网 – 提供最优质的资源集合!