Quick BI 的模型设计与生成SQL原理剖析

182次阅读

共计 2506 个字符，预计需要花费 7 分钟才能阅读完成。

自动写代码机器人，免费开通

Quick BI 的模型设计与生成 SQL 原理剖析

一、摘要

随着互联网的高速发展，数据量呈现井喷式的增长，如何来分析和使用这些数据，使数据产生商业价值，已经变得越来越重要。值得高兴的是，当前越来越多的人已经意识到了用数据分析决定商业策略的重要性，也都在进行着各行各业的数据分析。众所周知数据分析的核心是数据，为了更容易的分析数据，数据模型的设计需要遵循一定的规范。当前最流行的联机分析处理 (OLAP) 的规范为维度建模规范。本文介绍 Quick BI 如何进行维度建模，基于维度模型如何来自动化的生成分析查询的 SQL 语句，从而使数据分析变得更容易。

关键字：Quick BI、OLAP、维度建模、SQL

二、维度模型的分类

OLAP（On-line Analytical Processing，联机分析处理）根据存储数据的方式不同可以分为 ROLAP、MOLAP、HOLAP。ROLAP 表示基于关系数据库存储的 OLAP 实现（Relational OLAP），以关系数据库为核心, 以关系型结构进行多维数据的表示和存储；MOLAP 表示基于多维数据存储的 OLAP 实现（Multidimensional OLAP）；HOLAP 表示基于混合数据存储的 OLAP 实现（Hybrid OLAP），如低层用关系型数据库存储，高层是多维数组存储。接下来主要介绍基于关系型数据库的 ROLAP 的建模原理。

ROLAP 将多维数据库中的表分为两类：事实表和维度表。事实表用于存储维度关键字和数值类型的事实数据，一般是围绕业务过程进行设计，例如：销售事实表，一般来存储用户在什么时间、地点购买了产品，销量和销售额等信息。维度表用于存储维度的详细数据，例如销售事实表中存储了产品维度的 ID，产品维度表中存储产品的名称、品牌信息，两者通过产品 ID 进行关联。

ROLAP 根据事实表、维度表间的关系，又可分为星型模型(Star Schema)、雪花模型(Snowflake Schema)。

1. 星型模型

星型模型它由事实表（FactTable）和维表（DimensionTable）组成。事实表中的维度外键分别与相对应的维表中的主键相关联，关联之后由于形状看起来像是一个星星，所以形象的称为星型模型。以下示例为星型模型：其中 sales_fact_1997 为事实表，存储客户在某个时间、某个商店、购买了某个产品，购买量和销售额的信息，记录的是一个下单过程。事实表 sales_fact_1997 通过外键 product_id、customer_id、time_id、store_id 分别与维度表 product(产品维表)、customer(客户维表)、time_by_day(时间维表)、store(商店维表)相关联，关联关系为多对一关联。

2. 雪花模型

雪花模型是当有一个或多个维表没有直接连接到事实表上，而是通过其他维表连接到事实表上时，其图解就像一个雪花，故称雪花模型。下面示例 product（产品）维度表与 product_class(产品类别)维度表通过 product_class_id 相关联，关联关系为多对一。product_class 没有与 sales_fact_1997 事实表直接关联。