Skip to content

Latest commit

 

History

History
41 lines (25 loc) · 2.93 KB

数据库和数据仓库的区别.md

File metadata and controls

41 lines (25 loc) · 2.93 KB

了解数据库和数据仓库的区别之前,首先掌握三个概念:数据库软件数据库数据仓库

数据库软件

一种软件,可以看得见可以操作的系统,用来实现数据库逻辑功能,属于物理层。Oracle、MySQL、Redis、Neo4j、MongoDB等等,还有一些可视化界面Navicat、Hue等。

数据库

一种逻辑概念,用来存放数据的仓库。通过数据库软件来实现。数据库由很多表组成,表是二维的,可以表现多维,一张表里可以有很多字段。目前市面上的数据库还都是二维数据库。如:Oracle、MySQL、DB2等。

在IT架构体系中,数据库是必须存在的。必须是有地方存放数据。比如现在的电商,物品的存货数量,用户信息等。数据库在生产环境就是用来干活的,凡是跟业务应用挂钩的,都会使用到数据库。

数据仓库

数据库的概念的升级。从逻辑上理解,数据库和数据仓库没有区别,都是通过数据库软件实现的存放数据的地方。只不过从数据量来讲,数据仓库要比数据库大得多。数据仓库主要用于数据挖掘和数据分析,辅助领导做决策。

数据仓库是商业智能(BI)下的其中一种技术。由于数据库是跟业务应用挂钩的,所以一个数据库不可能装下一家公司的所有数据。数据库的表设计往往是针对某一个应用设计得。如果需要分析数据,就得重新设计数据库的表结构。对于数据分析和数据挖掘,引入数据仓库的概念,数据仓库的表结构是依照分析需求、分析维度、分析指标进行设计得。

OLTP/OLAP

数据库与数据仓库的区别实际讲的是OLTPOLAP的区别。

操作型处理:叫联机事务处理OLTP(On-Line Transaction Processing),也可以称面向交易的处理系统,它是针对具体业务在数据库联机的日常操作,通常对少数记录进行查询、修改。用户较为关心操作的响应时间、数据的安全性、完整性和并发支持的用户数等问题。传统的数据库系统作为数据管理的主要手段,主要用于操作型处理。

分析型处理:叫联机分析处理OLAP(On-Line Analytical Processing)一般针对某些主题的历史数据进行分析,支持管理决策,ETL。

OLTP OLAP
细节的 综合的
实体-关系(三范式) 星型模型、雪花模型
存取瞬间数据 存储历史数据
可更新的 只读、追加
一次操作一个单元 一次操作一个集合
响应性能要求高 性能要求宽松
面向事务 面向分析
一次操作数据量小 一次操作数据量大
支持日常操作 支持决策需求
数据量小 数据量大