08企业信息化战略与实施
07-企业信息化-BI知识体系
2021-09-04 149 1
简介 BI属于企业信息化重要的知识体系,涉及到数据仓库、数据挖掘和OLAP等技术。
商业智能 BI
BI是数据仓库、数据挖掘、OLAP的综合应用,将数据仓库、数据挖掘、OLAP打包为解决方案,用于解决问题。
OLAP: 数据立方体作为基础, 可以进行切片
数据仓库: OLTP服务器数据的汇总
数据挖掘: 挖掘未知的信息,比如关联分析
BI的架构体系
数据仓库:面向主题的,数据按主题来组织, 按某个主题提取数据, 从不同的源头,获取某个主题的数据信息,然后组织起来。
数据集市: 部门级的数据仓库,比数据仓库小一个级别
OLAP: 数据立方体, 原来的基础上加了时间维度, 分为三个维度, 可以从时间上进行切片等,
数据挖掘: 挖掘人类未知的规律或知识, 关联分析、 下钻分析、卷曲分析
数据库和数据仓库的区别
数据挖掘涉及的算法和方法
决策树:通过树形结构进行分析
神经网络:判别、回归、聚类分析
遗传算法:繁殖、交叉、变异
关联规则挖掘算法: 数据之间存在关联关系
关联分析:挖掘出数据之间的相互关系
序列模式分析: 挖掘出数据之间的因果关系
分类、聚类的区别: 前提是有没有分类的标签,有标签就是分类
分类分析: 已有分类方法, 对事物进行分类
聚类分析: 将类似特征归为一类, 前提是不知道什么类别。按表象定义出分类的 规则
数据仓库与数据集市区别
数据湖
数据湖是一个存储企业的各种各样原始数据的大型仓库,其中的数据可供存取、处理、分析及传输,是介于单个数据库和数据仓库之间的
数据湖从企业的多个数据源获取原始数据,并且针对不同的目的,同一份原始数据还可能有多种满足特定內部模型格式的数据副本。因此,数据湖中被处理的数据可能是任意类型的信息,从结构化数据到完全非结构化数据,数据湖中都会有
数据仓库仅支持分析处理,数据湖既支持分析处理,也支持事务处理,因为数据湖中有完整的数据副本