08企业信息化战略与实施

07-企业信息化-BI知识体系

2021-09-04 196 1

简介 BI属于企业信息化重要的知识体系,涉及到数据仓库、数据挖掘和OLAP等技术。

商业智能 BI

upfile

    BI是数据仓库、数据挖掘、OLAP的综合应用,将数据仓库、数据挖掘、OLAP打包为解决方案,用于解决问题。

        OLAP: 数据立方体作为基础, 可以进行切片

        数据仓库: OLTP服务器数据的汇总

        数据挖掘: 挖掘未知的信息,比如关联分析


BI的架构体系

upfile

    数据仓库:面向主题的,数据按主题来组织, 按某个主题提取数据, 从不同的源头,获取某个主题的数据信息,然后组织起来。

    数据集市: 部门级的数据仓库,比数据仓库小一个级别

    OLAP: 数据立方体, 原来的基础上加了时间维度, 分为三个维度, 可以从时间上进行切片等,

    数据挖掘: 挖掘人类未知的规律或知识, 关联分析、 下钻分析、卷曲分析

    

    

数据库和数据仓库的区别

upfile


数据挖掘涉及的算法和方法

    决策树:通过树形结构进行分析

    神经网络:判别、回归、聚类分析

    遗传算法:繁殖、交叉、变异

    关联规则挖掘算法: 数据之间存在关联关系

    

    关联分析:挖掘出数据之间的相互关系

    序列模式分析: 挖掘出数据之间的因果关系

    分类、聚类的区别: 前提是有没有分类的标签,有标签就是分类

    分类分析: 已有分类方法, 对事物进行分类

    聚类分析:  将类似特征归为一类, 前提是不知道什么类别。按表象定义出分类的 规则

    

  

数据仓库与数据集市区别

  upfile


数据湖

    数据湖是一个存储企业的各种各样原始数据的大型仓库,其中的数据可供存取、处理、分析及传输,是介于单个数据库和数据仓库之间的

    数据湖从企业的多个数据源获取原始数据,并且针对不同的目的,同一份原始数据还可能有多种满足特定內部模型格式的数据副本。因此,数据湖中被处理的数据可能是任意类型的信息,从结构化数据到完全非结构化数据,数据湖中都会有

    数据仓库仅支持分析处理,数据湖既支持分析处理,也支持事务处理,因为数据湖中有完整的数据副本

    

    



点赞 1

文章评论

欢迎您:

纸上得来终觉浅,绝知此事要躬行!

112 文章 57838 浏览 3 评论

联系我

  •   QQ:    361352119
  •  Email:  lisimmy@sina.com
  • 微信: