数据仓库是什么
数据仓库是一种技术,它结合了许多企业应用系统文件,合并到一起,形成一个可用于决策支持的系统。它以数据模型的形式来管理数据,从而为决策支持提供基础。数据仓库的建立不仅仅是把一些原有的数据库联接起来,还要实现对数据的统一管理,以及对数据的质量保证和控制。数据仓库的使用范围包括企业战略运营活动、市场分析、客户关系管理、企业财务管理、决策支持等,及时响应用户查询。
数据仓库通过收集企业所有应用系统的数据,对数据进行统一的管理和控制,综合地分析数据的分布规律、趋势、变化和关联,实现多维度维度数据的集成管理,转换成可直接用于决策支持的系统,以实现企业的长期存储,管理和分析,高效地把历史数据转变为有价值的信息,提高企业管理效率和管理水平。数据仓库采用多维度结构,可实现在多个维度上对数据进行分类、分析、查询、统计分析及其它数据处理操作,支持复杂的分类分析和统计分析,满足用户的信息需求,而且通过某种更新机制可保证数据仓库中包含的数据与实际相一致,为决策人员提供有价值的信息。
数据仓库是什么概念
数据仓库是一种把计算机中各种存储设备上数据进行分类和集成,以便更方便地进行管理、分析和处理的一种数据库技术。它是数据仓库设计和数据库应用分类的一种技术,是数据仓库的重要组成部分,其特点是具有低冗余度、相对固定的结构、专业知识的维护,而且可以将一个系统中的数据快速地检索和提取出来,它是计算机环境中团体信息处理领域的一种特殊形式的数据库。
典型的数据仓库系统由多个子系统组成,其中包括:数据源子系统,数据转换子系统,数据清洗子系统,数据集成子系统,数据存储子系统,数据挖掘子系统和浏览子系统等。其中,数据源子系统是收集外部和内部机构所使用的原始数据的地方;数据转换子系统用于将原始数据转换为数据仓库系统中可用的数据模型;数据清洗子系统用于识别及消除原始数据中存在的冗余信息、错误信息等;数据集成子系统用于将不同源的数据整合在一起;数据存储子系统用于存储数据,使系统中的数据安全可靠;数据挖掘子系统用于从数据仓库中提取出有价值的信息;浏览子系统用于实现图形或文字形式的访问系统。
数据仓库的介入,可以把组织的整体数据作为统一的整体来提供。数据仓库不仅支持系统内部的数据有效利用,而且还支持系统内部和外部的复杂的数据管理和控制,同时,也可以实现数据的可视化,使得对系统中各类对象和信息的多层次把控和分析更容易实现。另外,数据仓库可以模拟组织内部、外部不同源的原始数据,实现数据的汇总和整合,把这些原始数据变为一个更适合分析和掌握的数据集,为管理和决策部门的数据分析和决策提供更可靠的依据,大大提高了对组织内活动的掌控和准确性。
同时,数据仓库在开发工作中也拥有重要的作用,相比于传统数据库系统,数据仓库可以采取统一的数据开发模式,数据仓库通过数据转换和数据清洗将原始数据转换为可操作的数据,而不需要重新编写各类应用程序,为开发者提供了更集中的开发入口,更加便利和快速。
总之,从它本质上来讲,数据仓库的功能定义为把数据集中存储在一个特定的位置,用以方便进行数据管理、分析和处理,并且以数据挖掘的方式实现个性化的自动管理,具有信息整合、可查询的特性,对组织内部管理和外部分析均具有显著的作用。