数据挖掘过程是计算机科学的一个分支,涉及从大型数据集中提取模式。然后使用统计方法和人工智能将这些集合进行组合。现代企业中的数据挖掘负责将原始数据转换为人工智能源。数据被操纵,因此能够给出可用于决策的可靠决策。这给企业带来了超越竞争的优势,因为它们拥有可用来提供情报的数据集。组织还使用数据挖掘来进行概要分析,包括市场营销,监视科学发现和欺诈检测。
数据挖掘可能还有其他常见术语,例如数据钓鱼,数据挖掘甚至数据监听。所有这些都指向数据挖掘的不同变体,这些变体用于对可能太小而无法产生统计推断的小数据集进行采样。但是,这些对于概述使用中的数据的有效性至关重要,并且在期望获得给定的数据总体时可以用于创建假设。

另一方面,数据仓库是一个术语,描述了组织中用于数据收集的系统。数据仓库收集的数据是交易系统提供的,例如发票,购买记录甚至贷款记录。数据记录是从创建的各个点获取的,并汇集在一个称为数据仓库的屋顶下。然后报告此数据,并以汇总方式完成报告,以帮助业务信息的用户做出有效的决策。要有效地工作,数据仓库需要数据源,数据库和报告工具。

因此可以说,数据仓库是一个数据库,用于报告已分析数据的特定目的。此数据来自为报告建立的不同系统。

为了完成其功能,数据仓库在三个不同的层中维护功能。其中包括暂存,集成和访问。在登台过程中,开发人员仅出于分析和支持的目的存储原始数据。集成层用于数据集成,并具有来自数据用户的抽象级别。最后,访问层对于从不同的数据用户中获取数据很重要。
数据挖掘和数据仓库都可以称为用于收集商务智能的工具。两者的主要区别在于如何收集商务智能。因此,可以说已经很好地存储了数据,因此可以很容易地利用它们。因此,数据仓库负责简化数据挖掘的工作,从而将所有需要挖掘的相关数据存储在一个中央位置,而不是在数据挖掘必须继续在不同位置寻找数据的时候。这有助于节省花费在数据挖掘上的时间和挖掘中使用的资源。

总结

  1. 数据挖掘是从大型数据集中提取数据的过程。
  2. 数据仓库是将所有相关数据汇集在一起的过程。
  3. 数据挖掘和数据仓库都是商业智能收集工具。
  4. 数据挖掘特定于数据收集。
  5. 数据仓库是一种通过将组织/企业中不同区域的不同位置的数据汇集在一起来节省时间并提高效率的工具。
  6. 数据仓库具有三层,即分期,集成和访问。
欢迎任何形式的转载,但请务必注明出处,尊重他人劳动成果。
转载请注明:文章转载自 有区别网 [http://www.vsdiffer.com]
本文标题:数据挖掘与数据仓库
本文链接:https://www.vsdiffer.com/vs/data-mining-vs-data-warehousing.html
免责声明:以上内容仅是站长个人看法、理解、学习笔记、总结和研究收藏。不保证其正确性,因使用而带来的风险与本站无关!如本网站内容冒犯了您的权益,请联系站长,邮箱: ,我们核实并会尽快处理。