随着信息技术的发展,它为大量积累的数据的增长提供了机会。并不确定所有现有数据都具有价值并验证了其真实性,为了能够促进所有这些数据,需要一个容器来处理、容纳和存储所有这些数据。数据挖掘可以是促进这一点的一种方法。
数据挖掘是提取或理解数据中有趣的模式,也可以将其解释为以以前手动未知的知识形式从数据集合中探索附加值的一系列过程。数据挖掘的目标是找到可能提供有用指示的关系或模式。
数据挖掘的过程如下数据选择
在 KDD 中的信息挖掘阶段开始之前,需要从一组操作数据中选择(select)数据。用于数据挖掘过程的选定数据存储在与操作数据库分开的文件中。 预处理 电话营销清单 清洗 在进行数据挖掘过程之前,需要对 KDD 关注的数据进行清理过程。清理过程包括删除重复数据、检查不一致的数据以及纠正数据中的错误等。 转型 编码是对选定数据的转换过程,使数据适合数据挖掘过程。KDD 中的编码过程是一个创造性的过程,实际上取决于要在数据库中搜索的信息的类型或模式。
数据挖掘是使用某些技术或方法
数据中寻找有趣模式或信息的过程。数据挖掘中的技术、方法或算法差异很大。选择正确的方法或算法实际上取决于目标和整体 KDD 过程。 解释/评估 数据挖掘 RU 号码列表 程产生的信息模式需要以感兴趣的各方易于理解的形式显示。此阶段是称为解释的 KDD 过程的一部分。此阶段包括检查发现的模式或信息是否与先前存在的事实或假设相矛盾。 数据挖掘具有帮助用户获取有用信息、增长知识的重要功能。数据挖掘的功能如下: 概括 表征=从其特征或属性描述一个类 歧视=区分阶级的特征 关联和相关性/频繁模式挖掘 描述属性之间的关系。