数据挖掘步骤一般有哪些
1、定义问题
在开始知识发现之前最先的也是最重要的要求就是了解数据和业务问题。必须要对目标有一个清晰明确的定义,即决定到底想干什么。比如,想提高电子信箱的利用率时,想做的可能是“提高用户使用率”,也可能是“提高一次用户使用的价值”,要解决这两个问题而建立的模型几乎是完全不同的,必须做出决定。
2、建立数据挖掘库
建立数据挖掘库包括以下几个步骤:数据收集,数据描述,选择,数据质量评估和数据清理,合并与整合,构建元数据,加载数据挖掘库,维护数据挖掘库。
3、分析数据
分析的目的是找到对预测输出影响最大的数据字段,和决定是否需要定义导出字段。如果数据集包含成百上千的字段,那么浏览分析这些数据将是一件非常耗时和累人的事情,这时需要选择一个具有好的界面和功能强大的工具软件来协助你完成这些事情。
4、准备数据
建立模型之前的最后一步数据准备工作。可以把此步骤分为四个部分:选择变量,选择记录,创建新变量,转换变量。
5、建立模型
建立模型是一个反复的过程。需要仔细考察不同的模型以判断哪个模型对面对的商业问题最有用。先用一部分数据建立模型,然后再用剩下的数据来测试和验证这个得到的模型。有时还有第三个数据集,称为验证集,因为测试集可能受模型的特性的影响,这时需要一个独立的数据集来验证模型的准确性。训练和测试数据挖掘模型需要把数据至少分成两个部分,一个用于模型训练,另一个用于模型测试。
6、评价模型
模型建立好之后,必须评价得到的结果、解释模型的价值。从测试集中得到的准确率只对用于建立模型的数据有意义。在实际应用中,需要进一步了解错误的类型和由此带来的相关费用的多少。
数据挖掘名词解释
“数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。”
关键词: 数据挖掘步骤一般有哪些 数据挖掘名词
推荐内容
- 数据挖掘步骤一般有哪些?数据挖掘名词解释_环球新动态 a>
- 平安陆金所如何取消所有营销短信?平安陆金所怎么操作?-天天速看 a>
- 每日热门:郑州委托律师停息挂账多少钱?让律师帮忙做停息挂账靠谱吗? a>
- 长春复大胃肠病医院靠不靠谱,亲民正规评价高 a>
- 前沿资讯!硫化氢有毒吗?硫化氢主要存在哪些地方? a>
- 环球最新:大数据有哪些类型 大数据的来源主要有几种? a>
- 当前视点!丝绸之路经过的国家有哪些?丝绸之路的地位如何? a>
- 刑事案件严重吗?刑事拘留一般多少天? a>
- 交房时发现房屋面积不够怎么办?交房时要注意哪些细节? 世界今头条 a>
- 微动态丨驰名商标的保护期限是多久?驰名商标和一般商标的区别是什么? a>
- 今日看点:被骗开了很多证券账户怎么销户?被骗开了证券我不用有影响吗? a>
- 民事案件会坐牢吗?民事纠纷会有案底吗? a>
- 世界职业经理人收入排行,职业经理人证书怎么取得-环球信息 a>
- 在青岛买房落户条件?买房落户广州的流程?-世界微动态 a>
- 在青岛买房落户条件?买房落户广州市政策? a>
- 世界滚动:天天酷跑积分抽奖有什么技巧?天天酷跑有何抽奖技巧? a>
- 买房如何青岛落户?买房落户广州的流程? a>
- 实验室建设要求有哪些?实验室安全注意事项是什么? a>
- 中场发动机是什么意思? 中场和中锋的区别是什么?_当前热门 a>
- 紫苏油是什么?紫苏油功效是什么? a>