??xml version="1.0" encoding="utf-8" standalone="yes"?>
]]>
也许(zhn)用q?/span>cognos{数据挖掘工P但我很遗憄告诉(zhn)那只是一个功能强大的自定义报表展现工兗?/span>
数据挖掘Q?/span>DMQ?/span>Data MiningQ就是从大量的、不完全的、有噪声的、模p的、随机的数据中,提取隐含在其中的、h们事先不知道的,但又是潜在的有用信息和知识的q程。还有很多和q一术语相近的术语,如从数据库中发现知识Q?/span>KDDQ、数据分析、知识抽取、商业智能、决{分析等?/span> q里最重要的不仅是面向特定数据库的单检索查询调用,而且要对q些数据q行微观或宏观的l计、分析、综合和推理Q企囑֏C仉的相互关联,甚至利用已有的数据对未来的活动进行预?/span>
1、关pL据库Q日常运行的业务pȝ拥有大量的数据库
2、数据仓?/span>
3、事务数据库Q把一个或几个事务数据库集中到一个只ȝ数据挖掘?/span>
4、高U数据库及高U数据库的应用:CADI间数据库、文本数据库、空间数据库、多媒体数据库等
?/span> |
特征 |
数据挖掘法 |
集成 |
分布计算模型 |
数据模型 |
W一?/span> |
数据挖掘作ؓ一个独立的应用 |
支持一个或者多个算?/span> |
独立的系l?/span> |
单个机器 |
向量数据 |
W二?/span> |
和数据库以及数据仓库集成 |
多个法Q能够挖掘一ơ不能放q内存的数据 |
数据理pȝQ包括数据库和数据仓?/span> |
局部区域的计算机集?/span> |
有些pȝ支持对象、文本和q箋的媒体数?/span> |
W三?/span> |
和预a模型pȝ集成 |
多个法 |
数据理和预a模型pȝ |
Internet/Extranet|络计算 |
支持半结构化数据?/span>Web数据 |
W四?/span> |
和移动数?/span>/各种计算数据联合 |
多个法 |
数据理、预a模型、移动系l?/span> |
Ud和各U计设?/span> |
普遍存在的计模?/span> |
1、分cd析:主要用于预测模型Q通过数据库中的某些数据得到另外的数据为目标。分cȝ法通过判断数据记录的属性与已知训练数据中风险程度的关系l出预言l果
2、聚cd析:聚类用于从数据集中找出相似的数据q组成不同的l。与前面的预模型不同,聚类中没有明昄目标变量作ؓ数据的属性存在。聚cȝ法通过数据判?#8220;隐藏属?#8221;
3、关联规则:目的在于生成部分数据的概要,L数据子集间的兌关系或者一些数据与其数据之间的z关系
4、h工神l网l?/span>
5、遗传算?/span>
6、模p集和模p逻辑
7、可视化Ҏ(gu)
1、问题定义:明确实际工作Ҏ(gu)据挖掘的需求、通过对各U学?fn)算法的?gu)而确定可用的学习(fn)法
2、数据收集和预处理:数据准备、数据集成、数据清z、数据变换、数据简?/span>
3、数据挖掘算法执行:定挖掘d后,p军_使用什么样的算法。选择实现法有两个考虑因素Q一是不同的数据有不同的特点Q因此需要与之相关的法来挖掘;二是用户或实际运行系l的要求
4、结果的解释和评伎ͼ数据挖掘阶段发现出来的模?/span>,l过评估Q可能存在冗余和无关的模式,需要将其剔除。也有可能模式不满用户要求Q这旉要整个过E回退到前一阶段
数据挖掘?/span>OLAP都属于分析型工具Q数据挖掘是一U挖掘型工具Q它能自动地发现隐藏在数据中的模式,作出预测性分析的分析工具Q它的分析过E是自动的。用户不必提出确切的问题。数据挖掘所处的位置较深
OLAP是自上而下、不断深入的分析工具Qƈ以可视化的方式呈现给用户?/span>OLAP更多依靠用户输入问题和假设,但用户先入ؓȝ局限性可能会限制问题和假讄范围Q从而媄响最l的l论?/span>OLAP位于较浅的层?/span>
管数据挖掘?/span>OLAP存在着上面的差异,但二者相辅相?br />
Open View 决策分析q_会在2010-2011q推?/span>