目前市场上发布的数据挖掘软件大致分为三类:通用工具类;综合工具类;面向特定应用工具类。其中:
1. 通用工具类占有较大和成熟的一块市场。从定义上说。它们是非面向特定应用的。从本质上说,它们的范围是水平的,主要包括:SAS Enterprice Miner, SPSS Clementine, IBM Intelligent Miner, Oracle Darwin, Angoss KnowledgeSeeker. 2. 综合工具是指商家要求该类工具能提供管理报告、在线分析处理和在普通结构中的数据挖掘能力。著名的有Cognos Scenario 和 Business Objects。 3. 面向特定应用工具发展迅速,在这一领域的厂商设法通过提供商业方案而不是寻求方案的一种技术来区分自己和别的领域的厂商。重要的工具有:KD1(重点在零售业);Options & Choices(重点在保险业);HNC(重点在欺诈行为探查);Unica Model 1(重点在市场)。 当前的各类数据挖掘软件已经有许多,我们尽量选择了常见的软件,根据其实现的技术进行分类,使我们可以大致了解这些软件,列表如下:
|
实现技术 |
数据挖掘软件 |
|
统计方法 |
SAS/EM, Clementine, DataEngine, Partek, Matlab |
|
可视化技术 |
SAS/EM, Clementine, Visualication Data Explorer, IRIS, Partek, PV-WAVE, WinViz, MineSet, AVS/Express, NetMap, CrossGraphs, |
|
决策树 |
SAS/EM, Dawin, CART, KnowledgeSEEKER, KnowledgeSTUDIO, Business Miner, Scenario, Intelligent Miner, Decision Series, Minset, ALICE d’I Soft, SE-Learn, MinSet, NCR |
|
神经网络 |
SAS/EM, Clementine, 4Thought, Intelligent Miner, Decision Series, NeuralSIM, Darwin, DataEngine, DataScope, dbProphet, Partek, KnowledgeSTUDIO, Scenario, HNC, NRC,Unica Model 1 |
|
遗传算法 |
Partek, Aegis Development System, OMEGA,Unica Model 1 |
|
关联规则 |
SAS/EM, MineSet, Clementine, Scenario, Decision Series, Intelligent Miner, NCR,KD1,Options & Choices |
|
K—最邻近算法 |
SAS/EM, Darwin, KnowledgeSTUDIO, Intelligent Miner |
从上面的表格我们可以看出目前的数据挖掘软件主要实现了统计,可视化技术,神经网络,决策树等方法,还有其他方法有待开发,这个对我们以后的努力方向也有一定的参考意义。而从实现的技术来看还是SAS,SPSS占主导地位。
|