达梦数据库

English

数据挖掘工具

       达梦数据挖掘工具DMDataMining是一个开放性的通用型数据挖掘平台,主要用于数据挖掘模型的数据源设计,模型的发现、训练和验证,为实际应用项目中的数据挖掘子系统提供应用模型来源,以及必要的技术指导。DMDataMining实现了数据挖掘领域的多数经典算法,总体上可分为分类与回归、聚类和关联规则发现。DMDataMining支持两种数据类型,numeric和nominal。numeric对应Java语言中的实型、整形以及双引号引用起来的字符串等;nominal有有限的取值范围,定义nominal数据时需要预先定义其取值列表,该数据变量只能在该列表上取值。

       DMDataMining挖掘工具操作的对象是数据集,DMDataMining集成了各种挖掘算法供用户选择,用户根据待挖掘数据的内容和特征选择适当的挖掘算法进行操作。DMDataMining挖掘工具的使用工作流程如下:


                                               图1 达梦数据挖掘工具DMDataMining工作流程图


       DMDataMining挖掘工具以统一的操作界面将各种挖掘算法集成在一起,为用户提供了易用、简单的操作。

下图所示是DMDataMining在一个超市销售记录上作关联规则挖掘的一个挖掘结果:


                                                图2 达梦数据挖掘工具DMDataMining挖掘结果


DMDataMining具有如下一些特性:

  • 支持多种数据源:文件、关系数据库、URL;

  • 支持数据预处理:包括数据筛选、分类统计;

  • 支持多种挖掘分析:分类与回归分析、聚类分析、关联分析、序列分析;

  • 支持多种挖掘算法:Apriori、BFTree、FarthestFirst...

  • 支持简单的模型管理;

  • 提供API供应用系统集成;

  • 支持挖掘结果可视化。