嵌入式数据挖掘模型及其在银行卡业务中的应用

作者：时间：2013-11-21 来源：网络收藏

2嵌入式数据挖据的应用

2.1嵌入式 数据挖掘

在银行卡业务中的应用目前的数据挖掘技术在银行卡业务上的应用大多存在3个方面的局限：1）效率不高：面对目前的海量数据挖掘时，显得无能为力；2）专业化程度较低：不能很好的专门针对银行卡业务进行挖掘；3）开销较大：需要开发专门的系统来进行数据挖掘，而且大多数系统不能进行二次开发。

嵌入式数据挖掘显然很好的弥补了普通数据挖掘技术所带来的缺陷。首先，嵌入式数据挖据是把算法直接嵌入到数据仓库下，从而减少数据转换的时间，充分利用整个数据仓库的处理能力，大大提高数据挖掘的效率；其次，它实现了算法的组件化管理，针对不同的行业开发不同的算法组件，对银行卡业务进行数据挖掘的主要目的是对客户进行分类，从中发现对银行贡献度较大的优质客户，嵌入式数据挖掘可以开发单独的算法专门满足客户分类的需要，从而具备了很好的专业性。最后，嵌入式数据挖掘系统是个种很灵活的数据挖掘系统，客户可以在系统中不断添加新的算法、改进算法，同时进行二次开发，从而省去了重新开发大型系统的开支，这点对于当今企业来说显得尤为重要。

2.2应用实例分析

为了证实嵌入式数据挖掘模型的有效性，我们与中国银行湖南分行进行了合作，采用其信用卡业务数据分别对嵌入式数据挖掘模型系统和非嵌入式数据挖掘模型系进行运行对比，测试是在PC机（P4 2.5G CPU，HY DDR512M RAM）上进行的，选取CMP和Apriori两种数据挖掘算法。选择嵌入的数据库为SQL Server 2005实验钱据从10 000条记录到160 000条记录，以测试上述两种算法在大小不同数据集上采用嵌入式数据挖掘和非嵌入式数据挖掘所表现出的性能差异。嵌入式数据挖掘在银行卡业务中的应用主要包括关联规则挖掘和分类挖掘。

1）关联规则挖掘综合持卡人用卡行为和基本情况进行分析，导出具有一定支持度和可信度的用卡习惯的人群组成之间的关联规则。在算法选择方面，选择了由wang H等提出的一种新型高效决策数算法：CMP算法。在实例中，当实例数据呈倍数增长时，数据挖掘所需时间对比如表1所示。

算法运行效率曲线如图5所示。

本文引用地址：//m.amcfsurvey.com/article/257004.htm

2）分类挖掘根据持卡人的使用情况和交易方式，对持卡人群进行分类，主要分为优质客户、潜在优质客户、流失客户和潜在流失客户等，这也是当前比较流行的用法。在分类挖掘过程中，使用关联规则中的Apriori算法对实例进行了数据的挖掘，算法时间对比如表2所示。

算法运行效率曲线如图6所示。

从以上对比数据可以看出，在将嵌入式数据挖掘应用到银行卡业务数据的挖掘当中后，对于两种不同的算法，其效率的提高都是显而易见的，从图形中可以看出，不管是CMP还是Apriori，其效率上都有2～3倍的提高。从应用实例中，还可以看出，随着业务数据量的不断加大，嵌入式数据挖掘能更进一步的节省时间。整体说来，嵌入式数据挖掘模型是非常有效的，同时把它应用于银行卡业务数据的挖掘中也是切实可行的。

3结束语

嵌入式数据挖掘模型使挖掘算法更加简单易用、方便，它将成为第四代数据挖掘系统的一个重要发展方向之一，也是数据仓库系统，商业智能平台的一个重要发展方向。把新的嵌入式数据挖掘技术应用到银行卡业务中，一方面可以验证嵌入式数据挖掘技术的优越性，推动数据挖掘技术的发展；另一方面，为商务智能应用软件升级做出贡献，这是一个极具吸引力的课题，具有十分重要的社会效益和经济价值。

linux操作系统文章专题:linux操作系统详解（linux不再难懂）

新闻中心

嵌入式数据挖掘模型及其在银行卡业务中的应用

评论

相关推荐

技术专区