注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

数据挖掘 营销应用

说出你的业务困惑, 看数据挖掘能否帮你解惑

 
 
 

日志

 
 

数据挖掘交流讨论(34,“为什么不用判别分析???”)  

2011-12-06 16:05:29|  分类: 数据挖掘交流讨论 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
 

背景: happyjava在2011年12月4日留言本博客(“我看了数据挖掘交流讨论(16,与“小鸟”讨论基金公司的挖掘应用)这个话题,有些不同的想法向你请教。为什么不用判别分析呢?‘案例中说到:基金公司有购买某长期产品的客户的交易记录’,那么这些客户都是购买这种产品的用户,如果按照购买产品来划分,这些客户都属于同一类。在这种情况下,能否采用判别分析来求出判别函数,根据判别函数来判断新客户是否属于此类呢?”)

我的回复:谢谢Happyjava, 你的问题很好,我说说我自己的一点愚见;

首先要说的是,条条道路通罗马,数据分析实战应用中没有说只能用甲方法,不能用乙方法,用什么方法取决于分析师熟悉熟练什么方法,并且要参考当时的数据现状;而且,通常说的话,一个分析课题一定是有不同的方法都可以有效解决的(至少2种方法,多的话更多);

其次,本案例的背景是:该基金公司从来就没有进行什么深入的分析挖掘,很有可能原始的数据存储都很混乱,所以,针对这个实际现状,建议先做聚类分析,其实就是一个比较深入的数据摸底工作(这也是聚类分析的常用的价值点,它通常更多的是为后来的专题模型做些前期的数据梳理熟悉了解的过程);

第三,如果你很喜欢判别分析,当然可以尝试主动积极使用这个方法,的确是每个人有个人的喜好和习惯;

第四,我之所以很少实际使用判别分析,主要是因为在数据挖据的实践场景中,抛开“判别分析”的定义不说,很多时候数据挖掘的聚类、预测响应模型、预测模型都是实际上很大程度上替代了单纯的“判别分析”的功能,举例来说,聚类模型如果我们觉得结果比较不错的话(比如可以分成3-4组比较有意义的群体),接下来可以直接用这个聚类模型去判定一个新的观察值是归属聚类中的哪个群体,这个是否可以代替“判别分析”呢? 再比如,很常见的类别类预测(响应)模型、预测模型,它的作用不是也在代替单纯的“判别分析”呢?我个人理解,“判别分析”更多的是从统计学的角度,针对字段少,数据少的时候是个很方便简洁的工具,如果一旦在当今基金行业、互联网行业等海量数据的情况下,考虑的字段多,分析的数据多,这个判别分析相比上面的数据挖掘工具来说,并没有优势吧!

最后,你上面提到的利用判别分析解决的那几个你自己想的课题,但是,具体到业务应用中,哪些字段有意义,哪些没有意义,这个是要数据挖掘的其他工具来分析的(比如相关、回归、k方,变量筛选),单纯的判别分析好像很难独当一面,孤军奋战吧。因为数据挖掘的上述工具都是可以很好很有效解决的,所以我很少使用判别分析,如果你觉得可行,的确可以去试试,把判别分析与其他的数据分析工具相结合,呵呵,祝你成功!!!

另外,你提到了关于“聚类分析”的结论的评价和解读,建议你参考之前的博客,数据挖掘交流讨论(23 ,与“汪生”分享我对于聚类实践应用的个人体会)。聚类分析最终的评价和解读是要结合业务专家的经验的,是非常个性化的真正跟具体业务实际密切相关的。

说的不对,见笑了,期待你的指正,并期待你分析的的在实践中的判别分析的案例!再次感谢你的留言!!!

  评论这张
 
阅读(1249)| 评论(3)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017