注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

数据挖掘 营销应用

说出你的业务困惑, 看数据挖掘能否帮你解惑

 
 
 

日志

 
 

数据挖掘交流讨论(24,答复“汪生”的第二次留言)  

2010-08-18 16:05:15|  分类: 数据挖掘交流讨论 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
 

背景介绍:网友 “汪生”在2010年8月17日在本博客留言“我是第二次给您留言,跟您一起探讨问题很开心。我们做了一些项目,经常遇到头大的问题,就是:结果很好,但没办法用业务逻辑来解释。我不知道您是否遇到过,但我经常遭遇这种情况。如果 结果没有业务逻辑的很好解释,客户宁愿选择不用。不知阁下是否有好的经验分享。谢谢!”

我的回复:“汪生你好:多谢厚爱,很高兴与素昧平生的你“一而再地”坐而论道,纸上谈兵,让我原本无聊的此刻多了一些貌似有意义的留念,呵呵。 你谈到的这个问题是所有的数据挖掘商业实战中比较常见比较突出的问题,谢谢你提出来,可以让大家一起讨论,分享“众人拾柴火焰高”的收获。本着抛砖引玉的原则,我谈谈自己的一些愚见,望各位同好不吝指教,谢谢。

“结果很好,但没办法用业务逻辑来解释”一般有两种大的情形,一是算法本身就是让人无法解释结论,比如我们大家都知道的神经网络算法,这个是该算法天生的缺陷,无法回避,不是我们的错,也没有办法解决,顺其自然吧;第二种情形(也应该是你所提出的那类困惑),也就是分析人员对于挖掘结论很满意(这个满意主要是停留在一些统计结论指标上,比如ROC, % response rate, % captured response rate, lift value,等等),但是无法向业务人员说出让他们信服的个中业务逻辑,导致挖掘结论难以付诸应用实施。我个人感觉,这里面主要的责任还是应该在数据分析人员和分析团队这边,如果说从项目立项,到具体抽取数据,清洗数据,分析挖掘数据等一系列环节都随时与业务人员和业务部门保持沟通和交流的话,挖掘结论或多或少是会得到业务方的认可的;否则的话,具体的思路和环节步骤都是分析人员自己在独立操盘,直到出了结果再跟业务人员沟通的话,业务人员当然会“一头雾水”;这个话反过来说可能更加容易理解,也更加实用,那就是“如果业务人员从项目立项之初就开始或多或少介入或者(参入,清楚)整个项目进度的阶段性小结,思路,数据现状等等的话,业务人员一定会针对各个环节的具体情况提出基于他们业务灵感和业务经验的建议或者意见,这些业务建议常常是“事半功倍”的主要贡献因素,如果真是如此跟“业务人员紧密联系的话”,你所困惑的“结论缺乏业务逻辑理解”的问题或多或少是可以减轻的,呵呵。

除此之外,我从自己的肤浅经历来妄加空谈从技术上如何减轻或者规避这个“结论缺乏业务逻辑理解”的困惑:

第一,   对于一个具体的分析挖掘项目,多尝试不同的算法,然后选择综合性表现最好的模型作为最终的解决之道。实践中常常会发现不同的算法结论中包含不同的业务逻辑规则,没准,有些规则就是很容易被业务部门所理解和认可的;

第二,   从项目一开始就拉业务部门人员“入伙”,随时沟通过程中的思路,问题,解决办法,这样肯定不会导致最后出结论是完全让业务方觉得“无法理解,没有逻辑解释”。

第三,   真的到时候自己也觉得结论或规则的解释是“匪夷所思”时,好好检查一下自己的抽样是否合理,是否有代表性,甚至是开始的分析思路是否合理。有时候,模型效果看起来不错,其实是假象,比如模型过拟合,分析人员的确是要问问自己的解决方案是否合理,有没有大的漏洞。这里面有太多的原因,千奇百怪,只能自己去积累去体会,多学多看多个心眼了。

第四,   在商业实战中,项目当初的思路和项目结案时的思路很有可能是南辕北辙,期间有多次重大的方向调整,思路调整,非常正常,非常合理。因为随着对数据的逐步了解,会有很多新的发现,新的情况出现,导致分析方向的重大调整,修正。

第五,   “实践是检验真理的唯一标准”,某些场合某些项目中,“是否能让业务部门信服挖掘中的业务逻辑解释”并不是一定要坚持的原则,如果数据分析挖掘人员业务知识足够充分,并且对于挖掘结论挖掘模型非常满意非常有信心的话,可以通过小范围的实际应用来检验这个模型的价值。这个要看作为分析人员的你是否足够“强势”,你的强势建立在你的专业信誉和业务信誉上。如果你之前的那些项目都受到业务部门的或多或少的认可的话,眼前的“具体项目结论的困惑”我相信是不很妨碍业务部门的兴趣和热情的。另外,“规则的逻辑理解”这个话真是仁者见仁,智者见智,如果你的沟通能力很强大,如果你在业务部门里的人脉很强大, 如果你以前项目的效果口碑很好的话,“结论的逻辑理解性”是可以因你的强大而改变的,归根到底取决与你的个人魅力,并不一定是完全的数据逻辑规则。在数据挖掘商业实战中,做的最成功的分析师一定不是埋头挖掘的分析呆子挖掘呆子,一定是那些既熟悉挖掘技术,更了解业务内容,能沟通,会合作,尤其懂得“欣赏”业务人员的活跃分子。卡耐基的名言“一个人的成功,30%靠他的专业知识,70%靠他的处世技巧和人际关系”,这个话同样适合与数据挖掘商业实战中的分析项目和分析人员。

 

人生其实是很矛盾很讽刺的,所以这个社会上充满了口是心非的人和事;我本来自认为一向厌恶纸上谈兵的挖掘作风,但是此刻我自己也在纸上谈兵,所以说做人很难,做一个能时刻坚持自己的信念而丝毫不动摇的真汉子是很难的。可见我不是真汉子,我还要好好修理自己,提升自己, 非常惭愧。

道家说“道可道,非常道”, 佛家说“无法可说,是名说法”,这些都是朴素的永恒的真理。这个世界本来就是说不清、道不明的,真要“写成文字”的话,一定是偏离了事物的本来面目的。所以,我上面说的通篇文字其实是一堆废话。数据挖掘的体会,心得,经验,都是每个人自己去体会去经历去行动的,Just DO it ! 凡是写出来的,都是“一知半解”的管窥,所以我惭愧不能为你提供什么具体实质性的帮助,只能衷心祝福你在数据挖掘实践中自己去修炼去升华!!!
  评论这张
 
阅读(671)| 评论(1)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017