注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

数据挖掘 营销应用

说出你的业务困惑, 看数据挖掘能否帮你解惑

 
 
 

日志

 
 

数据挖掘实践应用(75,今日不知明日事,愁什么?)  

2010-06-20 19:45:39|  分类: 数据挖掘的实践应 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
 

当一个具体的数据挖掘分析任务限定在(数据提取后)一周时间里拿出分析结论报告以支持业务运营实践时,具体操刀的数据分析人员是一定有不小的压力的,压力来自多方面,但主要不外乎能否在有限时间里真正发现有价值的总结报告和结论。在太多的诸如此类的商业实战项目中,如果真的遵循那种按部就班的数据挖掘分析流程,稳扎稳打步步为营走下去,黄花菜早就凉透了;而每次在类似这种“7天项目”最后基本上圆满交卷时,帮助最大的不是挖掘算法挖掘技巧,而是对业务的熟悉理解以及在此基础上的预判和思路,当然,那种遇事不慌的心态也是关键所在,正所谓800年前南宋著名的道济祖师(民间俗称的“济公和尚”)对滚滚红尘中芸芸众生的偈语“今日不知明日事,愁什么?岂可人无得运时,急什么?”。

最近手上的一个项目,就是一个比较典型的“7天项目”,运营团队的工作已经远远走在前头,急需数据分析挖掘作出关键的“精确打击方向”。由于该产品刚刚上线,在线付费购买用户只有不到300人(这些用户还被事实上分成预付费用户和后付费用户,我想两者肯定是有相当的行为差别和利润价值区别的,这是后话,按下不表),业务运营方希望目前的有限数据条件下,尽量挖掘出付费用户的典型特征,逐步将这些发现投入到紧接下来的精细化运营中,然后逐步积累数据,扩大付费用户的基数,为最终建立付费用户预测响应模型奠定基础。

由于这是新产品,对数据不熟悉,数据仓库的数据提取重复了多次。第一次是没有考虑不同分析方向的优先程度差异,笼统抽取,发现跟随后的最优先等级的付费用户特征分析的数据要求有不小的差异;第二次数据提取(专门针对付费用户),又发现该产品的三种开通时间窗口(体验时间,捆绑时间,订购时间)相互重叠的复杂问题没有考虑到,经过与业务部门一起讨论时间窗口重叠问题,达成了共识的解决方法,第三次抽取数据,得到最终比较符合要求的分析数据。接下来,最重要的一步就是通过数据清理,熟悉,根据业务逻辑思路,产生衍生变量,比如全功能时间段每月产品后台登陆天次数,用户的主动行为指标等等,有了这些衍生变量后,基于300个付费用户的典型特征的一些明显特征已经出来了,比如这些用户有效时间里每月登陆产品后台的天次数基本上都是20天以上(仅就该发现与业务部门沟通,他们已经比较兴奋得到该指标阀值)。经过数据熟悉,清理,清洗以及衍生变量“无中生有”,眼看7天时间已经过去3天了;接下来的4天,可以分别对预付费和后付费用户分开分析,如果简单的统计方法无法得到系列有价值的特征结论的话,可以马上进行聚类分析活动。如何在极其有限的时间里聚类出满意的运营指导建议,这里面其实水很深,如果不跟业务部门一起协商探讨,完全由数据分析挖掘人员操办的话,可能一个月的时间也未必能拿出业务部门满意的结果;而如果聚类之前与业务部门一起沟通探讨的话,业务人员的关键指标的建议(或直觉)很可能就是聚类中最有价值的那两三个指标,真正可以事半功倍,皆大欢喜。

时间已经过去三天了,这个“7天项目”正在进行中,顺着上面的浅薄的思路,掐指算来该冤孽应该是可以如期交差的,呵呵。实战中的数据挖掘,最讲究的是挖掘者的心态,不温不火,不急不燥,你给我一周时间,我有一周的打法;你给我一个月的时间,我有三十天的新玩法(如果这个项目是三十天项目,可以考虑更加深入的不同算法的预测模型的思路,当然现阶段付费用户数量有限的情况下,三十天项目并不合适)。一周的打法,时间短,结论有限,但是可以满足业务部门“急功近利”的需求,不无可取;一月的打法,时间长,结论系统,长期看是主流的应用。一周和一月,变的是时间,不变的是对业务的洞察和“因地制宜”的挖掘者的淡然心态。

“今日不知明日事,愁什么?岂可人无得运时,急什么?”,实战中的数据挖掘,不用急,也不用愁。时间紧,有紧的玩法;时间松,有松的安排;人生一辈子究竟得到的是什么?其实就是一份体验与阅历之后的从容和练达,学佛的人就是从一辈子的“瞬间”悟出彻底的“空”,做数据挖掘的人就是从一辈子的项目中发现“道亦有道”,而把数据挖掘当作世俗职业的学佛的人就是从数据挖掘的俗套中反衬出佛学的清爽,彻底。

真正学佛的人,对于学佛尚且不急不燥,而何况对于数据挖掘商业实战应用乎?
  评论这张
 
阅读(646)| 评论(2)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017