注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

数据挖掘 营销应用

说出你的业务困惑, 看数据挖掘能否帮你解惑

 
 
 

日志

 
 

数据挖掘交流讨论(7,上期讨论之真实数据样本之跟踪分析)  

2009-05-11 08:58:54|  分类: 数据挖掘交流讨论 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

 

背景介绍:上期交流谈论(专题之六)根据“网易博友86”给出的几个字段名称,本博客给出了一个大概的系列数据分析数据挖掘纸上谈兵的思路解决方案。谢谢“网易博友86”的捧场,随后提供给我一份真实的数据样本共计1155条记录(取自某批发商2008年12月6日到2009年1月30日的部分客户订货合同信息),字段包括产品名称(共有127个单品规格,我初步可以将其分为电池、内存、光驱、硬盘、键盘、鼠标、笔记本、MP3MP4、电脑包、软驱、插槽等12大类)、交易数量、交易总价、商机状态(三种状态,包括货物发出、商机中止、合同确认中)、毛利、备注(包括是否促销、是否退货等)、客户名称(共计117个下游客户)。

拿到样本数据后第一个动作是做一个基本的数据扫描,大致了解数据的形式、分布、范围、异常点等等。基本上也出现了所有数据分析数据挖掘项目中普遍的问题,那就是原始数据有很多有关数据质量的问题(比如数据空缺、部分数据矛盾、总价为负数、总利润为负但又不是退货和维修服务,备注字段全是文字,需要统一数据转换,等等),这都是所有数据挖掘实战中最通常的现象,需要跟用户交流沟通,需要花大量时间做数据清理和数据转换,在这里一笔带过,因为这里是讲思路将方法讲方向,所谓“大步飞奔,不拖泥带水”是也。

接下来的一个非常重要步骤就是增加分析用衍生变量。根据以往项目经验,产生一些新变量,包括毛利率、单个客户单位时间段订货次数(频率)、每次定货的产品种类数量(类似与零售行业的购物篮系数)、产品单价、促销响应(是否对促销有反应)、各客户在时间段内消费各大类产品的百分比率(主要用于聚类分析时更深入了解客户的消费特征和消费模式)。这些新的衍生字段之所以很重要很关键,在于一方面它们提供了更多的维度更多的视角(甚至比原始的字段更有分析价值和挖掘意义)让我们分析数据看待现象,另一方面现存的数据字段能比较容易产生这些新的衍生字段,没有很大的前期成本,非常具有可操作性和可靠性。

基于上述比较真实数据样本提供的大致情况,现在重新做出更有针对性的更接近真实的数据分析挖掘思路。首先利用浅层次数据统计技术,可以准确回答传统营销分析报告中比较核心的也广受企业用户需要和欢迎的一些问题,诸如有关重点客户组成、重点销售时间段、重点产品规格、常规销售预测、重点赢利产品群、亏损客户群、无效产品群。基于这些基本的统计分析,用户可以调整资源部署,优先倾斜给少数的重点客户类型、少数的重点产品规格、少数的黄金时间段、(优化人员配置、优化产品库存、优化客服重点、优化营销步骤)。举些简单例子,比如根据此样本数据,我们可以发现客户“上海嘉#”所产生的毛利润贡献占全部117个客户总利润贡献的12%,该类型客户共有13个,产生的毛利占总毛利贡献的60%,这13个客户是我们今后要重点关注重点维护的黄金群体;再看产品,512M DDR2(667HMz)贡献毛利占全部127个产品总毛利5%,当然是重点关注的利润拳头产品;根据项目经验,尽管这些分析技术很简单,但是思路很明确很成熟,刀刀所砍所杀皆是致命的软肋和薄弱的急所,对当今还没有体会过数据分析决策的中国广大中小企业来说,所挖出的结果和结论一般可以让企业用户营销效率至少提升20%(前提是他们必须按照这些分析结论去安排营销工作的)。

在常规和传统的简单统计数据分析之后,企业用户应该已经可以尝到这些分析结论的应用所带来的甜头了,接下来是比较浅层次的数据挖掘应用,具体针对该样本数据来说就是关联分析,将每个客户每次合同的产品种类进行分析,找出那些最有价值的可以一起促销的产品关联,这就是所谓的交叉销售和精准促销的一种。上期也谈到,关联分析不仅仅是分析有关产品的关联价值,还可以推广应用到更多的分析领域,包括同一客户在序列时间段的连续购物分析,从中发现有代表性的购物趋势,这也是预测的一种方式,可以用来针对核心客户做精准营销。关联分析甚至可以通过退货客户数据分析发现有价值信息,比如那些产品在一起购买是更容易退货,那些退货可以提前预测,等等,太多的关联应用,实在难以穷尽,呵呵。保守估计,这样深入关联分析下去,企业用户据此调整营销策略,可以提升营销效率和盈利最少15%以上。举个简单例子,上述数据经过关联分析挖掘,可以发现某型COMBO的定购常常有40%的机会同时带动某型电池的定购,某型DVD的定购常常有38%的概率带动某型底座的同时被定购,如果客户本次合同定购了这几类产品,那么今后一个月时间里该客户有50%可能性会订购另外哪些产品,等等,这些最明显的关联信息如果被该批发商有效利用到今后的促销、营销、商品管理等活动中的话,一定可以带来销售额和客户满意度的双赢。

再往下是以客户为分析对象的深入研究,通过分析时间段内各客户的消费情况,针对那些利润贡献最大的黄金客户群体可以采取更加有针对性的营销措施和关怀。根据现有数据样本,有两个方法分别深入研究,一是通过聚类技术,对各客户从不同的角度(上述新增的衍生变量)进行群体划分,企业由此可以更深入更多视角更全方位划分客户的主次地位,了解那些最有盈利贡献价值的客户群体的方方面面的典型特征,由此采取营销措施,肯定能提高这些贵客的忠诚度和满意度。另一个分析方法就是通过预测模型的不同算法,搭建客户生命周期模型,发现不同客户的消费趋势模式、是否流失可能性、如何根据模型因素找出相应的挽留措施或者相应的鼓励消费措施。 这里面大有文章可做,企业更可以从中显著提升客户满意度和经营效益。

根据该真实的数据样本的备注字段,我还想到针对促销分析,哪些客户对促销反应明显,那些反应迟钝,反应强烈的有哪些特征因素,有那些促销弹性和毛利提升空间,如何可以被我们今后有效加以刺激;对那些反应迟钝的,有哪些别的方面和思路可以让他感兴趣,如何测试,等等,现有数据可以大部分回答,另外小部分要跟用户沟通,采取有序的步骤调试。这个促销分析可以基于简单的统计技术,也可以尝试复杂的数据挖掘深入探索,总之现有数据已经具备了分析的前提和基础了。

在上述不同层次分析挖掘完成并使得该批发商真正从中得到显著经济效益之后,接下来是真正的从数据挖掘基础设施搭建考虑的立足长远可持续发展的企业数据管理基本规划、实施、应用阶段。当这些全面系统的有关信息、数据收集、管理、应用系统投入实施后,企业将会更加全面更加有效地受益于数据挖掘所支持的现代营销技术。

以上观点,欢迎有缘者指教,尤其喜欢挑刺、拍砖、有独到见解、甚至跟我观点势同水火势不两立的朋友。反对和批评是让我进步的捷径,谢谢并期待中!

  评论这张
 
阅读(406)| 评论(5)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017