注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

数据挖掘 营销应用

说出你的业务困惑, 看数据挖掘能否帮你解惑

 
 
 

日志

 
 

数据挖掘与营销实践(11,企业数据太少怎么办?)  

2008-11-27 08:50:59|  分类: 数据挖掘的实践应 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

 

本文的技术思路参考罗茂初的《数据库营销》。当企业初次尝试数据挖掘时,经常会碰到的一个尴尬问题就是本企业积累的可供分析的数据太少,这让很多企业和挖掘匠人产生“巧妇难为无米之炊”的叹息。其实,现在已经有一些行之有效的技术手段解决这个数据太少的问题,一个比较成熟的技术就是渗析技术。

渗析技术是指一个数据向另外一个数据赋值,接受数据的一方称为受方,给予的一方称为给方。双方必须有一定数量的共同变量作为匹配的依据,共同变量越多,匹配的可靠性就越高。数据渗析的原理就是把给方作为种子代入受方数据,利用共同变量在受方中找到与给方中相似的群体,然后转移给方独有的那部分变量。

举个简单的例子,一家小型健身俱乐部只有登记在册的一千多个客人信息,并且信息量只有消费的套餐金额、每周消费时间段、消费项目、职业类别、性别、年龄、每次健身时间、等等有限信息。如果能通过另外的市场调查、相关行业数据共享等手段,得到外来的更多的客户信息(比原来更多的字段和变量,比如教育水平、收入水平、首选的营销渠道、健身的主要目的、对相关新项目的兴趣程度、对促销的反应程度,等等),通过上述的受方和给方的数据匹配,将具有相同几个变量特征的两方的客户信息放在一起,增加原来客户的新的变量值,就会显著增加俱乐部现存的一千多客人的更多的信息。

数据渗析技术所使用的核心算法称为统计匹配,具体手段包括:聚类分析、决策树、线性和非线性回归,等等。数据渗析技术的效果如何?这要看匹配的可靠性,而可靠性的判断更是依赖于行业和业务的感觉,毕竟究竟在健身行业中,什么样的变量最适合做匹配变量,跟旅游行业中的最合适的匹配变量肯定是不一样的。

博主的点评:数据渗析技术对于目前刚刚起步的广大中小企业的数据挖掘实践有非常重要的现实意义,可以用最短时间和最有效的投资明显提高企业待分析数据的信息含量。其中最关键的匹配变量的选择主要依靠行业和业务经验和感觉,比较微妙。

 

  评论这张
 
阅读(281)| 评论(0)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017