注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

数据挖掘 营销应用

说出你的业务困惑, 看数据挖掘能否帮你解惑

 
 
 

日志

 
 

数据挖掘交流讨论(31,“消费行为性别”判断模型的应用,思路和算法)  

2011-10-16 16:31:58|  分类: 数据挖掘交流讨论 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
 

背景:xiaohei1986于2011年11月12日在本博客留言:“我也是做数据挖掘的,最近在做一个数据挖掘项目,有个问题一直困惑着我。 项目需求是给一家团购网站做消费者行为性别识别(不是真实性别),即通过消费者在网站的消费记录,建立数学模型来自动判断该消费者的行为性别,从而根据消费者的行为性别来推荐相应产品。我的问题是怎么样建立这样的数学模型识别消费者的行为性别呢? 期待解惑。 祝好~~ ”

我的回复:“消费行为性别behavioral sex”是个比较新的名词和比较新的商业应用,它主要是相对一般社会属性的性别psychological sex或者physiological sex而言的。之所以有这个差别,主要是因为在现实生活中(商业场景,犯罪场景,心理场景,等等),有一部分人表现出来的行为与其生理或心理性别有明显差异,或者有些人在商业性会员系统里填报的性别与其消费品的特点有差异。一个典型的应用场景:电子商务网站B2C的客户管理系统里,有相当一部分人群,其自己填报的性别与其在网站消费品有明显的值得运营团队关注的差异(比如有些男性,却主要购买女性用品),所以,对于电子商务网站的运营团队而言,他们更关心的是用户的消费行为性别。如果有群人填写的性别都是错误的,或者有群人的消费行为和消费倾向更加异性话,那么该电子商务网站的运营团队希望有一些技术,模型,解决方案能帮助他们准确判断所有用户的“消费行为性别”,因为在商业上,这个“消费行为性别”比生理属性的性别(physiological sex)更加有商业应用价值。

思路:从上面的应用场景介绍可以看出,这类课题的分析目标(target)就是“消费行为性别”的判断,是个二元变量,是男,还是女,是1,还是0, yes or no。 但是,在模型搭建的训练集(training set)中,如何定义这个变量呢? 目前常用的方法是:根据具体的分析需求,想办法使得训练集(training set)中的行为性别尽可能正确。举例来说,如果我们想甄别那些在填报性别时有意无意的错误性别,那么我们在模型搭建的训练集(training set)中,就要尽可能保证性别这个字段的数据的准确度和真实性;如果我们想判别在某B2C网站的用户的行为性别属性,那么我们在模型搭建的训练集(training set)中,首先就要明确定义什么是行为性别中的男,什么是女(这里的定义真是具体问题具体分析,我们可以定义购买特定女性商品且满足一定频率的用户是女性(这里主要是通过产品目录属性来判断),或者增加其他的属性考虑,还可以通过主成分降维等方法多考虑一些消费维度,总而言之都是要根据具体的项目需求来定的);有了这个明确的目标定义,我们才可以往下走,接下来就是算法技术总结了;

算法技术分享:既然目标变量是二元变量,我们首先想到的就是“逻辑回归分析技术”,没错,这也是目前国内外针对“消费行为性别behavioral sex”最常用的一种分析技术。另外,如果数据量比较小,无法满足逻辑回归模型的需要的话,还可以采用“判别分析”的方法。 上述的分析技术都比较成熟,不是此类分析课题的难点和重点吧,呵呵(其实,任何数据分析挖掘项目中,分析技术都不是项目成功的核心和关键因素,技术呀算法呀只能是工具,“术”的层面;而更加核心的对项目成败决定性的关键因素总还是思路和落地应用;而且相比思路而言,目前的企业现实是落地应用环节更加薄弱,因为这涉及到企业层面的数据化意识、应用水平和基础设施,涉及到多部门的协调融合,不是分析团队或者分析师单方面可以负责的。

     项目实践中可能的一些纠结点:首先, 如何定义本项目的“消费行为性别”,是按照不同团购商品品类分别定义?还是笼统对本团购网站“消费行为性别”?各有利弊,让业务方定夺吧。其次,哪些维度来定义本项目的“消费行为性别”,除了商品目录属性之外,还应该增加哪些其他的维度?再次, 项目目标是判定“消费行为性别”,但是落地应用效果评估常常是针对“是否产生实际消费行为”来进行评估的,两者并不完全是一回事,如何科学公正评估模型准确度也是值得认真思考权衡的。

    以上回复,只是我个人的一些肤浅认识和平时的积累学习,不足之处,请不吝指教,更希望你能分享你在这个项目实践中的反馈和感悟,大家一起进步,谢谢了!

  评论这张
 
阅读(2167)| 评论(6)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017