注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

数据挖掘 营销应用

说出你的业务困惑, 看数据挖掘能否帮你解惑

 
 
 

日志

 
 

数据挖掘实践应用(70,“某某产品”活跃用户特征分析及其在多个领域的具体应用)  

2010-05-10 15:20:09|  分类: 数据挖掘的实践应 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

 

本日志是我最近完成的业务报告,现于博客中分享实践中的小成果,目的是唤醒数据挖掘应用的春天。部分商业隐私因为可以理解的原因给予屏蔽,抛砖引玉之作,希望不要本末倒置去猜想是哪个企业的实践。

分析挖掘的主要目的:

第一,   为某某团队的某某产品运营小组、服务小组和PD小组提供关于该产品的活跃用户典型特征的一揽子核心指标以及基于数据支持的活跃用户不同群体的未来变化趋势,并提出具体的服务和操作参考建议以协助运营和服务小组能针对不同活跃用户群体提供个性化的服务和运营,最终为该产品的销售业绩作出积极贡献。

第二,   为相关的UED团队所一直追求的“Personas模型”提供前半部分坚实的结论和模型基础。“Personas模型”是数据化运营在UED领域的生动体现,也是目前业界领先的UED工作向个性化数据化理性化的深入发展的比较高级的应用工具和方法。通过与某某团队的UED的相关设计人员多次沟通和交流(在此谢谢FZ, WS),在本次产品活跃用户典型特征分析的基础上,发现其中绝大部分结论不仅是“兼容”UED的Personas模型”,而且是该模型的基础和第一步,在随后的UED工作中,只需进行少量的典型用户调研和访谈,就可以完成全部的“Personas模型”工作,从而为今后的某某团队的UED的数据分析模型应用提供一次真实的尝试和一个数据化UED的新时代,呵呵。

第三,   本次分析是一个摸索和熟悉的过程,最终的目的是为即将到来的真正的活跃用户运营作出积极的练兵和探路,届时将结合更新更全面更完整更权威的数据作出更加准确更加符合某某团队需要的分析报告。

 

本次分析的主要具体应用示例:

第一,   根据这些活跃用户不同群体的典型特征指标,可以从数据仓库中提取成熟的活跃用户群体和容易流失动摇的活跃群体,避免不加区别的普遍骚扰,采取不同的措施“分而治之”,这是一种主流的数据化运营和服务的思路。

第二,   针对这些不同群体的典型特征,可以为我们的设计、开发、运营和管理提供有价值的核心线索和思考问题的突破口,方便门。

第三,   可以让我们更加生动更加直观更加“感同身受”地理解和把握我们的核心用户黄金用户、风险用户的行为特征,部分主要原因,这是一种数据意义上的“用户体验”、“客户体验”, 不仅是目前UED所热烈期待的,对于其他相关领域的同事也是有积极价值的。比如,为什么是“成熟的活跃用户?”,因为基于他们的产品使用情况, 基于基于他们的历史使用情况,等等;为什么是“容易流失的活跃用户?“,因为基于他们的产品使用情况,基于他们的历史使用情况,等等,下文具体展开分析。

 

本次分析的数据来源:

某某时间段某某产品的活跃用户的所有的详细的网站行为数据、基本背景数据、近半年的历史数据(包括主要产品的使用数据)等等。在此期间共有15万用户登陆了产品后台,其中活跃用户7万。针对这部分活跃用户,进行了比较详细的数据分析挖掘工作,得到如下主要结论:

 

本次分析的主要结论:(数据略作改变,以免伤害企业隐私)

第一,   本次分析发现了两大类用户群体(分别为核心活跃用户群体和易流失活跃用户群体),两类用户群体占本次分析所采用的活跃用户群体总数的85%(其中核心群体占45%,易流失群体占40%)。区别这两大类群体的主要的特征字段分别是IM的登陆天数、某某指数、最近半年的PV量、最近半年反馈的次数(具体来说,IM登陆天数大于某某数值天的基本上都是倾向于核心活跃用户,小于40天的基本上都是倾向于易流失用户;某某指数大于某某数值的基本上都是倾向于核心活跃用户,小于该数值的,基本上都是倾向于易流失用户;最近半年PV大于某数值的基本上都是倾向于核心活跃用户,小于该数值的基本上都是倾向于易流失用户;…………。上述四个核心指标的取值确定是将7个不同特征的活跃用户群体进一步综合(成核心活跃用户和易流失活跃用户群体等两大类群体)抽象得到的,具体准确的指标取值参见随后的各个具体群体的详细分析结论。

第二,   除了上述四个关键字段之外,本次分析还发现其他一些产品使用程度与本研究产品活跃用户之间的关系:活跃用户中65%都是曾经使用过A服务,有82%订阅了B产品,83%活跃用户来自广东、浙江两省。

第三,   具体描述活跃用户的7大群体:

核心活跃用户群体:本群体共有4个细分群体,分别为A,B,C,D群体,之所以将他们归结成“核心活跃用户群体”,是因为他们最近半年的行为数据显示他们的生意基础好(PV大,接受反馈次数多),工作勤奋(登陆次数多,在线时长),使用VAS产品多。具体分别介绍如下:

A群体:占全部活跃用户总数的16%,具体特征为:基本上都订阅了A产品,订阅了B产品,同时也是C 产品用户(曾经或现在),最近半年接受反馈的次数大于某某次,最近半年IM登陆天数大于某某天(该群体平均为150天),某某指数大于等于某某数值,最近半年PV量大于某数值,该群体80%的用户来自广东、浙江、江苏三省。

以下略去。

 

易流失活跃用户群体:本群体共有3个细分群体,分别为E,F,G群体,之所以将他们归结成“易流失活跃用户群体”,是因为他们最近半年的行为数据显示他们的生意基础差(PV相对小,接受反馈次数少),工作比较懒惰(登陆次数少,在线时间短),使用VAS产品很少。具体分别介绍如下:

E群体: 占全部活跃用户总数的20%,具体特征为:使用A产品的个数少于3个,90%非C产品用户,92%成员最近半年接受反馈次数小于某某数值次,最近半年IM登陆天数小于等于40天(平均24天),最近半年PV小于某某数值。以下略去。

 

 

本次分析结论对于UED的“Personas模型”的基础核心作用:

人物角色(Personas)模型作为一种应用技术据说是从1999年开始产生并推广的,这种方法主要针对产品主要用户群体的特征指标进行典型用户“画像”,对于指导产品设计,交互设计,视觉设计等等都是具有很好的数据化的科学理性的参考和评估。比如说,之前的很多产品设计,交互设计中,为什么要增加一个功能,为什么要这么设计交互,每个人都有自己的“感觉和理由”,但是谁也说服不了谁,因为谁都在宣称自己代表“用户”,但是实际上谁都不真正了解“用户”。现在如果有了一个合理的Personas模型的话,产品设计和UED团队的全体成员对于不同的用户群体就可以达成一致的认识,用户相关的数据就可以通过一系列故事被连贯起来,使得用户在设计阶段就比较生动丰满;更重要的是,在随后的产品设计和交互设计中,通过这些典型丰满的用户形象,大家可以因为“同理心”而更加有根有据展开合理的功能、视觉设计,而不会太过于天马行空,闭门造车。再简单点说,就是目前产品设计人员和UED人员(并不针对某某团队,这是目前国内UED行业里的比较普遍的现象)在脑海里并没有一个明确的鲜活的用户形象,也就没有更多的关于这个典型用户的其他使用场景的准确了解,通过Personas模型可以帮助他们准确把握目标用户群体的方方面面特点,在设计产品时可以时刻把设计思路和细节跟这个具体的鲜活的用户相关联,这样设计出来的产品当然就比较符合目标用户的真实需求的了,至少比目前完全凭空想象来的有理由有根据有数据支持。

常规的Personas模型的分析数据主要包括三方面信息(用户的目的和动机、用户产品需求,产品的使用场景)。其中目的和动机主要是通过调查、访谈得到;产品需求信息主要是产品相关的应用数据,比如一个在线互动产品的相关数据包括相关的在线时长,登陆次数,聊天次数等等;使用场景数据包括主要在哪个场合使用该产品,使用的方式,特点,等等)。但是,在我们希望探索的这个项目中,我们不希望进行规模化的调查、访谈等,主要的原因一是这个规模化的市场调查既费钱又耗时又很难得到有价值的信息,(当然我们也没有钱去折腾这些调研),更重要的是因为我们坚信凭借我们集团的强大的数据仓库,里面的海量产品使用信息应该可以支持我们相当的数据需求的,也免得在市场调查的“鸡肋”消费中浪费金钱和人力。

Personas模型的核心其实就是聚类分析应用,不过与常规的数据挖掘中的聚类分析不同的地方在于,一方面Personas的聚类不能有太多的分析变量,常常限于3-4个变量,这要求非常准确地从海量变量里发现关键的3-4个变量(具有明显的差异特征变量);另一方面,Personas模型在聚类的结果的基础上,还要辅之以比较详细的数量少而精的深度访谈和focus group座谈;最后,这个形象化的用户角色要通过文档化成为产品设计的规则之一,要求设计人员必须遵守,必须时时参考对照。

回到我们的这个分析结论,我们已经把“某某产品”的活跃用户群体作了两个归纳总结,分别为核心活跃用户和易流失活跃用户,并发现了该产品的这两个主要角色人物的核心特征,在此基础上,通过数量少而精的部分抽样客户(通常不超过10个)深度访谈和Focus group座谈,补充进必须的用户的产品使用动机、目的等等定性的内容,丰满人物形象,就可以成为UED的特定产品的Personas模型。

 本次分析最大的不足:所提取的数据的时间窗口限于某某时间段,所得的主要结论有微弱可能是不能代表产品稳定后的实际活跃用户特征,我们在下次的分析中,将提取更加全面的详细用户数据做进一步的分析修正,为即将开始的真正的活跃运营作出应有的贡献。

  评论这张
 
阅读(1319)| 评论(3)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017