注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

数据挖掘 营销应用

说出你的业务困惑, 看数据挖掘能否帮你解惑

 
 
 

日志

 
 

数据挖掘实践应用(76,网络路径分析挖掘实战,上)  

2010-07-04 20:31:55|  分类: 数据挖掘的实践应 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
 

从事互联网行业的数据分析挖掘已经半年了,终于碰到了互联网行业真正独有的分析挖掘方向----网络路径分析挖掘,比较兴奋,比较新鲜。以往都是观摩学习别人的案例如何路径分析,这次不才要拿真实的数据来解决实战中的网络路径分析优化问题,呵呵。

老Y部门的Saas产品P正式上线运营已经三个多月了,我之前主要是帮该部门的运营团队分析核心用户行为特征,进行细分化的个性化的数据运营支持工作;现在产品的PD(product designer)同事们希望通过数据分析挖掘工作对产品用户的使用浏览路径进行分析挖掘,找出用户使用该产品的主要路线,分析各主要功能按钮及页面的使用流程顺序,最终的分析报告结论将直接支持产品的优化改版升级(比如说,如果用户的主流使用路径与PD所设想的路径有明显的差别的话,PD就要思考其中冷落的按钮或页面是否要取消或者优化;如果某些连贯的动作是PD事前没有想到的但又是被数据证明是很热闹的很繁忙的路径,那么PD们就要重新审视他们当初的设计思路和初衷,重新认识产品。所以说,网络路径分析挖掘是互联网行业的产品设计人员真正了解用户行为的一个重要工具,是进一步优化提升产品的关键依据,当然也是UED人员认识用户了解用户的重要而科学的分析工具,难怪本次网络路径分析得到了来自PD和UED两个领域同事的支持和需求。)

目前对于网络路径分析挖掘使用得最成熟的两种算法是Sequence Analysis和Link Analysis。前者是在著名的APRIORI的基础上增加了Sequence(顺序)的考虑,而APRIORI最为我们所熟悉的就是超级市场里的购物篮分析;link analysis 的理论基础来自与graph theory理论。针对我们正在进行的用户浏览路径分析,上述两种算法各有所长,相互配合,共同使用。前者主要告诉我们诸如A到B到C的路线的繁忙程度和“如果那么”的条件关系,而后者更可以可以告诉我们诸如不同页面不同按钮的不同重要性(centrality measures),具体两种算法有什么不同的结果和表现形式,我下期会结合具体数据来举例分享的。

就象任何其他的数据挖掘分析项目的流程那样,上周我的主要工作是拿到产品的密码登陆产品,熟悉产品,熟悉各个页面(URL)和各个按钮的Tracelog,中间多次与产品PD交流沟通,从而能较快熟悉产品布局和设计思想;在此基础上,针对挖掘任务,向数据仓库提出具体的数据提取需求和格式。第一次拿到样本数据时,马上发现有三分之一的用户在做反复的无效的点击,这个很诡异的现象必须马上要“讨个说法”(但是PD认为可能是数据仓库的数据存储处理中出现了问题,而数据仓库的同事认为数据本来就是如此,呵呵,类似扯皮拉筋的事是数据挖掘分析项目中常见的数据处理前期的琐事,需要数据挖掘专家出面招集相关部门协调,并拿出解决办法)。

下周按计划会有重新提取的数据准备好,有了数据后,还是先初步检查是否有异常现象,如果没有大的异常,可以按照上述两种算法分别尝试分析挖掘,在下期博客日志中,不才会具体介绍主要的挖掘经过和主要结论。

夏天真的来了,这两天全国大部都是高温(35度以上),昨天上班闲聊,突然发现周围的同事早都已经“空调凉席度苦夏”了,而我还是一如一个月以前那样,连席子都没铺,更遑论空调和风扇了。看来,我的身体素质还可以,关键是心静的原因吧。古往今来有道高僧大都是一身衲衣度寒暑,天寒是这身僧袍,天热还是这身僧袍,我以前半信半疑,今从我自身经历看,如果道行高的话,“一身衲衣度寒暑”应该是不虚的。人外有人,天外有天,什么时候我也可以“一身衲衣度寒暑”?

事在人为。这个“事”就是修炼,念佛是修炼,数据挖掘是修炼,做人也是修炼,练到心平气和,练到心如止水,那么“一身衲衣度寒暑”就是毛毛雨啦!!!
  评论这张
 
阅读(1683)| 评论(1)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017