注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

数据挖掘 营销应用

说出你的业务困惑, 看数据挖掘能否帮你解惑

 
 
 

日志

 
 

数据挖掘与百味人生(23,数据挖掘马未都的博客)  

2008-07-18 09:17:47|  分类: 数据挖掘的实践应 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

 

数据挖掘的基础是海量的数据,所以尽管我有自己的博客,但是目前点击量太少(我没有强迫各位浏览本博客的意思,完全是项目背景实话实说,呵呵),难以凑成起码的数据样本。而我现在技痒,没办法只好先拿马先生的博客将就用一下,看看数据挖掘能挖出什么宝贝,也借此与各位分享数据挖掘如何可以深度了解我们的博客和看官。先生是我佩服的洒脱人,想来不会见怪的。

先生自从2008年1月9日在新浪开博以来,基本上每天一篇(这种坚持的态度反映了做人的认真,在其他名人博客中十分少见,也反映了先生功力扎实,日常生活中的所见所闻可以随时化成一篇精美的随笔,这是题外话)。

先生博客目前点击已经达到1100万人次,遥遥领先百家讲坛的所有坛主,绝对值最大。

对于先生的具体博友浏览特征分析:

一,统计频率分析,马扎们初步可以聚合成4类(古董收藏爱好者30%、传统思想文化爱好者40%、先生个人魅力崇拜者25%、凑热闹的围观者5%,上述各类群体有些交叉,为分析起见,忽略这些相对微小的并集);

二,统计频率分析,马扎们所写评论可以聚合成3类(空喊口号型50%,比如向马老师学习、给马先生请安,等等)、(点卯报到型45%,比如来报道了、做沙发了好激动、今天好靠前哟,等等)、(师生互动型5%,这类群体可能比较受马先生喜欢,可惜数量不多);

三,聚类分析不同日志话题受欢迎程度,先生的日志每一篇浏览量差距非常大,从十几万到两千人次不等,通过简单的聚类分析,可以发现大致有下列3种话题有明显的流量区别(有关古董搜寻经历技巧的话题,这类话题浏览量最高,截止七月中旬可以达到二十多万人次每篇;有关生命本质思考的话题,这类话题浏览量居中,截止七月中旬一般5-8万人次每篇,日常生活所见所想的话题,浏览量最低,截止七月中旬一般一万人次左右每篇);

四,关联分析,马扎们如果逗留时间超过1小时,则写评论的可能性为20%,lift值为10;马扎们如果是把鼠标定在先生的照片上超过3分钟,则该马扎性别为女性的可能性为90%,lift值为1.8;马扎们如果写了评论,那么收藏该日志的可能性为30%,lift值为10;

五,决策树分析,如果马扎把鼠标定在先生照片上超过3分钟,整个博客逗留时间超过1小时,那么该马扎一定是女性并且有90%的可能会写下诸如“好佩服马老师哟”之类的评论;如果马扎博客逗留时间超过一小时并且只阅读有关生命本质的话题的日志,那么该马扎有60%的可能会从思想的角度写评论与先生互动,且通常洋洋洒洒一百字以上。

六,回归分析,如果马扎是凌晨3点上博客的,并且逗留时间超过40分钟,并且只看有关生命本质之类的日志,那么该马扎有100%的可能会写评论与先生从思想的角度互动。

七,神经网络分析,(神经网络分析得出的结论有时比较准确,但是缺点是无法用常理解释,呵呵)如果马扎每天都上博客,且只阅读有关古董收集经历技巧之类话题的日志,并且每次逗留时间在40分钟以上,则该马扎有95%的可能在多次(3次以上)藏品交易中上当受骗。呵呵,老是不长记性。

八,其他成熟的数据挖掘模型,比如马扎特征分析,马扎预测分析,马扎流失预警分析,马扎和其他博客的交叉模型,等等,限于篇幅所限,恕不一一展开。

数据挖掘技术可以帮助先生更好地为他的马扎提供个性化的服务,真正与马扎达成双赢,从而达成先生人生的圆满。上面的每一个发现都可以帮助先生改进、提高其博客的设置、题目的选择、内容的安排、与博友的沟通互动、也顺便可以更进一步提升浏览量。

这就是数据库营销的秘密,一般人我是不告诉滴!

 

备注:以上数据挖掘技术是真实的,思路是可行的,逻辑是严密的,结论是有意义的,但是唯一的遗憾是原始数据来源基本上是我肉眼一扫而过的,即数据的完整性和代表性存在极大的漏洞,各位权且把本文当成数据挖掘用于博客分析的一个示范吧。

谢谢先生!

  评论这张
 
阅读(517)| 评论(4)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017