注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

数据挖掘 营销应用

说出你的业务困惑, 看数据挖掘能否帮你解惑

 
 
 

日志

 
 

数据挖掘交流讨论(15,关于电信行业通话量的预测的讨论)  

2009-08-20 09:04:32|  分类: 数据挖掘交流讨论 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

 

背景介绍:网友Ad来信,讨论“我现在想请教一个问题,对于电信行业,怎么去做通话量的预测,以月为周期,我想大体上有几种方法:1,时间序列,以时间为单因素去做,具体不知道如何下手?2,回归算法,该选取哪些维度和指标?打扰了,谢谢!”

我的第一次回复“你好,不知你所说的是指整体的通话量还是指每个用户的通话量的预测,我估计你指的是后一种(对每个用户的预测吧)。关于时间序列,你去买一本统计分析的教材,大多数教材都是有关于时间序列预测的介绍的,现在都是利用专业软件来操作,很方便,比如spss\sas等等都有的,按照教材一步步操作,不难。不过,时间序列这个技术,我总觉得不太准确,其实,任何所谓的预测都是不能全信的。至于回归算法的话(应该主要是多元线性回归或者广义线性模型),要看你现在的变量指标的具体情况,通常说,做线性回归时,有几个先决条件:(1)自变量与因变量是否呈直线关系;(2)因变量是否符合正态分布;(3)因变量数值之间是否独立;(4)方差是否齐性。

至于哪些变量可以考虑加入进来,一是看业务经验,二是不同指标的尝试,看看结果到底有什么区别。另外,不同的用户有不同的商业价值和消费习惯,好象不能用一个模型来预测所有的用户话务量的,最好的办法是先将用户进行分群处理,形成不同特征和价值的几个群体,然后对每个群体分别建模预测,这样才能有较好的效果。如果想用一个模型预测所有客人的通话量,这个模型一定是效果不好的。关于回归的具体操作,相关的统计和数据分析教材都比较详细的,可以参考。

Ad第二次来信“非常感谢您的指导,我现在也是准备选取回归算法来做,先分群,然后再分开建模,现在正在进行回归建模业务变量的选取(有点难度)。现在领导的要求是:

1,下个月整个运营商的通话量;2,呼入,呼出两种类型的通话量。

我想,预测出每个用户的通话量,汇总就为整个话务量,不知这种做法是否可行?然后还分别按呼叫类型去汇总两者的通话量。再次感谢您!”

我的第二次回复:“如果是整个运营商的总的月度通话量的预测,那我倒是觉得时间序列可能更合适些,最起码应该作个时间序列的预测来参考.原因是我们之前讨论的预测都是基于每个用户的,这些回归模型预测下来,针对用户群体的整体(相加的话),可能有很大误差,因为这些模型只是说预测10000个单独的用户的话,可能80%准确,另外20%(比方的话)有很大误差,如果再把所有用户的预测值再相加,误差可能更大(当然也可能误差正负相互抵消,这要看运气)。整体的预测,我觉得统计上的那些诸如马而可夫模型\灰色模型\时间序列模型可能更加合适些.这个方法也更加主流些。如果你一定要用个人的回归预测,在所有客人相加得到整体的预测的思路,建议你同时也作个整体的时间序列作个参考,这应该很方便的。仅供参考!”。

  评论这张
 
阅读(416)| 评论(2)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017