2010-2-24 23:38:42 阅读1040 评论12 242010/02 Feb24
享年81岁的老父亲于2010年2月10日凌晨3时许安详地离开了这个世界,父亲走得很平静,很有尊严,他在2月9日中午主动去理了发,下午在家里洗了澡,晚上9点上床睡觉,凌晨3时许感觉心口疼,想喝水,待母亲起床倒水递上茶杯时,父亲已经歪倒在床头柜上不省人事,120急救赶来已经回天乏术。
整理父亲的遗物时,意外发现父亲在去世前25天独自写下的一份遗嘱:“吾已八十有余,死亡是很正常的事情。人走之后,丧事要从实际出发,节俭办理,切勿铺张浪费。人死烟灭,忘记死者,活着的人好好活着,这是我最大的遗愿。 卢光第(父亲的姓名),2010,01,15” 寥寥数语,父亲的遗言揭示了生命的真谛,那就是“看淡生死,活在当下”。
2009-3-23 8:55:23 阅读1747 评论23 232009/03 Mar23
本博主诚征适合开展数据挖掘应用的企业做深入的业务合作。你要想找个会拍脑袋拍胸脯的咱就别见了,大银行和移动通讯行业企业免谈(你们几位都已经有了固定的战略合作数据挖掘服务商,已入围城,请勿在此淌混水),没有足够经营数据的企业免谈(如果愿意让我们指导从头开始的除外),省得咱们相互失望;SAS那样的豪门郎君是不会跟你谈婚论嫁的,年营业额超过20亿以上的企业我也(暂时)接不住。没期待你的企业对有关现代营销管理的理念有多么先进,多么成熟,多么渴望数据挖掘的应用,只要能认识到目前常规的数据分析的局限,认识到目前营销工作的困境就行,要是多少有点“以客户为中心”的愿望,那就更靠谱了。心眼别太多,心态别太老,会坦诚交流目前企业经营、营销及客户管理中的难题和瓶颈,愿意让我们接触
2012-4-25 13:46:12 阅读105 评论2 252012/04 Apr25
背景:“行者”2012年4月24日在本博客留言:最近在做电信行业公众客户分群,识别高端精英用户。客户觉得高端用户不仅仅是话务方面高端,而且可能是社会属性方面也是高端的用户。问题1:这是个分类问题,属于高端和不属于高端。应该用分类算法来解决,但是,我不知道该如何选择正样本和负样本?问题2:可有其他思路和算法来解决问题,比如主成分,进行主成分得分由高到低进行排名,选择一个分数阀值,在该阀值以上就是高端用户?期待你的来信,谢谢
我的回复:行者你好,感觉你的问题主要是一开始就不清楚具体的业务需求。老生常谈的“铁律”:一定要具体、清晰、明确业务需求,但是你的这个问题一开始就不清晰。
2012-4-20 13:56:56 阅读102 评论1 202012/04 Apr20
背景:Idata_mining于2012年4月18日在本博客留言:“我是从事电信运营支撑系统(OSS)数据挖掘工作的,现在要针对服务保障系统中的业务进行数据挖掘工作,目前想从服务保障满意度危机预警和服务保障客户容忍度模型两个角度构建数据挖掘模型。服务保障客户容忍度的测量主要是通过客户的故障申告、催修、投诉等方面来测量不同客户的服务容忍度,从而指导运营商对客户提供服务优先、客户关怀等工作。 我的问题如下: 问题1:这两个模型都是分类问题。满意度预警的话目标变量很好定义,根据回访记录中的满意度定义就可以了,但容忍度模型中的目标变量该怎样定义呢? 问题2:对于容忍度模型,如果采用聚类模型的话是可以划分出不同的群体的,但该怎样测量出每位客户的容忍度的值是多少呢? 问题3:模型落地应用的
2012-3-5 19:36:41 阅读186 评论3 52012/03 Mar5
背景:网友happymining于2012年3月4日在本博客留言“如何避免模型的过度适应?过度适应的原因都有哪些?”
我的回复:happymining,你好,你的这个话题很好,我之前还没有系统梳理过,现在借你的话题,尽我所能做个肤浅的总结吧,不足之处请海涵,更期待各位的批评指正。
过度拟合(overfitting)是指数据模型在训练集里表现非常满意,但是一旦应用到真实业务实践时,效果大打折扣;换成学术化语言描述,就是模型对样本数据拟合非常好,但是对于样本数据外的应用数据,拟合效果非常差。在我们数据分析挖