注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

数据挖掘 营销应用

说出你的业务困惑, 看数据挖掘能否帮你解惑

 
 
 

日志

 
 

数据挖掘与项目实践(45,美国企业分析解决生产中质量事故的经典案例)  

2009-07-31 09:03:44|  分类: 数据挖掘的实践应 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

 

本案例参考《Mastering Data Mining, The Art and Science of Customer Relationship Management》,原书作者Michael J. A. Berry, 译者 袁卫。本案例有两大亮点,一是一个非常完整的关于工业生产线上数据挖掘应用的全过程分享,二是建模所用的数据只有500条(这再次说明所谓的海量数据并不是所有成功数据挖掘的必要条件,哪怕是有限的数据,只要满足该业务目标的基本样本容量,就可以作出精彩的挖掘成果。)

博主的话:虽然数据挖掘最大的应用舞台是在市场营销上的全方位应用,但是市场决不是数据挖掘应用的唯一舞台和战场,数据挖掘另一个富有成效的应用领域是促进工业流程的改善和降低成本,尤其在自动化程度高、可以自动收集生产流程数据的企业。很多生产流程的效率取决于成千上万的相互作用的变量,而这些变量间的关系还没有被很好地理解,现在数据挖掘的应用可以比较好地解决这方面的问题。本日志案例整理的目的是为了让广大有缘的企业生产部门的朋友能通过本案例对于数据挖掘在生产过程的成功应用有一个直观的浅显的理解,最好能通过本文的启发后对自己生产管理中的一些问题提出潜在的数据挖掘的想法,我们大家一齐探讨,大家共同进步。

生产中的难题:唐纳利父子公司是世界500强企业之一,创办于1864年,是美国最大的印刷公司,其位于田纳西州的Gallatin工厂一直使用轮转凹版印刷机进行高速印刷“轮转凹版印刷”。该种印刷工艺长期以来有一个工艺难题“滚轮镶纹”,在已经刻好、准备印刷内容的铬合金板或铜板滚轮上出现一连串花纹,从而严重破坏印刷质量,造成很大浪费。

数据挖掘要解决的商业问题:通过分离出瑕疵产生的条件,避免印刷非正常中断情况的发生,因为这些非正常中断的成本非常高。

数据的准备:数据挖掘必须以数据为基础。项目小组首先搜集每次印刷中有关温度、湿度、油墨粘性、酸度、电压水平、修整叶片的压力、纸张种类和其他方面的数据,不管本次印刷是否成功。虽然印刷是高度机械化的,并且这些变量都是可以测量的,但是没有自动记录系统,所有测量都是手工记录在纸上,然后输入到计算机。所以项目首先要克服的困难就是说服那些印刷工人,让他们明白数据收集工作非常重要,从而协助搜集相关数据。本项目收集了500个印刷工作记录,相对于其他数据挖掘项目来说这个数目很小,但是实践证明这已经足够了。

变量的筛选:最终由印刷专家审定,在输入的变量列表中,确定哪些可能是重要变量,利用这些变量构建决策树模型,保留那些被证明具有预测能力的变量,然后利用这些经过验证后的变量输入变量集。这些重要变量包括ESA阳极距离、铬合金溶液浓度、静电辅助密度、电流槽、粘度、温度、纸张基本重量、纸张型号、溶剂型号、滚轮圆周、印刷速度,等等。

归纳滚筒条纹产生的规则:跟通常我们所说的数据挖掘项目的目的不同,本生产过程的挖掘项目所采用的决策树算法并不是作为预测模型来使用的,而是作为工具产生一组实用的正确的能够在生产中应用的规则。在这种情况下,最好的模型并不是那些能够准确预测印刷工作何时产生条纹瑕疵的模型,而是可以提供一些可实施的规则以防止未来发生条纹瑕疵的问题。“可实施”非常重要,比如如果无法控制工厂的湿度,那么只知道滚筒在潮湿环境下不易产生条纹瑕疵的问题是没有什么意义的。

挖掘的结果:利用数据挖掘软件,经过上述的一些步骤和相关专业人员的合作,唐纳利父子公司发现了一些可以直接指导生产的经验:比如,如果阳极距离减小,则出现条纹瑕疵的可能性加大;铬合金溶液浓度降低,则出现条纹瑕疵的可能性加大;湿度加大,则出现条纹瑕疵的可能性减小;油墨温度加大,出现条纹瑕疵的可能性加大;修整叶机械压力加大,出现条纹的可能性加大。另外,决策数模型还给出了一些组合的多变量综合规则。比如在一个叶节点上,只有一次操作出现条纹瑕疵事故,而有十八次成功的印刷过程,这种情况给印刷厂提供了一组避免条纹瑕疵事故的操作指导方针(保持铬合金溶液高比率,保持油墨低温度,并同时保持油墨高粘度,同时满足这三个条件,就可以明显降低条纹瑕疵的出现概率)。注意,这些规则并没有解释滚筒条纹产生的原因,但是坚持这些规则却可以为公司节省几百万美圆的成本,这就足够了,你说呢?

总结:虽然本项目并没有建立预测模型,而是建立指导性规则,但是事实上任何一组规则都是一个预测模型,都可以用来预测的。比如,根据规则可以得出一个清晰的预测:湿度低的环境下条纹瑕疵容易发生,而田纳西州一年里最干燥的时期是晚秋和早冬,所以完全可以相信,干燥季节来临是条纹瑕疵问题开始增加。在实际应用中,本项目效果非常好。1989年,那时还没有应用数据挖掘技术,该工厂共发生了538次条纹瑕疵事故,导致超过800小时的停产。而1995年实施该数据挖掘项目后,工厂仅仅发生了21次类似的条纹瑕疵事故,只造成30小时的停产。最后的推广中,唐纳利父子公司还发现,在一个印刷厂归纳出的指导规则,并不能简单地拿到另外一个工厂直接使用,不同工厂间许多因素都不一样,产生的一些指导规则也不相同。唐纳利父子公司认识到数据挖掘不是一劳永逸的事情,需要不断修正,不断完善,才能保持数据挖掘模型的先进性和生命力。

  评论这张
 
阅读(428)| 评论(0)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017