注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

数据挖掘 营销应用

说出你的业务困惑, 看数据挖掘能否帮你解惑

 
 
 

日志

 
 

数据挖掘与百味人生(30,地震预报模型)  

2008-07-29 09:20:36|  分类: 数据挖掘的实践应 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

 

前几天由5.12汶川地震谈到了数据挖掘本身的防灾减灾,讲到几个对数据挖掘行业潜在的灾难以及我的一些应急的想法。从数据挖掘的原理和实际应用实践来说,我突然觉得其实地震,尤其是破坏力大的地震,应该可以通过数据挖掘来分析研究并投入实际的预报的,至少在理论上是非常成熟的。

如果我们把历史上有详细记录的地震所有指标都整理出来,把地震的发生级别作为目标变量(属性为interval),把其他所有能收集到的情况,指标作为输入变量,比如地理位置、地质带特征,事发前系列时间段震中地区的相关地质物理指标比如地磁变化、应力场变化、气体总量观测、温度变化、气压、风力等等、时间值,另外加上民间的智慧发现(比较有趣),比如各种动物的异常表现(属性为ordinal,比如阿猫的不同反应,1代表暴躁,2代表激动,3代表疯狂,4代表绝望,5代表歇斯底里,6代表阿扁似的无耻;比如阿狗的不同反应,1代表狂吠,2代表跳墙,3代表疯狂,4代表绝望,5代表歇斯底里,等等列出几种主要敏感动物的反应指标,这需要动物专家和地震专家共同参与讨论确定,呵呵,数据挖掘本来就是交叉学科),能想到的变量越多越好,最好不要漏掉重要的变量。然后,通过数据清理,观察,去掉无关的变量,最后通过不同的算法,找到最佳的大地震预报模型,准确率80%以上,从而为我们人类的防灾减灾作出数据挖掘工匠的贡献!!!

让我纳闷的是,数据挖掘技术对于中科院和国家地震局来说不会陌生吧,他们究竟有没有试过呢?从数据挖掘的技术和原理来说,这种因果关系是非常容易找到规律的呀,尤其是关于震前异常特征的发现和关联分析是数据挖掘的强项。我去相关机构官方网站看了一下,研究课题和方向还的确有相关的一些东西,只是没用“数据挖掘”这个名词,他们叫“研究”,从那些重点攻关项目的名称看有相当数量是可以用数据挖掘技术解决的。他们目前做到哪一步了,外人不得而知,应该没有大的突破吧,不然也不会有5.12猝不及防的血腥和掺状。

我不是地震专家,但是从数据挖掘技术的角度我觉得目前地震研究的数据挖掘停滞不前的唯一的原因可能是没有现成的详细的历史数据可供分析挖掘,这是数据挖掘的最基础的东西,巧妇难为无米之炊呀。但是也应该有人开始着手收集整理数据了,这是个长期的工作,默默无闻的工作,需要几代人几十年上百年地跟踪记录全世界详细的地震数据。这个单调乏味的收集工作可能会跟有关主管部门的“短期突击政绩工程”、“短期出成果”的浮躁思路明显相左,作不作就只能看他们的良心了。我想所有的中国人都会希望这些权威研究机构多做这些脚踏实地的工作。

从原理来讲,数据挖掘非常适合做有关地震的分析研究的,就算得出的预报模型效果不好,挖掘中一定可以发现很多相关的有价值的信息的,这将直接贡献于最终的准确地震预报。

这就是数据挖掘的实战,比某些专家纸上谈兵的东西来得有价值得多,也刺激得多。

欢迎大家踊跃讨论,帮帮国家地震局想想如何可以数据挖掘地震模型。谢谢啦!

 

  评论这张
 
阅读(386)| 评论(1)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017