注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

数据挖掘 营销应用

说出你的业务困惑, 看数据挖掘能否帮你解惑

 
 
 

日志

 
 

数据挖掘实践应用(47,分析挖掘偷税漏税行为)  

2009-08-18 09:03:19|  分类: 数据挖掘的实践应 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

 

背景介绍:除了在金融和电信行业外,目前在中国应用数据挖掘的行业相对来说比较深入普及的要算是在各级税务机关的应用了,很多服务商和税务机关用户都在不同的渠道宣传数据挖掘在中国税务机关的应用,但是具体的思路和细节少有透露。偶尔从CFA论坛上发现一个相比而言深入一点的帖子,现整理出来与有缘之朋友分享。原贴作者大名不得而知,向无名英雄致敬。

逃税是每个国家税务部门都必须正视和面对的问题,该帖子介绍了通过数据挖掘技术如何实现纳税评估和稽查选案,从而降低稽查成本,提高稽查效果。

在利用数据挖掘解决纳税评估时,通常会考虑以下主要问题:1,现有纳税个体中,如何定义非正常纳税人;2,非正常纳税人在税收征管过程中出现的几类问题;3,哪些因素可用于评判纳税人的纳税信誉等级;4,预测纳税人将来的纳税行为和纳税数量。上述问题都可以通过数据挖掘工具,设计合理的数据挖掘过程来实现。先纳税评估,后稽查选案,这是两个有先有后,逐步渐进的过程。纳税评估就是利用聚类技术对不同种类的纳税个体作等级评估,即纳税评估(包括归纳出纳税评估的具体等级标准);在此基础上,通过数据挖掘算法对纳税个体做深度挖掘,即稽查选案。就稽查选案来讲,更多关注的问题主要是:1,哪些个体更有可能产生偷税漏税情况,偷税漏税个体的主要特征是什么;2,税收征管体制中哪些环节会造成偷漏税现象;3,依据纳税评估的等级标准,不同级别的纳税个体产生偷漏税情况的概率;4,各个税种在收缴过程中,在金额上是否具有明显的关联性。

稽查选案是税务工作中永恒的话题,但是在不同时期,它有不同的特点。比如说,选案个体的属性特征可能会随着产业结构的调整而变化;选案个体偷漏税行为可能随着征管体制的变化而出现非自愿性漏税行为;等等。举例具体来说,如果想总结当前经济形势下偷税漏税个体的属性特征,并对比那些具有同类特征的纳税个体的偷税漏税概率(定义挖掘任务,博主注),通常的做法是:1,将历史数据分成两部分,利用其中一部分数据对以往的偷税行为的个体做汇总描述;2,对不同的非法纳税做聚类分析,找出群体中具有相同特征的个体做归类整理,形成标准的规则集;3,利用这部分数据建立分类和预测模型,利用另一部分数据去修正模型并发现有价值的稽查选案的一些规则;上述三步就可以逐步建立稽查选案中选案个体的选择依据。

挖掘结果的三种不同表现形式:在模型发布阶段,根据业务部门的不同需求发布结果,具体来说有以下三类:1,发布研究报告,将数据挖掘的整个思路、方法以及最后的结果、图表、规则总结等全部整理出来形成报告;2,将数据挖掘模型通过编程,变成一些应用程序,只要业务人员将具体的信息输入,运行该程序,就可以得到相应结果;3,将最后的结果通过网络发布,供业务人员从网络应用。

附原文的链接:

http://bbs.cfaspace.com/dispbbs.asp?boardid=88&id=13103

 

  评论这张
 
阅读(478)| 评论(1)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017