3986.net
小网站 大容量 大智慧
当前位置:首页 >> 行政公文 >>

基于大数据视角的税收数据管理问题探究

基于大数据视角的税收数据管理问题探究
摘要: 随着 2012 年美国政府 “大数据发展研究计划” 的启动, “大数据时代” 已经来临。尤其是随着云计算、物联网等技术的异军突起,大数据正成为当今社 会的战略性资源,也带来了应用层面的巨大挑战。在税收领域,我国已基本全面 建成 “金税三期” 工程, 运用了标准化、 大数据和风险管理理念进行规划和设计, 同时积累了海量的涉税数据。因此,本文选取大数据视角,分析了当前税收数据 管理中存在的主要问题, 并以苏州市税收情报平台为例,探讨了大数据在税收数 据管理中的应用实况, 最后针对如何在大数据时代完善税务数据管理提出相关建 议。 关键词:大数据;税收信息系统;数据挖掘;数据分析 一、大数据的相关概念 1、大数据的核心内容 徐子沛所著的《大数据:正在到来的数据革命》一书中对大数据做出如下定 义, “大数据是指那些大小已经超出了传统意义上的尺度,一般的软件工具难以 捕捉、存储、管理和分析的数据。 ”1 IBM 在其 2012 年度大数据战略发布会上提 出,大数据有四个显著特点,即“多样化(Variety) 、海量化(Volume) 、价值化 2 (Value)和快速化(Velocity)。 ” 其中,多样化是指大数据包含结构化、半结构 化和非结构化数据等, 以及数据间频繁广泛的交互;海量化体现在大数据中数据 的存储量、处理量巨大;价值化反映了大数据蕴含的巨大经济价值和社会价值; 快速化体现在数据较快的更新、增长、存储和传输速度上。通用意义上的大数据 不仅是指数据本身,也包括了信息技术,甚至代表了一种思维方式。综合而言, 大数据是数据、技术与思维的集合体。 2、大数据的理论依据 首先,大数据的核心理论是表现理论。当获取到与特定事物足够多的数据或 者全数据模式下, 大数据可以用来描述该事物,我们可以通过大数据反映出的特 征来认识该事物,这里体现的是数据的量变到质变可以为我们解决问题提供依 据。其次,大数据体现出混杂即能更全面的思想。随着信息记录形式的多样化、 信息间组合方式的非结构化, 能够获取的数据更杂、数据信息特征发生着重要变 化。最后,大数据体现了“关联物是预测的关键” 3这一思想。内在规律通过特 征反映出来,通过大数据可以更容易从纷繁复杂的表象中找出最相关的关联物, 不仅使反映的关系更加直接, 而且可以通过对数据进行交叉、组合分析等来发现 新问题、创造新价值。 3、大数据的价值创造 一方面,大数据能够推动实现巨大的经济效益。首先,大数据环境下资源更 开放。 尤其是在经济领域, 大数据的包容性使得数据共享更为方便, 政府、 银行、 企业之间的信息边界逐渐被弱化,信息孤岛现象得到有效缓解, 决策部门的决策 资源更加充沛,决策更加全面、合理。其次,大数据环境下信息处理更快捷。与 传统意义上的数据挖掘不同,大数据的处理速度快、时效性高。因为大数据时代
1 2

徐子沛.大数据:正在到来的数据革命[M].广西师范大学出版社, 2012 年 7 月. 金小鹿.驯服大数据的 4 个 V[J].中国计算机报,2012(38). 3 维克托· 迈尔-舍恩伯格,肯尼思· 库克耶.大数据时代:生活、工作与思维的大变革[M].浙江人民出版社, 2013 年 1 月.

下,物联网、云计算等技术迅猛发展,大大提高了数据的处理速度,因此提高了 决策的时效性。最后,大数据环境下决策更精准。由于决策资源更加丰富、数据 处理更加便捷,同时对数据进行挖掘、智能处理的手段更加多样化,决策的科学 性和精准性、预测预警能力、应急响应能力也会随之得以提高。另一方面,大数 据能够推动增强社会管理水平、 提高国家安全保障能力。 尤其是在政府和公共服 务领域, 大数据分析能够反映出公共服务需求的矛盾点和关键点,提高政府服务 效率和社会管理水平,社会价值突出。同样,在国防、反恐等领域,大数据分析 可以发现并有利于解决侦察系统等方面的相关问题,提高整体的安全保障能力。 总之,大数据提供了强有力的工具,更便于人们把握规律、预测未来。 二、当前税收数据管理中存在的问题 近年来, 随着金税工程的全面展开和建设,我国的税收信息化建设取得了很 大进展, 并且积累了海量涉税数据。但是当前大多数税收信息化应用平台主要以 业务操作为主要特征,数据管理、应用分析和综合利用功能发挥有限,对于管理 决策需求的满足度不高, 进一步影响到税收风险管理的全面深化。 当前税收数据 管理中亟需解决的问题主要表现在以下几个方面: 1、税收基础数据质量不高 涉税数据的一致性、精确性、完整性、时效性和逻辑性对于税源控制、税收 征收、 税务管理等具有关键意义。 但是, 大数据环境下涉税数据规模大、 增速快、 类型多, 爆炸式增长带来的影响之一就是劣质数据的存量大幅攀升,数据可用性 降低。一方面,由于基层涉税数据来源不畅导致的数据收集不全,例如数据采集 表的返回结构显示必填项信息获取率较高、选填项信息获取率较低等,大量信息 游离于信息化系统之外;另一方面是涉税数据不准确、税源状况不真实、资料可 信程度不高, 存在隐匿收入、 少报收入、 造假现象, 导致基础涉税数据质量不高。 2、信息化系统重建设、轻应用 当前,在大多数税收信息化系统建设中,存在“重建设、轻应用,重开发、 轻整合”4的现象,系统与网络功能未能完全发挥。截止到 2013 年底, “金税三 期”工程基本上已经在全国范围内建设完毕,尤其是运用了标准化、大数据和风 险管理理念进行规划和设计,系统功能较为全面。虽然经过多年的建设和完善, 并且我国税收信息化方面投入资金量较大,相应的硬件和软件配置日益现代化, 但是当前我国税收信息化的利用程度却相对较低。例如,很多基层税务部门的税 收信息化水平仍停留在初级阶段,对税收信息系统的应用也仅限于税务登记、纳 税申报、税款征收、发票管理等,未能实现适用于大数据环境下的税收征管信息 化模式。 3、信息整合能力和利用率较低 一方面,软件间相互独立引发信息化整合程度不高。内部数据大量堆积,对 内部数据的科学管理、整合应用水平较差;内部数据间逻辑关联分析不足,对于 内部数据的增值利用处于较浅层次;外部数据来源较为丰富, 但是外部数据未完 全实现一次采集、统一存储、关联分析和系统共享,并且对于内部数据与外部数 据间的关联分析和逻辑分析缺乏。另一方面,对数据的利用不充分。一是有些应 用软件只满足单一或者几项业务需要, 信息难以实现全系统范围内共享, 区域间、 行业间的动态对比、分析难以实现。二是进行深度数据分析和数据挖掘,需要掌 握数据提取、数据筛选、数据分类和数据处理等技术,需要专业人才提供技术支 持。 综合以上两方面原因, 当前的税收信息管理系统难以充分发挥对税收管理与
4

孙建国.透析国税信息化六大问题[J].每周电脑报,2007(13):22.

决策的支持作用。 4、系统安全隐患和人才匮乏 大数据环境下带来的税收管理关键问题之一是税收信息系统安全隐患的增 加。一是整体安全意识淡薄,部分税务人员对数据和网络安全重要性认识不足, 对于相关禁止规定执行不严。 二是严密的网络安全防患体系的缺失,病毒的传播 途径无法得到有效遏制。 三是大数据环境下数据间关联性大幅提升,一旦出现数 据损坏、混乱或其他灾难性故障,其影响也会以级数方式扩大。另外,人才匮乏 已经成为制约税收管理水平进一步提升的瓶颈。 一是目前很多税务人员信息化观 念仅仅停留在对信息技术的运用, 从信息技术角度对税收业务流程进行优化组合 管理的意识不强。 二是税务人员的信息化技术和数据分析水平有待提高,比较缺 乏税收政策和信息技术均精通的复合型人才。 三、大数据在税收数据管理中的应用实践 2012 年以来,江苏省国税局集中业务和技术骨干,正式开展以省局为主导、 覆盖各级各部门应用的税收数据情报综合管理平台一期的研究和开发。历经 9 个多月的集中工作,从数据整理、技术攻关、工具应用、平台开发和主题分析等 方面入手, 数据情报平台建设取得积极进展,并且目前已经在多个地市局试点运 行。苏州市为试点地区之一,经过一段时间的运行,基于现有的实践经验总结出 大数据在税收数据管理中发挥的作用有如下几个方面: 1、拓宽数据来源,提高数据质量 涉税数据是最关键的征管资源, 进行税源管理最关键的问题就是核心数据的 获取。通过新系统的实施和大数据技术的应用,在信息采集环节,苏州市国税局 目前可获得的涉税数据表现出规模大、类型多和增速快的特点。一是通过大数据 技术拓宽数据获取渠道, 强化涉税数据的动态采集,从整体工作流程出发扩大采 集广度。二是通过新系统规范标准的设立,排查清理错误数据,补充采集遗漏数 据, 一定程度上提高了数据准确率。 同时数据安全监控机制的建立有利于发现违 规操做, 通过系统的自动预警机制在源头上保障了高质量涉税数据的形成。三是 对内部数据间、内外部数据间的逻辑关系进行全面梳理,深化表内、表间的逻辑 审核,使涉税数据更加符合“经济-税源-税基-税收”的内在规律,进一步提升涉 税数据的质量。 2、深度数据挖掘与处理 面对海量数据,利用大数据技术实现涉税数据间的“逻辑关联、智能对比、 自动验证、实时预警”5可以事半功倍。大数据、数据挖掘、数据仓库三者密不 可分。新系统采用数据仓库的方式进行税源监控和管理,建设数据加工中心,实 现数据仓库应用的专业工具在平台中的集成应用。例如, 充分运用数据加工及转 换工具(ODI) ,实现快速、灵活、标准、准确、持续的数据处理;充分运用数据 分析及展示工具(BIEE) ,实现高效率、分层级、多组合、易操作的数据分析和 模型建立;充分运用元数据管理工具(MetaOne) ,展现平台内不同层次和处理 阶段数据的属性和加工过程, 实现数据变化和加工的动态管理和维护。 数据仓库、 数据挖掘技术在税收管理信息系统中的应用及推广,一定程度上解决了“信息孤 岛”问题,支持和服务于管理决策,利于提高税收征管水平。 3、多维度数据分析和应用 在利用数据仓库技术、 数据挖掘技术对涉税数据进行抽取、 加工和处理之后, 新系统可以为税务人员形成多个层次的数据,适用于不同的分析应用主题。通过
5

冯国滨,王晓英,鄢润波.迎接“大数据”挑战,打造税收征管升级版[N].中国税务报,2013 年 5 月 20 日.

数据加工中心为税务人员提供统计报表、数据质量管理、预警监控信息、一户式 展示等一批产品。同时,新系统扮演着数据分析中心的角色,针对不同应用分析 人员,提供不同的分析工具和分析路径,通过预加工、可视化、交互式处理,降 低数据分析应用门槛,满足税收收入分析、政策效应分析、征管状况分析、遵从 风险分析等各类需要, 同时为业务人员充分发挥职业判断,实现个性化分析提供 支持。此外,新系统可以实现信息多方交互的功能,打破层级、地域、部门、业 务信息系统间的数据应用壁垒,设置点对点共享方式,规范流程操作,统一全省 涉税数据加工、涉税数据交换的路径,形成以省局为中心,覆盖各市县的涉税数 据交换网络。 4、创新性风险管理 基于大数据的风险分析识别、多元策略的风险应对是风险管理的核心。新系 统引入先进的数据分析工具, “打造一体化、智能化的数据分析应用功能区,提 供网上风险分析识别工作室。 ”6与传统税收信息系统建设相较而言,新系统实施 过程中一个重要的创新点是,引入行业税收风险建模完善风险管理。 “行业税收 风险建模是通过对行业涉税信息筛选、整理、测算、分析,归纳描述行业风险发 生规律, 建立以若干行业风险特征和公认的参数区间构成的风险特征指标体系和 数学模型。 ”7即运用大数据技术和其他信息技术查找风险较高的纳税人,实施相 应的风险应对措施,不断提高税源管理的针对性和有效性。新系统实施后,风险 应对质量和效率均得到了显著提升,其中实地检查频率显著下降,风险应对方式 正在与“以案头审计为主、实地审计为辅”的国际通行做法接轨。 四、大数据时代税务数据管理需要关注的几个方面 根据前文对当前税收数据管理中存在的主要问题的分析, 以及大数据在苏州 市税收数据管理中的应用实况, 最后本文针对如何在大数据时代完善税务数据管 理提出如下几点建议: 1、树立大数据的思想理念,制定发展战略 大数据是数据、技术与思维的集合体,其中思想是源头。开展或完善税务数 据管理大数据建设,首先要树立大数据理念:一是要充分意识到数据无处不在; 二是数据具有价值,并且数据的经济价值和社会价值巨大;三是数据的价值需要 通过深入分析和挖掘来实现。 同时,税务数据管理的大数据建设需要制定相应的 发展战略,贯穿在整个建设和完善过程中。具体包括大数据的战略方针与目标、 大数据建设的具体实施步骤与安排、大数据建设所需资源以及具体方法,可以形 成清醒、直观的认识,同时有助于对比战略实施的实际成效和预定目标,确保税 务数据管理大数据战略的实施在轨道范围内。 2、构建大数据的管理体系,完善分析模型 如果要实现通过大数据技术全过程管理海量涉税数据的目标, 必须搭建大数 据管理平台、 构建大数据组织体系,基础架构的具体实现建议采用开源式分布系 统。在职能设置上采用“总数据管理师+数据管理中心”8的结构,即总数据管理 师负责统筹, 数据管理中心负责数据一体化管理 (包含数据的采集、 存储、 分析、 挖掘等) ,并向总数据管理师汇报。该组织模式不仅有利于集中优势资源,而且 有利于与业务部门进行沟通、协调,提高数据整合程度、深度挖掘水平。另外,
6

新浪博客.税收大数据管理新探索[Online].http://blog.sina.com.cn/s/blog_3f7449140101bmvc.html,2014 年 6 月 5 日. 7 江苏省国家税务局.关于印发 《江苏省国家税务局行业税收风险建模工作方案》 的通知[EB].苏国税函 〔2013〕 191 号,2013 年 7 月 23 日. 8 王宏伟.国税“大数据”研究[J].中国税务,2013(11):45-47.

税收大数据管理平台建设一定要注重分析模型的开发和完善。 数据分析工具应该 具有统一性、规范性、可扩展性,以模型库为核心,提供友好易学的界面,服务 于管理层和决策者。 3、统筹协调内外部涉税信息系统 大数据环境下进行涉税数据的管理,不仅要关注内部信息系统,同时也要建 立畅通的外部信息交换系统, 以方便与政府部门、其他企业和银行等的沟通和共 享。一方面,在税收信息系统内部,打破层级、部门间的数据壁垒,完善各级层 税务机关之间信息推送机制, 并在需要时能够及时获得系统内其他税务机关的信 息支持。另一方面,需要协调内外部涉税信息系统,完善历史数据的同时对集中 的数据进行分析和规整,以确保其准确性、完整性、连续性和一致性,提高涉税 信息的共享度以及共享涉税信息的质量水平。 4、加强安全防患与人才培养 大数据环境下, 伴随着数据量激增、数据形式多样化的同样有日益频发的数 据安全性问题,包括硬件损坏、介质损坏、病毒引起的数据损害等。因此要采取 多措施例如加强硬件储备、完善备份措施、建立病毒防治体系、强化网络安全等 来提高大数据的安全性。同样,人才培养也是重中之重:一是加大对领导干部的 辅导培训,普及知识,灌输理念,培养具备大数据思维的管理层;二是培养数学 和统计学知识丰富的业务专家, 能够熟练运用多种分析方法、建立数据模型进行 分析与预测。三是培养掌握大数据技术的信息化业务骨干,精通数据管理、挖掘 以及可视化等技术。四是加大现有工作人员的培训力度, 对信息人员开展税收业 务相关培训,对税务人员开设数据应用、分析相关培训,提高复合型人才比重。 总之,大数据时代中,税收数据管理尤其是税收信息化建设任重道远,在建 设和完善过程中要重点关注数据的挖掘、分析与利用。面临着大数据在应用层面 的巨大挑战,我们需要集思广益、群策群力,让大数据在经济建设和社会管理中 发挥更大的价值。 (宝应县国税局六分局 霍建民 戴伟)

参考文献: [1]徐子沛.大数据:正在到来的数据革命[M].广西师范大学出版社, 2012 年 7 月. [2]金小鹿.驯服大数据的 4 个 V[J].中国计算机报, 2012(38). [3]维克托?迈尔-舍恩伯格,肯尼思?库克耶.大数据时代:生活、 工作与思维的大变革[M].浙江人 民出版社, 2013 年 1 月. [4]孙建国.透析国税信息化六大问题[J].每周电脑报,2007(13):22. [5]冯国滨,王晓英,鄢润波.迎接“大数据”挑战,打造税收征管升级版[N].中国税务报,2013 年 5 月 20 日. [6]新浪博客.税收大数据管理新探索 [Online].http://blog.sina.com.cn/s/blog_3f7449140101bmvc.html,2014 年 6 月 5 日. [7]江苏省国家税务局.关于印发 《江苏省国家税务局行业税收风险建模工作方案》 的通知[EB]. 苏国税函〔2013〕191 号,2013 年 7 月 23 日. [8]王宏伟.国税“大数据”研究[J].中国税务,2013(11):45-47. [9]莫宝辉.大数据环境下税收信息的综合利用[J].经营管理者,2013(25):32. [10]李荣.大数据时代电子税务数据分析与应用研究[J].计算机光盘软件与应 用,2013(19):144-146.


网站首页 | 网站地图 | 学霸百科 | 新词新语
3986 3986.net
文档资料库内容来自网络,如有侵犯请联系客服。zhit325@qq.com