当前位置: 首页 > 政府信息公开 > 审计信息

浅谈大数据分析在审计中的应用与研究

  • 索引号:

    mxsjj00000/2023-000007
  • 发布日期:

    2023年02月11日 21:00
  • 来源:

    县审计局
  • 发文机构:

    县审计局
  • 内容概述:

大数据审计是现代信息技术新常态下的一种技术方法,审计人员利用这一方法,能够迅速、准确地从海量数据中找到疑点信息线索,经过对症下药,提高审计工作的效率和质量。随着大数据技术的不断升级,大数据技术在审计工作中的应用也不断深入,它使得审计工作变得更为高效,审计成果更为丰硕,审计面更加广泛,同时对审计人员的信息化技术水平也提出了更高的要求,如何更好的将大数据分析技术应用到审计工作中,是每一位审计人员需要思考和解决的问题。

一、大数据审计技术简介

大数据审计是指以审计单位数据库原始数据为切入点,构建以数据为主导的审计工作模式。它通过对底层数据的采集、转换、整理、分析和验证,形成审计中间表,并且运用查询分析、多维分析、数据挖掘等多种技术方法构建模型进行数据分析,发现趋势、异常和错误,把握总体、突出重点、精确延伸,从而收集审计证据,实现审计目标。

(一)大数据审计的特点

大数据审计的特点包括:一是对电子数据的直接利用。在以数据为主导的审计方式下,审计人员面对的不再是纸质环境下的会计账簿,也不是电算化环境下的电子账套,而是将被审计单位的计算机信息系统及其处理的电子数据作为直接的审计对象;二是扩大了审计范围和审计内容。数据审计丰富了审计人员的可用信息,只要与审计有关,审计人员都可以将其作为数据采集的对象;三是审计方法的转变。摒弃手工翻阅资料,直接利用其各类型基础数据进行各种数据处理,形成满足审计目标的多种多样的信息;四是采用新型的审计模式。数据审计模式其具体流程主要分为如下几个步骤:审前调查、获取信息、采集数据、整理数据、进行数据转换、数据清理和验证、创建审计中间表、进行数据分析,找出审计重点、延伸落实、审计取证。

(二)大数据审计的过程

根据大数据审计工作模式的特点,可以将审计过程直接划分为审计准备、审前调查、审计实施和审计报告四个阶段。前两个阶段之间划分的界限取决于是否需要进行数据分析。需要的话就必须在审计准备阶段向被审计单位出具通知书,继而才能获得系统数据。审前调查时海量数据的采集、转化和清理分析工作就必须抽调单位审计骨干进行,从而为审计实施方案的制定和深入数据的剖析奠定根基,其余审计阶段与传统审计趋同。

(三)大数据审计的要求

1.审计业务部门在组内分工上,要体现“数据”特点。对于审计组成员,可以设置“审计资料搜集”,“数据采集转换”,“数据分析”,“内部复核”等岗位。这种设置方式可以很好的处理工作流程,避免出现互相推诿、各自为政等现象。可以推进大数据审计工作的深度和广度,实现不同信息源数据的集中管理。

2.大数据审计的数据分析工作可以与审计项目的实施适度分离,即将以前针对单个审计项目的数据分析工作,改为一项常态的日常数据分析。审计数据的价值就体现在对海量数据的分析应用上,能够通过不同行业的分析得出审计结果,为政府决策支持系统提供依据。

二、大数据技术对审计工作的影响

(一)对审计内容的影响。传统审计,针对的审计内容往往是一些数字、金额、收入、费用等,而大数据环境下,审计的内容不再仅仅是普通的二维结构化数据,更多的是立体多维、非结构化、复杂、多样的数据,包括:文本、音频、视频、图片以及浏览各种网站使用各种 APP所产生的历史数据等等。因此,审计人员在运用大数据技术开展审计过程中,要做好筛选、清洗工作,选择对审计目标有用的、关联性较强的数据进行分析,从而获取审计成果。

(二)对审计方式的影响。传统审计,审计人员人手一台计算机,面对被审单位的财务数据、人事数据、缴税记录、社保数据等等,应用 SQL server 数据库软件、AO 现场审计实施系统、office办公软件等就能够开展审计,达到审计目标。而大数据环境下,面对海量数据,单台计算机不仅无法完成存储,更无法进行分析处理,审计大数据的采集、存储、预处理、建模和分析均需在大数据分析平台进行,平台的性能直接影响大数据审计分析的效率和效果。基于结构化数据、关系型数据库的传统分析平台,难以满足具有多源异构特征的审计数据大规模存储和高强度计算的需要。因此,需要建设审计大数据分析的云架构数据分析平台,实现计算运行平台的云架构化。

(三)对审计效果的影响。传统审计一般都是以问题为导向,在已发生的被审计单位相关数据中查找问题,提出审计建议,再促进整改。而在大数据环境下,掌握了多领域、大规模海量数据,就可以建立动态监控模型,对政府债务、社保资金、土地出让金等一系列资金政策情况做出预判和预警,并提出指导意见,审计效果从事后的整改变成了事前的预防,起到防范风险的作用。

三、大数据审计的技术与方法

大数据审计是对多行业、多领域、多种形式海量数据的电子审计方式。既要处理结构化数据,又要处理大量的非结构化数据,与传统审计方式不同,大数据审计对各项内容都提出了新的、更高的要求。大数据审计技术与方法包括五个方面:一是可视化分析,利用图表完整展示数据分析的过程和数据链走向;二是数据挖掘算法,从海量的、随机的、不相关的数据中构建数据挖掘模型,提取有价值的、隐含在数据内部的信息;三是预测性分析能力,根据可视化分析和数据挖掘的结果,做出预测性的判断;四是语义引擎,借助一系列的工具去提取、解析和分析数据,从数据中自动提取信息;五是数据质量和数据管理,通过标准化的流程和工具对数据进行处理,保证数据分析结果的质量。最常用的审计中间表是将转换、清理、验证后的源数据按照提高审计分析效率、实现审计目的的要求进一步选择、整合而形成的数据集合,是审计人员进行数据分析的对象、资源和平台。创建审计中间表是构建审计分析模型的前提和基础,是实现数据式审计的关键技术之一。按照使用目的不同,又可分为基础性审计中间表和分析性审计中间表。前者可以帮助审计人员选定审计所需的基础性数据,后者可以帮助审计人员实现对数据的模型分析。

四、大数据技术在审计中的应用

(一)创建数据分析模型,探索审计监督全覆盖。所谓审计全覆盖就是指在审计机关职责权限范围内,所有公共资金、国有资产、国有资源管理都在审计监督下,不留监督盲区和死角,做到对审计对象的全覆盖。传统的审计项目计划的制定和管理,由于没有充分的数据和完善的信息作为基础,往往存在审计目标不清、范围不准的问题,要想顺利推进审计全覆盖,就需要通过大数据分析技术,通过采集财政预算专户信息、经济责任审计对象信息、全县机构设置信息、县委县政府交办信息、以及近 10-20年的审计情况信息等,基于SQL Server 建立了涵盖公共资金、国有资产、国有资源等管理主体一、二级预算单位以及经济责任审计人的全部审计对象,包括审计对象属性、类别、审计状况的审计对象数据库,在此基础上制定近五年项目计划,并列入审计对象。同时还可以构建若干分析、统计、查询视图工具,建立审计对象数据分析模型,一定程度上为低端用户提供快捷工具、为高端用户提供了数据分析平台,并且根据动态变化情况,每年进行审计对象库数据更新、修正,补充录入上年度审计重要信息,跟进审计对象数据补充和完善。

(二)多领域数据关联,开展政策跟踪审计。通过收集各相关单位的数据,搭建数据关联分析平台,对数据进行清洗、查找、关联、分析,从而获取对政策跟踪审计有用的数据信息。例如,在乡村振兴相关资金和政策跟踪审计中,通过采集涉及财政局、农工办、农委、住建局、民政局、残联、扶贫办、教育局、农机局、人社局等 10 个部门的一卡通发放明细、财政供养人员工资发放明细表、“两委”村干部基本信息表、土地确权到户明细、农村危房改造发放明细数据、低保发放明细、五保供养发放明细、乡镇敬老院名单、残疾人名册、建档立卡户数据、符合医疗救助人员明细表、医疗救助资金使用数据、火化名单、学籍信息、教育扶贫发放明细、大病补充保险名单、大病补充保险明细、秸秆还田资金补助、社保参保人员信息、住院结算信息、拖拉机和联合收割机台账等 21 张表,重点关联耕地地力保护类、农机具购置类、农村社会保障和救助救济类、农村危房改造或新居建设类、扶贫脱贫类到户惠农补贴资金,在掌握到户补贴资金总体情况、评估补贴发放控制制度的基础上,开展“一卡通”到户惠农补贴发放情况审计。关注人社部门是否建立管理台账,动态掌握低收入人口参保情况;关注低收入人口基本医疗保险是否应保尽保;关注是否落实低收入人口基本医保个人缴费财政补贴政策;关注低收入人口医疗救助报销是否纳入“一站式”即时结算平台,医疗救助报销比例是否符合规定;关注是否按规定落实低收入人口大病专项救治政策。关注低收入人口基本养老保险是否应保尽保;养老保险是否开放最低缴费档次,是否落实基本养老保险个人缴费财政补贴政策。关注是否建立健全农村义务教育阶段辍学综合防控机制,是否存在建档立卡家庭适龄学生因贫失学辍学情况;关注学前教育家庭经济困难儿童政府资助政策是否落实;关注建档立卡家庭经济困难学生是否落实义务教育阶段生活费补助、中等职业教育免学费、普通高中阶段免学杂费、普通高校本专科阶段免学费等政策;关注虚构学籍骗取助学补助等情况。

(三)深入挖掘分析,开展医保基金审计。例如,对某市医保基金使用情况的审计中,通过采集工商登记部门管理的企业注册登记数据、养老等社保缴费数据、地税局个人所得税代扣代缴数据、住房公积金缴费数据、个人医保缴费明细数据等数据,深入挖掘分析,审查农民工、关闭破产国有企业退休人员等人群是否按规定参加职工医保;低保户、特困供养人员是否参加基本医疗保险和获得个人缴费资助;建档立卡贫困人员有无基本医疗保险等情况 。通过对该市某三甲医院医保卡刷卡缴费记录的数据进行挖掘分析,审查是否存在同一个或多个持卡者,定期大量刷卡购买药物的情况,并通过延伸分析是否存在利用医保卡套取贩卖药品的情况。通过分析医院 HIS 系统中的住院、门诊病人收费明细数据,并对比物价部门诊疗项目收费标准,审查是否存在违反规定自立收费医疗服务项目、提高项目标准收费、将不允许单独收费的项目或材料单独收费、多个项目同时执行未以优惠价格计价等问题。

五、审计人员如何更好的适应大数据环境下的审计

(一)转变思想,主动适应大数据环境下的审计工作。在基层审计机关,绝大部分审计人员都是会计学、审计学出身,对计算机专业知识只能做到简单的了解,思想往往都只停留在传统的财务数据审计上,这将很难应对大数据时代对审计工作带来的挑战。审计人员必须要抓紧时间,抓住机遇,积极应对挑战,主动转变思想,逐步适应大数据环境下的审计工作,真正做到向信息化要资源,向大数据要效率。

(二)加强学习,夯实理论基础。大数据分析技术涉及的专业非常广泛,如数据库技术、编程语言、统计学、计算机网络与信息安全、ERP 基础等等。这就要求审计人员不断提升专业技能,除了积极参加审计系统组织的培训外,还要利用业余时间加强自主学习,夯实理论基础,这样才能够跟上技术更新的步伐。

(三)勤于思考,将大数据思维运用到审计全过程。随着被审计单位信息化技术应用越来越广泛,数据量也将呈现爆炸式增长,这势必会给审计工作带来更多的困难,要想很好地应对这一新形势,一是需要在成立审计组时,合理配置人力资源,根据审计目标的需求,将计算机、财务、审计专业技术人员安排在同一审计组,通过协调配合,更好的开展大数据分析和财务数据分析;二是审计人员在审计过程中要将大数据思维贯穿审计全过程,在复杂数据中发现问题线索,并充分利用大数据分析结果,从而提高审计工作的效率。