大数据时代审计技术方法的发展趋势

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

步入新世纪以来,信息技术迅猛发展,与之相伴随的是给整个社会带来了一场生产生活方式以及思维模式的变革,从而使我们的工作生活环境发生了巨大的变化,大数据已经成为与石油相媲美的一项战略资源,可以说,大数据时代已经到来。国家审计机关作为与数据密切接触的部门,必将会迎来大数据时代所带来的机遇与挑战。面对大数据时代这一发展趋势,国家审计机关已经开展了“金审工程”一期、二期,并部署了三期工程。“金审工程”的稳步推进,必将有助于实现国家审计的“免疫系统”功能,充分发挥国家审计在国家治理体系中的基础性作用。

一、大数据的特征

在“云计算”、“物联网”等信息化时代的新名词冲击着我们大脑的同时,“大数据”也已悄然进入了我们的视野,并成为了我们工作生活中一个不容忽视的名词。但是,究竟什么是“大数据”?尚没有学者给出一个明确的定义,人们也无法尝试给出一个定义,因为随着大数据时代的发展,“大数据”的内涵和外延也在不断扩大。因而,我们只能从大数据的基本特征来进行一个把握。根据大数据的一系列研究成果,我们可以将大数据概括为以下四个特征:

第一,数据体量巨大。根据国际数据公司2011年发布的权威报告显示,信息数据正以每两年增长一倍的速度上升,以2011年为例,当年全球数据总量高达1.8万亿GB,而十年之后将增至35万亿GB。这样的大数据意味着什么?如果把这些数据全部记入书中,可以覆盖美国52次,存储在光盘里可以堆成5堆,每一堆都可以抵达月球。

第二,数据快速变化。大数据时代的各类信息变化迅速,特别是涉及到电子商务领域的信息。以网上交易为例,交易时间的短暂性导致交易信息会瞬间消失,如果相关信息需求者不能对交易信息进行及时采集分析,就会丧失数据的时效性,从而使数据丧失价值。因而在数据处理方面就有了著名的“一秒定律”,即要在秒级时间内给出分析结果,否则数据就会丧失其利用价值。

第三,数据类型多样。数据类型的多样化也让数据类型分为结构化数据与非结构化数据。传统的信息环境下,我们主要面对的是结构化数据,例如财务数据。但是在大数据背景下,我们面对的则更多的是非结构化数据,包括音频、视频、图片、地理位置信息等。这些数据随着信息技术的发展不断地更新演变,也对数据的处理能力提出了更高的要求。

第四,价值密度低。大数据仅仅有海量数据还是远远不够的,数据本身还要具有价值性,而且价值的高低与数据总量的大小往往成反比。价值密度低并不是说数据库本身是没有价值的,而是针对大数据本身,就拿视频为例,长时间的视频监控里,对于信息需求者来说可能仅仅也就有几秒钟的视频有用。因而如何通过强大的机器算法更迅速地完成数据的价值“提纯”成为目前大数据背景下亟待解决的难题。

二、大数据审计的必然性

(一)国家审计外部环境的变化。就拿基层审计机关为例,传统的审计组织管理模式主要实行以单一的审计小组进行“单兵作战”的方式开展审计工作,从而导致各个小组之间缺乏有效的沟通,数据也无法进行有效的利用与整合。但是大数据时代的到来改变了国家审计的外部环境,一方面数据规模逐渐扩大,另一方面被审计单位的数据化水平逐渐提高。因而一方面传统的审计组织模式无法实现数据资源的有效共享以及实时跟踪,另一方面审计组内部也缺乏信息技术运用的专门人才。因而审计资源无法得到充分整合发挥,增加了审计成本与风险。

(二)国家审计职能的拓宽。国家审计属于经济监督体系的一个重要环节,在整个国家治理结构中扮演一个重要角色,审计部门已经习惯于对被审计单位的财政收支以及财务收支进行审计监督。人类进入大数据时代以来,审计部门面对大数据带来的挑战越来越严峻,国家审计作为一个开放的系统,与其他子系统保持着密切的联系,能够接触到政府各部门、各行各业的数据。通过大数据技术的支持,审计部门的审计职能已经不仅仅停留于问题的揭示、监督以及披露阶段,而是通过对相关数据的整理分析,揭示数据背后隐藏的体制机制性问题。

(三)审计监督全覆盖的必然要求。2015年12月,中共中央办公厅、国务院办公厅印发的《关于实行审计全覆盖的实施意见》第七条“创新审计技术方法”,提出审计机关要构建大数据审计工作模式;要建立健全数据定期报送制度;要构建国家审计数据系统和数字化审计平台;要探索建立审计实时监督系统,实施联网审计等。这表明,国家层面对大数据时代背景下实行审计监督全覆盖已经做出了明确的要求,大数据技术是推动审计监督全覆盖的有力武器与必然要求。

三、大数据审计应当关注的几个问题

(一)大数据安全问题。大数据时代审计机关不得不面对信息安全方面的挑战。诚然,大数据是一项宝贵的审计资源,通过大数据审计可以分析被审计单位的潜在问题,进行风险预防,更好地发挥审计职能。但是审计机关获得的审计数据也随时面临着信息泄露的风险,以基层审计机关为例,大部分的基层审计机关还是习惯于运用外网办公,而外网则很容易受到黑客的入侵,如果不法分子将这些数据进行非法利用,后果不堪设想。

(二)数据共享问题。如今基本上所有的被审计单位都已经实现了会计电算化,但是因为各种各样的原因部门之间无法实现数据信息的共享,审计机关对被审计单位开展审计时,被审计单位也有可能对数据资料进行选择性提供,这就不利于审计工作的正常开展,更不利于审计职能的充分发挥。因而,从政府整体层面上应当打破这种利益藩篱,实行数据跨部门流动的管理机制,实现数据共享。

(三)大数据平台问题。数据的支撑是开展大数据审计的关键,因而审计系统应当从整体层面上将目前存在的简便易行的大数据分析工具进行整合,从而形成大数据分析平台供审计人员使用,使信息的粗放式发展向集约式发展转变。同时,应当试行将审计的大数据平台与财政、税务、金融等大数据平台进行对接,建立由政府主导、审计部门主推、相关部门参与的大数据共享平台,将一个个“信息孤岛”有机连接起来。

四、大数据时代审计技术方法的发展趋势

(一)单一事后审计向事中与事后审计相结合。传统的国家审计往往是在被审计单位经济业务完成以后才开展审计,而且主要依赖于被审计单位提供的财务会计资料来进行审计,因而往往是通过对财务数据的审查来发现问题,从而造成了“局部反映整体”这一突出问题,并且具有明显的滞后性。然而在大数据这一时代背景下,被审计单位的所有经济活动基本都以数据形式来进行反映,因而这就为审计部门开展事中与事后审计创造了便利条件,规避了抽样审计带来的审计风险,从多角度深层次的挖掘数据信息价值,实现审计的预防与监督职能。

(二)单一现场审计向现场与远程审计相结合。传统的国家审计面对的都是被审计单位的小量数据,因而审计部门往往以科室为单位向被审计单位派出审计组开展现场审计。但是面对大数据时代的海量数据,这无疑给审计组现场审计带来了压力与负担。因而大数据时代背景下的联网审计使得审计机关可以通过被审计单位的数据终端实现对被审计单位业务的实时监测,对潜在风险进行及时评估,进行常态化、信息化的跟踪审计,从时间上实现审计监督全覆盖,从而更好地实现审计事后监督向事前预警转变,实现国家经济资源的有效配置,减少经济资源的损耗浪费。

(三)单一静态审计向静态与动态审计相结合。传统的国家审计往往是对已经形成的会计数据资料进行静态审计,而静态审计不利于对被审计单位的动态数据进行分析,因而不利于揭示被审计单位的潜在风险,无法实现审计的风险预防职能。大数据审计技术给我们审计机关带来了技术与思想观念上的变革,部分地区已经构建了实时监控、动态监控的审计系统,开始向持续性审计、动态审计进行转变,提高审计的质量和效率。因而大数据时代的到来必将使我们传统的静态审计转变为风险导向型审计,通过动态审计更好的履行审计职能。(泗阳县审计局 周威)

本文转自d1net(转载)

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
2月前
|
存储 机器学习/深度学习 SQL
大数据处理与分析技术
大数据处理与分析技术
162 2
|
2月前
|
存储 分布式计算 NoSQL
【赵渝强老师】大数据技术的理论基础
本文介绍了大数据平台的核心思想,包括Google的三篇重要论文:Google文件系统(GFS)、MapReduce分布式计算模型和BigTable大表。这些论文奠定了大数据生态圈的技术基础,进而发展出了Hadoop、Spark和Flink等生态系统。文章详细解释了GFS的架构、MapReduce的计算过程以及BigTable的思想和HBase的实现。
120 0
|
21天前
|
分布式计算 大数据 数据处理
技术评测:MaxCompute MaxFrame——阿里云自研分布式计算框架的Python编程接口
随着大数据和人工智能技术的发展,数据处理的需求日益增长。阿里云推出的MaxCompute MaxFrame(简称“MaxFrame”)是一个专为Python开发者设计的分布式计算框架,它不仅支持Python编程接口,还能直接利用MaxCompute的云原生大数据计算资源和服务。本文将通过一系列最佳实践测评,探讨MaxFrame在分布式Pandas处理以及大语言模型数据处理场景中的表现,并分析其在实际工作中的应用潜力。
57 2
|
1月前
|
SQL 运维 大数据
轻量级的大数据处理技术
现代大数据应用架构中,数据中心作为核心,连接数据源与应用,承担着数据处理与服务的重要角色。然而,随着数据量的激增,数据中心面临运维复杂、体系封闭及应用间耦合性高等挑战。为缓解这些问题,一种轻量级的解决方案——esProc SPL应运而生。esProc SPL通过集成性、开放性、高性能、数据路由和敏捷性等特性,有效解决了现有架构的不足,实现了灵活高效的数据处理,特别适用于应用端的前置计算,降低了整体成本和复杂度。
|
2月前
|
机器学习/深度学习 存储 大数据
在大数据时代,高维数据处理成为难题,主成分分析(PCA)作为一种有效的数据降维技术,通过线性变换将数据投影到新的坐标系
在大数据时代,高维数据处理成为难题,主成分分析(PCA)作为一种有效的数据降维技术,通过线性变换将数据投影到新的坐标系,保留最大方差信息,实现数据压缩、去噪及可视化。本文详解PCA原理、步骤及其Python实现,探讨其在图像压缩、特征提取等领域的应用,并指出使用时的注意事项,旨在帮助读者掌握这一强大工具。
104 4
|
2月前
|
存储 机器学习/深度学习 大数据
量子计算与大数据:处理海量信息的新方法
量子计算作为革命性的计算范式,凭借量子比特和量子门的独特优势,展现出在大数据处理中的巨大潜力。本文探讨了量子计算的基本原理、在大数据处理中的应用及面临的挑战与前景,展望了其在金融、医疗和物流等领域的广泛应用。
|
2月前
|
机器学习/深度学习 存储 大数据
云计算与大数据技术的融合应用
云计算与大数据技术的融合应用
|
2月前
|
SQL 存储 大数据
单机顶集群的大数据技术来了
大数据时代,分布式数仓如MPP成为热门技术,但其高昂的成本让人望而却步。对于多数任务,数据量并未达到PB级,单体数据库即可胜任。然而,由于SQL语法的局限性和计算任务的复杂性,分布式解决方案显得更为必要。esProc SPL作为一种开源轻量级计算引擎,通过高效的算法和存储机制,实现了单机性能超越集群的效果,为低成本、高效能的数据处理提供了新选择。
|
2月前
|
SQL 存储 算法
比 SQL 快出数量级的大数据计算技术
SQL 是大数据计算中最常用的工具,但在实际应用中,SQL 经常跑得很慢,浪费大量硬件资源。例如,某银行的反洗钱计算在 11 节点的 Vertica 集群上跑了 1.5 小时,而用 SPL 重写后,单机只需 26 秒。类似地,电商漏斗运算和时空碰撞任务在使用 SPL 后,性能也大幅提升。这是因为 SQL 无法写出低复杂度的算法,而 SPL 提供了更强大的数据类型和基础运算,能够实现高效计算。
|
2月前
|
存储 大数据 定位技术
大数据 数据索引技术
【10月更文挑战第26天】
67 3
下一篇
开通oss服务