中央财经大学创新创业中心主任尚超:大数据技术在防范虚假发票中的应用

简介:

ZD至顶网CIO与应用频道 01月20日 北京消息: 2016年1月20日,数据猿作为独家全程直播与专访媒体,受邀参加“全球大数据峰会 Global Big Data Conference 简称为 GBDC”本届大会由世界O2O组织、全球大数据联盟GBDC、全球移动游戏联盟GMGC、光合资本主办,中国互联网协会O2O工作组、中国汽车流通协会支持。

GBDC全球大数据峰会在北京国家会议中心举办,本届大会规模逾3000人。大会从大数据改变政务管理方式、引领全球企业营销、智能交通综合服务、互联网整合营销运营、前沿科技等方面同现场嘉宾进行深入交流。通过行业大数据白皮书的分享和精彩的案例剖析,指导广大企业借助大数据发现广泛商业价值,切实有效地运用大数据的力量,帮助各行各业升级转型。 大会涉及大数据与智能政务、 汽车产业、 金融产业 、零售产业和房产行业等领域。 GBDC全球大数据峰会是迄今为止亚太地区举办的最具规模和影响力的行业盛会。

以下是“中央财经大学创新创业中心主任尚超”的发言实录:

尚超:在我讲之前想跟大家分享五个数字,昨天国家统计局发布了一些我们国民经济中很关键的数据。第一,我们的GDP,国内的生产总值达到67万亿。第二,我们社会消费品零售总额,今年突破了30万亿。第三,我们都知道,刚过去的一年,阿里巴巴这个公司取得了非常伟大的成就,它的2015年的总的天猫和淘宝销售额达到了两万亿,仅仅在双十一当天就达到了912亿。第四,关于我们的税收这块的数据,2015年我们全国总的税收的规模是达到了11万亿。第五,2015财政收入总额达到了15亿数字。我们应该关注这些方式,关注的一点就是发票。而我们每个人得到的发票很可能是有问题的,因为这个发票从诞生以来就面临很多关于造假的问题,如何防范发票造假呢,就是一个非常复杂的技术问题。今天大数据时代来临,我们能不能利用大数据防范虚假发票呢?答案肯定是的。

超市门口很多有人要你的购物小票?他们想干什么呢,我们的研究结论告诉大家,购物小票一定不能弄丢。为什么呢?我们看一些发票具体的实例,一组看起来非常真的发票,是由沃尔玛超市开出来的。正常情况下我们可能不会发现它有任何的问题。特别是我们把发票上的涂层刮开以后,在国家税务总局,北京市国税局网站上查的时候发现它是真的。而我现在告诉大家,它们统统是假的。如果这些发票是你在一些地铁站门口,或者超市门口买到的话,我可以很明确的告诉大家,它们99.99%都是假的。但是很诡异的是,它们在我们国家的官网上查询的时候,却现时的是真的。这发生的什么事情呢?这个图仔细分析会发现其中的端倪,本来我也不太清楚这个事情,但是经过一番调查发现了问题。可以很明显发现他们的日期与编号顺序前后颠倒。我想他们是不会买通国家税务总局,北京市国税局的官员帮他侵入这个系统的,这些人没有这么高超的技术。其实他们的技术很简单,那就是大数据技术。也就是说,骗子首先就拿到了大数据技术来忽悠大家。分析的结果就是他们在网上查的时候都是真的,但是实际上它肯定是假的。

在过去我们的发票造假这种现象是非常非常多的,有各种情况,有假票假开,假票真开,还有真票虚开,假票虚开。现在互联网+时代来临了,我看到了一种虚假发票+虚假业务+真实票号+互联网。传统的票验证方法分物理方法和网络查询的方法。当然这些手段已经远远不够了,当你买一些数据,你查询是真的,也付出了一些税款,但是这些都是假发票。这些钱被骗子得到之后也是不义之财。我特别想跟大家讲的是什么呢?就是我们的大数据时代,对于发票这么一件事情,它到底起到什么样的作用?其实过去我们在财政税收这些领域都有一些很重要的项目,像金财工程,金税工程,它们都属于信息化时代的产物。今天已经是DT时代了,我们可以看一下像Facebook这样的公司在做什么,它们在靠近北极圈的地方建立了一个庞大的数据中心,处理每天超过45亿次的点赞。当地有很多的冷资源,对它们冷却服务器非常有作用。

我们总体战略是在过去的金财工程和金税工程之上,引入互联网+,特别是引入大数据处理技术和云计算,使得我们每一天发生的数十亿笔的交易都能够纳入到智慧税务,智慧财政的监管之下,这是一个非常伟大的梦想。当然像阿里巴巴这样的公司已经开始做了。我们知道我们在区一些饭店吃饭的时候,可以用支付宝支付,这样可以得到5%的折扣,而我们营业税就是5%。所以阿里巴巴已经在做这样的事情。而我们财税监管部门为什么不这样做呢?

所以我们提出了几种对策:第一,注意重视大数据在发票管理中的应用。过去各个管理人员对这个问题认识的不够的,以至于我刚才所讲的发票实际上在我们的各种企事业单位,政府机关报帐过程中是很常见的,它们就躺在那里,实际上是一种虚假的存在。相应的人员如果有这个意识,我们的对这种发票防范的效果会非常的理想。

第二,以我们电子发票为代表的趋势,以我们二维码应用为代表的技术应用,它广泛的应用到我们的电商领域,还有我们其他的社会消费场景之中,将会极大的改变我们在税收监管,这种技术水平。举个例子,我们每一天中国人消费的笔数的量非常大,大概在50亿次左右。每一次理论上都应该涉及到税收的。如果我们要监管的话怎么监管呢?这很显然是一个非常复杂的问题。但是大数据,云计算的应用,它将会改变这一点。这其实也是跟在座的企业界朋友释放了一个巨大的信号,过去的二十年我们金财工程,金税工程采购总额已经超过1500亿人民币,而未来这个采购规模将突破5千亿人民币。也就是大量的服务器的需求,带宽的需求,各种工具软件的需求。

第三,我们非常需要向大家普及一个基础的知识,也就是说我们在任何地方的购物小票都不能乱丢,更不能买卖。如果买卖了会产生一个恶劣的问题。刚才的假发票为什么会出现这样的效果呢?比如你在沃尔玛花十块钱买两瓶水。他会给你开个发票,如果你不要,扔了的话,门口收小票的人,就会到沃尔玛前台开出来一个发票。他把这个发票的票号,密码记到一个数据库里,他也玩起了大数据,然后开始用打印机打印这些虚假发票。所以造成你在网上查的时候是真实的发票,而实际上它是一个赤裸裸的假发票。这个过程中他是做了一个放大的处理,就是原来里是十块钱的购买金额,当你买假发票的时候,你觉得是买的真的,你开900、1万,他都可以给你开,而他实际的交易额是10块钱。所以这块放大处理对社会危害很大的。

第四,我们企事业单位还有政府机关,财会这些人员在这块应该加强他的知识的学习。对发票管理,还有我们像一些公务卡消费,整个环节要关联到一块,只有这样的话,我们对付这种虚假发票才会有一个非常好的办法,毕竟这是一个超过15万亿的市场,里面哪怕是存在一丁点儿的虚假发票,都会对国民经济产生非常大的影响。还有我刚才说的对人员的培训都是很紧迫的问题。

最后,谢谢主办方邀请我来进行演讲,谢谢大家。

原文发布时间为:2016年1月20日
本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。
相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
目录
相关文章
|
5月前
|
存储 人工智能 大数据
云栖2025|阿里云开源大数据发布新一代“湖流一体”数智平台及全栈技术升级
阿里云在云栖大会发布“湖流一体”数智平台,推出DLF-3.0全模态湖仓、实时计算Flink版升级及EMR系列新品,融合实时化、多模态、智能化技术,打造AI时代高效开放的数据底座,赋能企业数字化转型。
1048 0
|
7月前
|
数据采集 人工智能 分布式计算
ODPS在AI时代的发展战略与技术演进分析报告
ODPS(现MaxCompute)历经十五年发展,从分布式计算平台演进为AI时代的数据基础设施,以超大规模处理、多模态融合与Data+AI协同为核心竞争力,支撑大模型训练与实时分析等前沿场景,助力企业实现数据驱动与智能化转型。
488 4
|
7月前
|
存储 数据采集 搜索推荐
Java 大视界 -- Java 大数据在智慧文旅旅游景区游客情感分析与服务改进中的应用实践(226)
本篇文章探讨了 Java 大数据在智慧文旅景区中的创新应用,重点分析了如何通过数据采集、情感分析与可视化等技术,挖掘游客情感需求,进而优化景区服务。文章结合实际案例,展示了 Java 在数据处理与智能推荐等方面的强大能力,为文旅行业的智慧化升级提供了可行路径。
Java 大视界 -- Java 大数据在智慧文旅旅游景区游客情感分析与服务改进中的应用实践(226)
|
7月前
|
存储 监控 数据可视化
Java 大视界 -- 基于 Java 的大数据可视化在企业生产运营监控与决策支持中的应用(228)
本文探讨了基于 Java 的大数据可视化技术在企业生产运营监控与决策支持中的关键应用。面对数据爆炸、信息孤岛和实时性不足等挑战,Java 通过高效数据采集、清洗与可视化引擎,助力企业构建实时监控与智能决策系统,显著提升运营效率与竞争力。
|
7月前
|
Java 大数据 数据处理
Java 大视界 -- 基于 Java 的大数据实时数据处理在工业互联网设备协同制造中的应用与挑战(222)
本文探讨了基于 Java 的大数据实时数据处理在工业互联网设备协同制造中的应用与挑战。文章分析了传统制造模式的局限性,介绍了工业互联网带来的机遇,并结合实际案例展示了 Java 在多源数据采集、实时处理及设备协同优化中的关键技术应用。同时,也深入讨论了数据安全、技术架构等挑战及应对策略。
|
7月前
|
数据采集 搜索推荐 Java
Java 大视界 -- Java 大数据在智能教育虚拟学习环境构建与用户体验优化中的应用(221)
本文探讨 Java 大数据在智能教育虚拟学习环境中的应用,涵盖多源数据采集、个性化推荐、实时互动优化等核心技术,结合实际案例分析其在提升学习体验与教学质量中的成效,并展望未来发展方向与技术挑战。
|
5月前
|
数据可视化 大数据 关系型数据库
基于python大数据技术的医疗数据分析与研究
在数字化时代,医疗数据呈爆炸式增长,涵盖患者信息、检查指标、生活方式等。大数据技术助力疾病预测、资源优化与智慧医疗发展,结合Python、MySQL与B/S架构,推动医疗系统高效实现。
|
7月前
|
SQL 分布式计算 大数据
我与ODPS的十年技术共生之路
ODPS十年相伴,从初识的分布式计算到共生进化,突破架构边界,推动数据价值深挖。其湖仓一体、隐私计算与Serverless能力,助力企业降本增效,赋能政务与商业场景,成为数字化转型的“数字神经系统”。
|
7月前
|
机器学习/深度学习 人工智能 自然语言处理
Java 大视界 -- Java 大数据机器学习模型在自然语言生成中的可控性研究与应用(229)
本文深入探讨Java大数据与机器学习在自然语言生成(NLG)中的可控性研究,分析当前生成模型面临的“失控”挑战,如数据噪声、标注偏差及黑盒模型信任问题,提出Java技术在数据清洗、异构框架融合与生态工具链中的关键作用。通过条件注入、强化学习与模型融合等策略,实现文本生成的精准控制,并结合网易新闻与蚂蚁集团的实战案例,展示Java在提升生成效率与合规性方面的卓越能力,为金融、法律等强监管领域提供技术参考。
|
7月前
|
存储 人工智能 算法
Java 大视界 -- Java 大数据在智能医疗影像数据压缩与传输优化中的技术应用(227)
本文探讨 Java 大数据在智能医疗影像压缩与传输中的关键技术应用,分析其如何解决医疗影像数据存储、传输与压缩三大难题,并结合实际案例展示技术落地效果。