中央财经大学创新创业中心主任尚超:大数据技术在防范虚假发票中的应用

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

ZD至顶网CIO与应用频道 01月20日 北京消息: 2016年1月20日,数据猿作为独家全程直播与专访媒体,受邀参加“全球大数据峰会 Global Big Data Conference 简称为 GBDC”本届大会由世界O2O组织、全球大数据联盟GBDC、全球移动游戏联盟GMGC、光合资本主办,中国互联网协会O2O工作组、中国汽车流通协会支持。

GBDC全球大数据峰会在北京国家会议中心举办,本届大会规模逾3000人。大会从大数据改变政务管理方式、引领全球企业营销、智能交通综合服务、互联网整合营销运营、前沿科技等方面同现场嘉宾进行深入交流。通过行业大数据白皮书的分享和精彩的案例剖析,指导广大企业借助大数据发现广泛商业价值,切实有效地运用大数据的力量,帮助各行各业升级转型。 大会涉及大数据与智能政务、 汽车产业、 金融产业 、零售产业和房产行业等领域。 GBDC全球大数据峰会是迄今为止亚太地区举办的最具规模和影响力的行业盛会。

以下是“中央财经大学创新创业中心主任尚超”的发言实录:

尚超:在我讲之前想跟大家分享五个数字,昨天国家统计局发布了一些我们国民经济中很关键的数据。第一,我们的GDP,国内的生产总值达到67万亿。第二,我们社会消费品零售总额,今年突破了30万亿。第三,我们都知道,刚过去的一年,阿里巴巴这个公司取得了非常伟大的成就,它的2015年的总的天猫和淘宝销售额达到了两万亿,仅仅在双十一当天就达到了912亿。第四,关于我们的税收这块的数据,2015年我们全国总的税收的规模是达到了11万亿。第五,2015财政收入总额达到了15亿数字。我们应该关注这些方式,关注的一点就是发票。而我们每个人得到的发票很可能是有问题的,因为这个发票从诞生以来就面临很多关于造假的问题,如何防范发票造假呢,就是一个非常复杂的技术问题。今天大数据时代来临,我们能不能利用大数据防范虚假发票呢?答案肯定是的。

超市门口很多有人要你的购物小票?他们想干什么呢,我们的研究结论告诉大家,购物小票一定不能弄丢。为什么呢?我们看一些发票具体的实例,一组看起来非常真的发票,是由沃尔玛超市开出来的。正常情况下我们可能不会发现它有任何的问题。特别是我们把发票上的涂层刮开以后,在国家税务总局,北京市国税局网站上查的时候发现它是真的。而我现在告诉大家,它们统统是假的。如果这些发票是你在一些地铁站门口,或者超市门口买到的话,我可以很明确的告诉大家,它们99.99%都是假的。但是很诡异的是,它们在我们国家的官网上查询的时候,却现时的是真的。这发生的什么事情呢?这个图仔细分析会发现其中的端倪,本来我也不太清楚这个事情,但是经过一番调查发现了问题。可以很明显发现他们的日期与编号顺序前后颠倒。我想他们是不会买通国家税务总局,北京市国税局的官员帮他侵入这个系统的,这些人没有这么高超的技术。其实他们的技术很简单,那就是大数据技术。也就是说,骗子首先就拿到了大数据技术来忽悠大家。分析的结果就是他们在网上查的时候都是真的,但是实际上它肯定是假的。

在过去我们的发票造假这种现象是非常非常多的,有各种情况,有假票假开,假票真开,还有真票虚开,假票虚开。现在互联网+时代来临了,我看到了一种虚假发票+虚假业务+真实票号+互联网。传统的票验证方法分物理方法和网络查询的方法。当然这些手段已经远远不够了,当你买一些数据,你查询是真的,也付出了一些税款,但是这些都是假发票。这些钱被骗子得到之后也是不义之财。我特别想跟大家讲的是什么呢?就是我们的大数据时代,对于发票这么一件事情,它到底起到什么样的作用?其实过去我们在财政税收这些领域都有一些很重要的项目,像金财工程,金税工程,它们都属于信息化时代的产物。今天已经是DT时代了,我们可以看一下像Facebook这样的公司在做什么,它们在靠近北极圈的地方建立了一个庞大的数据中心,处理每天超过45亿次的点赞。当地有很多的冷资源,对它们冷却服务器非常有作用。

我们总体战略是在过去的金财工程和金税工程之上,引入互联网+,特别是引入大数据处理技术和云计算,使得我们每一天发生的数十亿笔的交易都能够纳入到智慧税务,智慧财政的监管之下,这是一个非常伟大的梦想。当然像阿里巴巴这样的公司已经开始做了。我们知道我们在区一些饭店吃饭的时候,可以用支付宝支付,这样可以得到5%的折扣,而我们营业税就是5%。所以阿里巴巴已经在做这样的事情。而我们财税监管部门为什么不这样做呢?

所以我们提出了几种对策:第一,注意重视大数据在发票管理中的应用。过去各个管理人员对这个问题认识的不够的,以至于我刚才所讲的发票实际上在我们的各种企事业单位,政府机关报帐过程中是很常见的,它们就躺在那里,实际上是一种虚假的存在。相应的人员如果有这个意识,我们的对这种发票防范的效果会非常的理想。

第二,以我们电子发票为代表的趋势,以我们二维码应用为代表的技术应用,它广泛的应用到我们的电商领域,还有我们其他的社会消费场景之中,将会极大的改变我们在税收监管,这种技术水平。举个例子,我们每一天中国人消费的笔数的量非常大,大概在50亿次左右。每一次理论上都应该涉及到税收的。如果我们要监管的话怎么监管呢?这很显然是一个非常复杂的问题。但是大数据,云计算的应用,它将会改变这一点。这其实也是跟在座的企业界朋友释放了一个巨大的信号,过去的二十年我们金财工程,金税工程采购总额已经超过1500亿人民币,而未来这个采购规模将突破5千亿人民币。也就是大量的服务器的需求,带宽的需求,各种工具软件的需求。

第三,我们非常需要向大家普及一个基础的知识,也就是说我们在任何地方的购物小票都不能乱丢,更不能买卖。如果买卖了会产生一个恶劣的问题。刚才的假发票为什么会出现这样的效果呢?比如你在沃尔玛花十块钱买两瓶水。他会给你开个发票,如果你不要,扔了的话,门口收小票的人,就会到沃尔玛前台开出来一个发票。他把这个发票的票号,密码记到一个数据库里,他也玩起了大数据,然后开始用打印机打印这些虚假发票。所以造成你在网上查的时候是真实的发票,而实际上它是一个赤裸裸的假发票。这个过程中他是做了一个放大的处理,就是原来里是十块钱的购买金额,当你买假发票的时候,你觉得是买的真的,你开900、1万,他都可以给你开,而他实际的交易额是10块钱。所以这块放大处理对社会危害很大的。

第四,我们企事业单位还有政府机关,财会这些人员在这块应该加强他的知识的学习。对发票管理,还有我们像一些公务卡消费,整个环节要关联到一块,只有这样的话,我们对付这种虚假发票才会有一个非常好的办法,毕竟这是一个超过15万亿的市场,里面哪怕是存在一丁点儿的虚假发票,都会对国民经济产生非常大的影响。还有我刚才说的对人员的培训都是很紧迫的问题。

最后,谢谢主办方邀请我来进行演讲,谢谢大家。

原文发布时间为:2016年1月20日
本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。
相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
目录
相关文章
|
2月前
|
数据采集 人工智能 分布式计算
ODPS在AI时代的发展战略与技术演进分析报告
ODPS(现MaxCompute)历经十五年发展,从分布式计算平台演进为AI时代的数据基础设施,以超大规模处理、多模态融合与Data+AI协同为核心竞争力,支撑大模型训练与实时分析等前沿场景,助力企业实现数据驱动与智能化转型。
257 4
|
3月前
|
传感器 Java 大数据
Java 大视界 -- 基于 Java 的大数据实时数据处理在车联网车辆协同控制中的应用与挑战(197)
本文深入探讨了基于 Java 的大数据实时数据处理在车联网车辆协同控制中的关键应用与技术挑战。内容涵盖数据采集、传输与实时处理框架,并结合实际案例分析了其在车辆状态监测、交通优化与协同驾驶中的应用效果,展示了 Java 大数据技术在提升交通安全性与效率方面的巨大潜力。
|
3月前
|
存储 搜索推荐 算法
Java 大视界 -- Java 大数据在智能金融理财产品风险评估与个性化配置中的应用(195)
本文深入探讨了Java大数据技术在智能金融理财产品风险评估与个性化配置中的关键应用。通过高效的数据采集、存储与分析,Java大数据技术助力金融机构实现精准风险评估与个性化推荐,提升投资收益并降低风险。
Java 大视界 -- Java 大数据在智能金融理财产品风险评估与个性化配置中的应用(195)
|
2月前
|
SQL 分布式计算 大数据
我与ODPS的十年技术共生之路
ODPS十年相伴,从初识的分布式计算到共生进化,突破架构边界,推动数据价值深挖。其湖仓一体、隐私计算与Serverless能力,助力企业降本增效,赋能政务与商业场景,成为数字化转型的“数字神经系统”。
|
2月前
|
存储 供应链 数据可视化
Java 大视界 -- 基于 Java 的大数据可视化在企业供应链风险预警与决策支持中的应用(204)
本篇文章探讨了基于 Java 的大数据可视化技术在企业供应链风险预警与决策支持中的深度应用。文章系统介绍了从数据采集、存储、处理到可视化呈现的完整技术方案,结合供应链风险预警与决策支持的实际案例,展示了 Java 大数据技术如何助力企业实现高效、智能的供应链管理。
|
2月前
|
存储 SQL Java
Java 大视界 -- Java 大数据在智能医疗手术风险评估与术前方案制定中的应用探索(203)
本文探讨了Java大数据技术在智能医疗手术风险评估与术前方案制定中的创新应用。通过多源数据整合、智能分析模型构建及知识图谱技术,提升手术风险预测准确性与术前方案制定效率,助力医疗决策智能化,推动精准医疗发展。
|
3月前
|
机器学习/深度学习 Java 大数据
Java 大视界 -- Java 大数据在智能政务公共资源交易数据分析与监管中的应用(202)
本篇文章深入探讨了 Java 大数据在智能政务公共资源交易监管中的创新应用。通过构建高效的数据采集、智能分析与可视化决策系统,Java 大数据技术成功破解了传统监管中的数据孤岛、效率低下和监管滞后等难题,为公共资源交易打造了“智慧卫士”,助力政务监管迈向智能化、精准化新时代。
|
3月前
|
数据采集 机器学习/深度学习 Java
Java 大视界 -- Java 大数据在智能体育赛事运动员体能监测与训练计划调整中的应用(200)
本篇文章聚焦 Java 大数据在智能体育赛事中对运动员体能监测与训练计划的智能化应用。通过构建实时数据采集与分析系统,结合机器学习模型,实现对运动员体能状态的精准评估与训练方案的动态优化,推动体育训练迈向科学化、个性化新高度。
|
3月前
|
数据采集 自然语言处理 分布式计算
大数据岗位技能需求挖掘:Python爬虫与NLP技术结合
大数据岗位技能需求挖掘:Python爬虫与NLP技术结合
|
3月前
|
机器学习/深度学习 分布式计算 Java
Java 大视界 -- Java 大数据机器学习模型在遥感图像土地利用分类中的优化与应用(199)
本文探讨了Java大数据与机器学习模型在遥感图像土地利用分类中的优化与应用。面对传统方法效率低、精度差的问题,结合Hadoop、Spark与深度学习框架,实现了高效、精准的分类。通过实际案例展示了Java在数据处理、模型融合与参数调优中的强大能力,推动遥感图像分类迈向新高度。

热门文章

最新文章

  • 1
    人工智能平台PAI产品使用合集之如何在odps上启动独立的任务
    185
  • 2
    DataWorks操作报错合集之出现报错“odps-0123055:用户脚本异常-Traceback(最后一次调用)”,如何解决
    431
  • 3
    人工智能平台PAI操作报错合集之在ODPS的xxx_dev项目空间调用easyrec训练,需要访问yyy项目空间的OSS,出现报错,是什么导致的
    139
  • 4
    MaxCompute操作报错合集之创建oss外部表时出现了报错:"Semantic analysis exception - external table checking failure, error message:,该怎么办
    413
  • 5
    MaxCompute操作报错合集之在本地用tunnel命令上传excel表格到mc遇到报错: tunnel upload C:\Users***\Desktop\a.xlsx mc里的非分区表名 -s false;该怎么办
    169
  • 6
    DataWorks操作报错合集之数据源同步时,使用脚本模式采集mysql数据到odps中,使用querySql方式采集数据,在脚本中删除了Reader中的column,但是datax还是报错OriginalConfPretreatmentUtil - 您的配置有误。如何解决
    379
  • 7
    MaxCompute操作报错合集之通过UDF调用异常(其他使用http调用正常)。报错:java.lang.NoSuchMethodError:是什么导致的
    178
  • 8
    MaxCompute操作报错合集之查询外部表insert到内部表报错,两表字段一致,是什么原因
    163
  • 9
    MaxCompute操作报错合集之出现报错:invalid dynamic partition value: \ufffd\ufffd\ufffd\ufffd\ufffd\ufffd是什么原因
    369
  • 10
    MaxCompute产品使用合集之如何设置每次返回超过10000行记录
    191