须完善税务大数据的应用环境

简介:

互联网时代,以大数据应用来提高税收管理服务能力已凝聚广泛共识,尤其是在税务机关数据获取成本高、数据分析方法简单、数据分析力量不足的环境下。而不同的技术手段有着特定的使用环境要求,大数据技术也不例外。因此,若想推动税务大数据应用迈向新台阶,必须从以下5个方面着手来完善税务大数据应用环境。

  推动数据标准建设,强化数据质量管理。数据标准、数据质量是影响大数据分析的关键因素。数据标准不统一则数据分析成本会增加,数据不准确则数据分析结论不切实际。应建立关键数据标准,规范数据元管理,保证数据分类科学、含义分明、格式一致。根据业务规范和指标体系建立的需要,强化数据传输流程改造,增强数据传输中系统自校能力。对数据质量进行全程监控、闭环管理,定期通过系统自检、人工核查等方式开展数据质量检查,并建立倒查机制、强化问责。

  促进数据全面生成,打造税务大数据库。数据全面生成是影响大数据分析成效的关键要素。唯有不断输入全面、及时的数据原材料,大数据处理这个机器才能产生出更多可观的产品。应加强信息系统整合,探索建立全国性的数据资源池,并开放端口供基层税务机关使用。依托综合治税平台建设,加强跨部门信息获取;依托网络爬虫等手段,加强互联网涉税信息获取。利用任务日志等手段全程记录纳税人在履行权利义务时的需求情况和个人信息,实现数据的实时记录、实时传送。

  拓展数据分析方法,提高数据使用价值。数据分析应用是大数据分析实现价值的关键环节。只有不断拓展分析方法和分析模型,才能更广范围、更深层次地使用数据、挖掘数据。应创新理论体系,探索微观税收数据对接宏观经济指标、税收历史数据对接未来发展趋势、企业个体波动对接行业整体变化的理论方法和分析模型,提高税收数据服务于宏观分析、发展预测和风险管理的能力。要适应大数据分析侧重相关关系、总体分析的特征,借力决策树、随机森林、支持向量机和神经网络等面向复杂数据的机器学习方法,提升税务大数据分析价值。

  优化数据系统架构,增强系统处理能力。系统处理能力是构成大数据技术使用的关键基础。以流式处理为主的实时处理是大数据主要分析形式。唯有创新技术手段、优化系统架构才能提高系统实时处理能力、提升数据使用价值。应利用“高可用”“沙箱”等云计算手段,整合现有计算资源,通过科学的任务分配来优化系统处理模式,减少系统闲置。强化系统架构、计算框架、处理方法和测试基准的设计研究,利用分布式并行处理技术减小数据仓库的扩容压力,提升数据作业处理速度及系统响应速度。

  建立数据公开体系,发挥数据更大效能。数据公开体系是影响大数据分析的关键成分。信息交互是双方的,只有让税务数据走出去,才可将更多涉税数据引进来,进而扩大税收数据容量、提高税务大数据使用效能。要厘清纳税人信息保护和税收数据公开的边界,探索对公开税收数据进行立法保障。突破当前税务数据公开层次不一、口径不同、范围较窄和数据更新不及时的弊端,借鉴国家统计局“统计数据”模块的做法,在国家税务总局官网上统一设立“税收数据”独立模块,拓展信息公开范围、提高信息公开频率,为社会各界提供一个权威、快捷、实用性高的税收数据获取渠道。

本文转自d1net(转载)

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章

热门文章

最新文章