你以为海淘产品能逃过海关法眼?大数据技术一网打尽

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

随着国家改革进程的日渐深化,国民经济的日益快速发展,海关的工作更注重为区域经济服务、便利社会企业贸易等各项具体工作。通过海关大数据的利用,不仅是将对海关自身综合监管体系的建设起到重要作用,而且也将成为政府支持外贸经济发展、服务企业发展的又一落脚点,对促进贸易便利化、服务区域经济建设,提升服务型海关的建设具有重要意义。

某海关作为国家设在地方口岸的进出境监督管理机关,是海关总署领导的正厅(局)级直属海关,是全国最繁忙的口岸之一,也是全国任务最繁重的海关之一。

为了强化海关监管,更好地发挥把关职能,中国海关实施‘国门之盾’行动,将进出口货物查验比例从5%提到8%,同时也将查获率作为一个硬性指标进行管理。在经济下滑的背景下,既需要强调通关速度,同时继续打击逃税,企业也期待海关能够采取更多科学、合理、高效的管理手段和措施,推进贸易便利化进程。为此如何在最大限度把好国门的同时,最大限度方便合法进出口成为海关急需解决的问题。

通过分析发现,影响海关查获率及促进贸易便利化的关键在于布控指令的精准度。海关经过多年的信息化建设已经积累了大量的通关数据,结合外部工商、税务、公安等多部门共享的数据,将形成海关前所未有的海关大数据,根据这些内外部数据建模分析,对于提升布控精准性有重要作用。为此可以通过海关大数据应用,优化布控指令,实施科学查验,提高查获率。海关已经建立了风险预警系统,风险预警系统发出布控指令,关员根据布控指令进行查验。


图基于大数据分析提升查获率

该海关携手AMT开展基于大数据挖掘的提升海关查验率的创新工作。通过分析发现以往的风险预警系统更多的是基于经验,为此AMT协助该海关对大数据应用进行了整体规划,并建立了相应的大数据分析模型、推进大数据应用平台,推动大数据挖掘工作的开展。

1.大数据应用整体规划,明确了大数据应用整体目标以及推进思路。

a)大数据应用整体目标:建立大数据分析模型,实现根据内部和外部数据的挖掘,辅助生成布控指令;对历史布控指令进行评估,优化布控指令;对拟下达指令进行评估预测,通过输入布控指令或布控事例与历史指令和布控事例进行匹配,评估匹配率;对正在执行的指令的实时监控和调整,对于一些正在执行指令的有效性进行实时监控,及时调整不适宜的布控指令,减少不必要的查验和提升必要的查验工作;布控指令执行情况反馈、学习;能够发现异常,如报关异常、报关时间异常、价格异常等,能够根据异常情况进行管理优化和调整。

b)大数据应用推进思路:先搭建大数据平台,实现企业查询和商品查询两个试点应用。企业查询从企业维度对企业历史进出关情况进行查询;商品查询从商品的维度对商品进出关价格、数量、重量等信息进行查询,聚焦未来需要重点关注的企业和商品。

2.建立大数据分析模型包括风险布控优化模型、企业守法概率分析模型、风险极小评估模型。

3.分析现有海关风险管理体系,设计“数据整合->业务分析->分析建模->决策支持”的大数据分析流程;设计适用于直属海关和隶属海关两级的海关风险评估和监测指标体系,提出基于大数据分析的实时风险监控机制。

4.推荐大数据应用平台。根据对众多大数据平台的研究以及对该海关当前信息系统的分析,按照国家的开源可控要求,帮助该海关选择了具有大数据经验的平台提供商,既保证平台可控,也避免了因平台不成熟而造成的众多问题。

通过大数据平台的应用,帮助该海关有效的提高布控绩效,提升查获率,并能够有效发现管理中的问题并及时改进。



本文出处:畅享网
本文来自云栖社区合作伙伴畅享网,了解相关信息可以关注vsharing.com网站。
相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
1月前
|
存储 机器学习/深度学习 SQL
大数据处理与分析技术
大数据处理与分析技术
112 2
|
1月前
|
存储 分布式计算 NoSQL
【赵渝强老师】大数据技术的理论基础
本文介绍了大数据平台的核心思想,包括Google的三篇重要论文:Google文件系统(GFS)、MapReduce分布式计算模型和BigTable大表。这些论文奠定了大数据生态圈的技术基础,进而发展出了Hadoop、Spark和Flink等生态系统。文章详细解释了GFS的架构、MapReduce的计算过程以及BigTable的思想和HBase的实现。
zdl
|
1月前
|
消息中间件 运维 大数据
大数据实时计算产品的对比测评:实时计算Flink版 VS 自建Flink集群
本文介绍了实时计算Flink版与自建Flink集群的对比,涵盖部署成本、性能表现、易用性和企业级能力等方面。实时计算Flink版作为全托管服务,显著降低了运维成本,提供了强大的集成能力和弹性扩展,特别适合中小型团队和业务波动大的场景。文中还提出了改进建议,并探讨了与其他产品的联动可能性。总结指出,实时计算Flink版在简化运维、降低成本和提升易用性方面表现出色,是大数据实时计算的优选方案。
zdl
157 56
|
7天前
|
数据采集 分布式计算 大数据
MaxCompute MaxFrame 产品评测报告
MaxCompute MaxFrame是阿里云自研的分布式计算框架,专为Python开发者设计。它支持Python接口,充分利用MaxCompute的大数据资源,提升大规模数据分析效率。本文分享了MaxFrame在分布式Pandas处理和大语言模型数据预处理中的最佳实践,展示了其在数据清洗、特征工程等方面的强大能力,并提出了改进建议。
34 13
|
6天前
|
分布式计算 大数据 数据处理
技术评测:MaxCompute MaxFrame——阿里云自研分布式计算框架的Python编程接口
随着大数据和人工智能技术的发展,数据处理的需求日益增长。阿里云推出的MaxCompute MaxFrame(简称“MaxFrame”)是一个专为Python开发者设计的分布式计算框架,它不仅支持Python编程接口,还能直接利用MaxCompute的云原生大数据计算资源和服务。本文将通过一系列最佳实践测评,探讨MaxFrame在分布式Pandas处理以及大语言模型数据处理场景中的表现,并分析其在实际工作中的应用潜力。
27 2
|
7天前
|
机器学习/深度学习 分布式计算 数据处理
MaxCompute MaxFrame 产品评测报告
MaxCompute MaxFrame 产品评测报告
20 4
|
10天前
|
SQL 分布式计算 DataWorks
DataWorks产品测评|基于DataWorks和MaxCompute产品组合实现用户画像分析
本文介绍了如何使用DataWorks和MaxCompute产品组合实现用户画像分析。首先,通过阿里云官网开通DataWorks服务并创建资源组,接着创建MaxCompute项目和数据源。随后,利用DataWorks的数据集成和数据开发模块,将业务数据同步至MaxCompute,并通过ODPS SQL完成用户画像的数据加工,最终将结果写入`ads_user_info_1d`表。文章详细记录了每一步的操作过程,包括任务开发、运行、运维操作和资源释放,帮助读者顺利完成用户画像分析。此外,还指出了文档中的一些不一致之处,并提供了相应的解决方法。
|
19天前
|
人工智能 分布式计算 DataWorks
大数据& AI 产品月刊【2024年11月】
大数据& AI 产品技术月刊【2024年11月】,涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。
|
20天前
|
SQL 运维 大数据
轻量级的大数据处理技术
现代大数据应用架构中,数据中心作为核心,连接数据源与应用,承担着数据处理与服务的重要角色。然而,随着数据量的激增,数据中心面临运维复杂、体系封闭及应用间耦合性高等挑战。为缓解这些问题,一种轻量级的解决方案——esProc SPL应运而生。esProc SPL通过集成性、开放性、高性能、数据路由和敏捷性等特性,有效解决了现有架构的不足,实现了灵活高效的数据处理,特别适用于应用端的前置计算,降低了整体成本和复杂度。
|
28天前
|
机器学习/深度学习 存储 大数据
在大数据时代,高维数据处理成为难题,主成分分析(PCA)作为一种有效的数据降维技术,通过线性变换将数据投影到新的坐标系
在大数据时代,高维数据处理成为难题,主成分分析(PCA)作为一种有效的数据降维技术,通过线性变换将数据投影到新的坐标系,保留最大方差信息,实现数据压缩、去噪及可视化。本文详解PCA原理、步骤及其Python实现,探讨其在图像压缩、特征提取等领域的应用,并指出使用时的注意事项,旨在帮助读者掌握这一强大工具。
68 4