破解大数据下的统计管理工作困局

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

根据市人大常委会2016年度工作安排,7月召开的常委会第三十一次会议将审议 《上海市统计管理条例 (修订草案)》。为了提高法规草案的审议质量,市人大常委会部分组成人员昨天赴上海市统计资料中心开展立法调研。市人大常委会主任殷一璀参加。

殷一璀一行视察了市统计局社情民意调查中心,了解市统计局通过电话方式开展专项调查,为本市重大政策提供决策参考的情况;视察了统计资料展示馆,并听取市统计局负责人就本市统计工作以及统计管理法制工作开展情况所作的汇报。

海量信息、数据的爆发式增长的情况下,统计部门如何保证数据的真实性和准确性?市统计局积极探索统计数据采集方式的变革,构建政府部门信息共享、社会大数据应用以及统计部门重点抽样调查相结合的数据采集机制。一方面以与税务部门合作为“突破口”,建立部门信息共享长效机制,就国际航运、贸易、人口、投资建设、金融、生产价格、居民收支等方面,与市公安局、市住建委等部门开展了28项部门行政信息共享工作。另一方面,统计局直面大数据对政府统计的挑战,成立大数据应用研究小组,整体谋划推进大数据在统计中的应用,加强与1号店、淘宝、中国银联等企业的8项大数据应用工作,设计零售、人口、电力等五大领域。

尽管如此,统计管理工作还面临着不少工作困境。有委员提出企业在统计时有“数出多门”的情况,面对财税、审计以及统计等不同部门往往有不同的数据。委员们建议,能否实行统一报表制度,利用行政审批下放将对统计工作的干扰降到最低。市统计局表示,此次地方统计管理法规修订,建议重点要解决五大核心问题。一是政府数据信息共享;二是统计机构调用行政记录;三是社会数据资源的开发利用;四是统计信用制度;五是委托统计的方式方法。

据了解,现行 《上海市统计管理条例》 自1993年颁布实施后,对于规范和保障本市统计工作发挥了重要作用。2015年12月,市人大常委会将修订地方统计管理法规列入2016年市人大立法正式项目。《上海市统计管理条例》的修订,将着重解决当前本市统计工作面临的新情况、新问题,尽可能将统计调查的全过程以及未来统计发展可能遇到的诸如大数据等问题纳入立法范围,全面适应新形势下统计事业法治化发展的需要,增强地方统计法规的适用性和可操作性,为今后的上海统计调查工作提供法律保障。

殷一璀充分肯定近年来上海统计工作所取得的成绩。她指出,《上海市统计管理条例》 的修订,要充分考虑统计工作立法需求,适应未来统计发展需要;要对推进自贸区统计制度方法改革、发挥社会力量在统计工作中作用、促进统计条例修法与社会信用立法相得益彰等问题作具体研究,尽最大努力使修法工作取得实质性进步。

====================================分割线================================

本文转自d1net(转载)

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
7月前
|
存储 监控 NoSQL
Redis HyperLogLog: 高效统计大数据集的神秘利器
Redis HyperLogLog: 高效统计大数据集的神秘利器
135 1
|
SQL 存储 分布式计算
MaxCompute元数据使用实践--项目信息统计
MaxCompute的租户级别Information Schema从租户角度提供项目元数据及使用历史数据等信息,您可以一次性拉取您同一个元数据中心下所有Project的某类元数据,从而进行各类元数据的统计分析。
851 0
|
2月前
|
消息中间件 存储 druid
大数据-156 Apache Druid 案例实战 Scala Kafka 订单统计
大数据-156 Apache Druid 案例实战 Scala Kafka 订单统计
44 3
|
4月前
|
SQL 分布式计算 大数据
"大数据计算难题揭秘:MaxCompute中hash join内存超限,究竟该如何破解?"
【8月更文挑战第20天】在大数据处理领域,阿里云的MaxCompute以高效稳定著称,但复杂的hash join操作常导致内存超限。本文通过一个实例解析此问题:数据分析师小王需对两个共计300GB的大表进行join,却遭遇内存不足。经分析发现,单个mapper任务内存默认为2GB,不足以支持大型hash表的构建。为此,提出三种解决方案:1) 提升mapper任务内存;2) 利用map join优化小表连接;3) 实施分而治之策略,将大表分割后逐一处理再合并结果。这些方法有助于提升大数据处理效率及稳定性。
93 0
|
4月前
|
机器学习/深度学习 分布式计算 大数据
大数据迷局:如何用PyODPS破解回归分析之门?
【8月更文挑战第20天】随着大数据技术的发展,回归分析在处理海量数据时愈发重要。PyODPS是阿里云MaxCompute上的Python库,支持高效的数据处理。本文通过示例展示如何使用PyODPS进行回归分析:从安装库、连接MaxCompute、读取销售数据,到数据预处理、构建线性回归模型、预测销售额及评估模型性能(如计算RMSE)。这一流程体现了PyODPS在大数据环境下的强大功能。
66 0
|
5月前
|
分布式计算 大数据 MaxCompute
MaxCompute产品使用合集之如何实现根据商品维度统计每件商品的断货时长的功能
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
7月前
|
分布式计算 Hadoop 大数据
【云计算与大数据计算】Hadoop MapReduce实战之统计每个单词出现次数、单词平均长度、Grep(附源码 )
【云计算与大数据计算】Hadoop MapReduce实战之统计每个单词出现次数、单词平均长度、Grep(附源码 )
303 1
|
7月前
|
分布式计算 项目管理 MaxCompute
MaxCompute元数据使用实践--数据权限统计
本文主要介绍通过元数据的相关权限的视图进行数据权限的统计。
101635 2
|
7月前
|
SQL 大数据 HIVE
每天一道大厂SQL题【Day04】大数据排序统计
每天一道大厂SQL题【Day04】大数据排序统计
55 0
|
7月前
|
机器学习/深度学习 分布式计算 大数据
【大数据技术】Spark MLlib机器学习特征抽取 TF-IDF统计词频实战(附源码和数据集)
【大数据技术】Spark MLlib机器学习特征抽取 TF-IDF统计词频实战(附源码和数据集)
79 0