围绕“大数据”做好投资价格统计改革

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

今年初,国家统计局关于开展固定资产投资价格统计制度改革试点工作以国统字【2017】1号通知下发以来,国家统计局沈阳调查队高度重视。在反复学习和消化理解的基础上,对改革内容中的每个环节进行了摸底调查,在与市统计局、市城乡建设委员会、市规划和国土资源局等相关部门充分沟通后,对做好固定资产投资价格统计制度改革方案提几点建议,以资全国统计同仁探讨。

改革背景

我国从1991年开始按年度编制固定资产投资价格指数。根据需要,1997年将报表调整为半年和年度两次报表,并增加了分类工程投资价格指数。2003年改为季度报表。随后,又改进了设备、工器具价格指数由工业生产者价格调查直接取得的计算方法,一直沿用至今。伴随着信息化社会的快速发展,旧的《固定资产投资价格统计制度调查方案》与企业经营模式、市场化发展严重脱节。为此,适时推进本专业统计制度改革势在必行。

投资企业经营模式影响了投资品价格数据的准确性。投资企业大多数是将投资在建项目承包给一个或几个建筑单位施工方,建筑单位施工方又将施工项目细化承包给个人。这种经营运作模式,给投资或建筑施工企业采集和上报投资品价格带来很大困难,部分企业甚至无法从个人购买行为中得到所要采集的投资品价格。这种情况下,企业上报数据往往是参考网络建筑用材料价格进行上报。

数据处理程序老化跟不上现代信息技术发展需要。固定资产投资价格统计专业所使用的数据处理程序是2003年编制的。经过十几年的信息技术发展,计算机技术发生了翻天覆地的变化,老化的数据处理程序与现代计算机水平无法匹配。每个调查样本企业为能正常上报数据,只能保留一台老式计算机进行数据上报。尽管这样,每个季度在组织报表数据上报时,还是有部分样本企业数据处理程序无法运行,只能按照原始的纸介质形式上报报表。

指数计算方法和产品分类与其他专业衔接性不强。现行的固定资产投资价格统计中,各类指数只有同比指数,没有环比和定基比指数;调查产品分类只有大类和代表产品的两级目录,而目前工业生产者价格调查有大类、中类、小类、基本分类、代表产品和规格品六级分类。无论计算方法还是产品分类都过于单一化,与工业生产者价格调查、房地产价格调查、居民消费价格调查等数据无法衔接。

以“大数据”重构

指数的可行性

固定资产投资价格指数由建筑安装工程价格指数、设备工器具价格指数、其他费用价格指数构成,其中建筑安装工程价格指数又由材料费价格指数、人工费价格指数和机械使用费价格指数构成。目前,各类指数都要通过投资或建筑企业统计人员填报基础数据汇总得出,这种方法即落后于信息化时代的发展,同时又无法保证数据质量。因此,以“大数据”理念,重构固定资产投资价格指数是大势所趋。

关于材料费价格指数由工程造价办公室发布的数据和工业生产者价格调查中的相关数据替代问题。通过与市城乡建设委员会造价站(以下简称造价站)沟通了解到,造价站每月出版的《建筑与预算》刊物中,每月月底发布的涉及建筑材料28类、2061个品种价格是编制工程预算、结算以及招投标报价的参考依据,数据来源真实,能够客观反映沈阳市材料价格变动趋势。另外,固定资产投资中建筑企业所用材料,一般都采购自工业企业,材料价格指数与工业生产者购进价格中建筑行业产品价格指数高度相关,同时每月月底也可以获得价格数据。

关于人工费价格指数由劳动工资中的建筑业平均工资代替问题。通过与沈阳市统计局人口与就业统计处沟通,劳动工资统计中的建筑业平均工资,是由沈阳市1000多家有资质的投资和建筑企业上报的所有从业人员的混合平均工资构成,与固定资产投资价格调查中的人工费口径比较接近,用于进行替代较为理想。但劳动工资统计为每个季度季后之月月底公布数据,即一季度建筑业平均工资,在4月底方可取得。

关于其他费用价格指数由银行利率、人员工资和土地价格等相关数据代替问题。通过与市规划和国土资源局的土地交易中心等部门沟通,每月底能够取得当月土地交易面积和土地成交额数据,据此推算出土地混合平均价格。而其他费用价格指数中涉及到的人员工资可用建筑业劳动工资替代,金融机构一年期贷款基准利率选定指定银行统计。

用“大数据”替代

各分类指数的衔接性

从各种分类看。对《固定资产投资价格统计制度改革试点调查方案》调查产品目录与《工业生产者价格调查方案》和《建筑与预算》产品目录进行对比发现,固定资产投资价格调查产品大、中、小类与工业生产者价格调查分类不同,但基本分类有84%的材料与工业生产者价格调查目录中基本吻合。造价站有2个基本分类可以弥补工业生产者价格调查的不足。总的来看,衔接率接近90%。此外,虽然产品相关度较高,但由于固定资产投资价格调查涉及到的产品是按用途分类,而工业生产者价格调查涉及到的产品是按用途材质分类,因此在取数时会产生一定的麻烦。

从取得数据时间看。工业生产者价格调查、造价站和土地交易中心所得数据均可在每个月月底取得,而劳动工资数据只能在季后月底取得。

从替代数据的吻合度看。通过金融机构一年银行贷款利率和人员工资解决“前期工程费”“施工工作费”和“建设单位其他费用”指数计算,不足以满足各类价格指数的编制需要。

改革建议

继续完善一套表建设。其一:要修改和完善工业生产者价格调查产品目录,使其能够满足固定资产投资价格调查需要。取消造价办取数途径,避免不必要的环节。其二:利用完善后的工业生产者价格调查中建筑及非金属类价格指数替代固定资产投资价格中的材料费价格指数即可。避免重复取数、重复计算和重复汇总的不必要工作。

取数错位法解决汇总问题。固定资产投资价格中的人工费可用上一个季度建筑企业从业人员工资代替,解决不同专业上报时间不同步的问题。基于工业生产者价格调查和土地交易中出数时间均在月底,建议固定资产投资价格调查报表时间由过去的3、6、9、12月上报,改为1、4、7、10月上旬上报。

纳入统计网络直报系统管理。固定资产投资价格统计制度改革箭在弦上,就要加大改革的步伐,与其他专业同步,采用网络直报系统收集、报送、计算和汇总。此次固定资产投资价格专业统计制度改革涉及各个委办局部门较多,做好基础建设性工作,促使本专业一步到位地推行统计网络直报工作十分必要。

取消其他费用价格指数的编制。固定资产投资价格调查中的其他费用价格指数由四部分组成,一是土地取得费用,二是前期工程费,三是施工工作费,四是建设单位其他费用。由于投资或建筑施工企业每一个投资在建项目的地点、项目规模、用工人员数量及发生的各种费用支出均无可比性。因此,建议取消该类指数的编制工作。

本文转自d1net(转载)

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
6月前
|
存储 监控 NoSQL
Redis HyperLogLog: 高效统计大数据集的神秘利器
Redis HyperLogLog: 高效统计大数据集的神秘利器
125 1
|
SQL 存储 分布式计算
MaxCompute元数据使用实践--项目信息统计
MaxCompute的租户级别Information Schema从租户角度提供项目元数据及使用历史数据等信息,您可以一次性拉取您同一个元数据中心下所有Project的某类元数据,从而进行各类元数据的统计分析。
828 0
|
1月前
|
消息中间件 存储 druid
大数据-156 Apache Druid 案例实战 Scala Kafka 订单统计
大数据-156 Apache Druid 案例实战 Scala Kafka 订单统计
40 3
|
4月前
|
分布式计算 大数据 MaxCompute
MaxCompute产品使用合集之如何实现根据商品维度统计每件商品的断货时长的功能
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
6月前
|
分布式计算 Hadoop 大数据
【云计算与大数据计算】Hadoop MapReduce实战之统计每个单词出现次数、单词平均长度、Grep(附源码 )
【云计算与大数据计算】Hadoop MapReduce实战之统计每个单词出现次数、单词平均长度、Grep(附源码 )
272 1
|
6月前
|
分布式计算 项目管理 MaxCompute
MaxCompute元数据使用实践--数据权限统计
本文主要介绍通过元数据的相关权限的视图进行数据权限的统计。
101621 2
|
6月前
|
SQL 大数据 HIVE
每天一道大厂SQL题【Day04】大数据排序统计
每天一道大厂SQL题【Day04】大数据排序统计
54 0
|
6月前
|
机器学习/深度学习 分布式计算 大数据
【大数据技术】Spark MLlib机器学习特征抽取 TF-IDF统计词频实战(附源码和数据集)
【大数据技术】Spark MLlib机器学习特征抽取 TF-IDF统计词频实战(附源码和数据集)
75 0
|
分布式计算 大数据 Java
大数据行业部署实战2:环境大数据统计
大数据行业部署实战2:环境大数据统计
147 0
|
SQL 分布式计算 DataWorks
MaxCompute元数据使用实践--作业统计
通过MaxCompute租户级别Information Schema的“TASKS_HISTORY”视图可以统计查看MaxCompute计算作业的元数据信息,方便您进行作业审计以及各类统计,指导作业性能、成本优化。
1622 0