比赛-以企业为服务目标的政策大数据应用

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 比赛-以企业为服务目标的政策大数据应用

9.png

报名链接:https://www.kesci.com/home/competition/5fcef670807ccb002cb62113


赛题&数据


赛题题目


以企业为服务目标的政策大数据应用


赛题背景


对于小型企业来说,掌握政策动向,对于政策积极响应,并且结合政策的落实调整战略有助于企业自身拓展业务,增加营收。对于大型企业来说,政策的掌握不光能够为企业创收,并且有助于大型企业承担其应有的社会责任。企业对于政策的响应和反馈也有利于政策风向调整,使得政府效率提升,更好地服务大众。因此借助数字化的手段分析和管理政策是一个有意义的研究方向。


赛题任务


本次任务提供重庆地区的政策信息,参赛者需要合理运用文本处理技术与自然语言处理技术,对于提供的信息进行分析。通过分析政策文本,总结政策趋势,结合企业相关的信息,讨论包括但不限于如下问题:

  1. 重庆地方企业政策趋势及其特点
  2. 疫情下的企业与政策特点
  3. 量化评价政策在协助企业发展方面的效用
  4. 在政策影响下的地方企业活力特点


探究此类问题鼓励参赛队伍深入了解地方政策特点与地方经济与企业特点,获取其他公开政策信息与数据进行综合分析,利用数据做观点支持,对于用政策精益化服务企业提出建设性方案。本次任务原则上鼓励参赛队伍大胆创新,对于政策指导方式建言献策,敢于对政策服务企业相关的数据与信息在相关性和因果性上进行大胆的假设和严谨的探究与论证。


赛题数据


  1. 重庆地区网页政策文本
  2. 其他地区政策文本
  3. 企业工商信息


数据使用


  1. 本赛题提供的数据将会以数据集的形式分发到比赛平台中
  2. 数据提供方授权参赛人员使用提供的数据进行指定比赛的模型训练工作,参赛人员不得将数据用于任何商业用途
  3. 数据集位置:报名后,在数字重庆平台的页面右上角 工作台 > 数据源 > 他人共享 > 政策板块数据,点击文件一栏显示有相关数据集;
  4. 数据使用方式:
  1. 项目添加:在数字重庆平台的页面右上角 工作台 > 右上角 加号 > 创建项目 > 添加数据源 > 他人共享 > 选择政策板块数据添加 > 创建
  2. 数据源添加:政策板块数据页面右上角 创建项目 > 创建
  1. 工作台 ModelWhale使用:请参考用户手册


数据说明


  • 重庆地区网页政策文本
  • 数据为 utf-8 格式的 CSV 文本文件
  • 政策内容均为带有 CSS 式样的 HTML 内容,参赛者需自行提取有用的文本信息,并进行数据清洗。
  • 字段说明表


字段名 数据类型 说明
id int(11) id 列
title varchar(180) 标题
srcName varchar(255) 来源名称
srcUrl varchar(255) 来源Url
policyFileType varchar(120) 政策类别。1,申报通知;2,项目征集;3,公示名录;4,政策解读;5,政府文件
issuedNumber varchar(120) 发文字号
writtenDepartment varchar(255) 发文机构
publishDepartment int(11) 机构类别。1,政府,2,科技,3,经信委,4,发改,5,财税,6,商务,7,农业,8,市场监管,9,金融,10,国资,11,工商联,12,人社,13,其他
level int(11) 适用级别。1,国家,2,省市
policyPublishDate varchar(120) 发文日期
executionStartDate varchar(120) 实施开始日期
executionEndDate varchar(120) 实施结束日期
onlineStartDate varchar(120) 网上截止开始日期
onlineEndDate varchar(120) 网上截止结束日期
applyStartDate varchar(120) 纸质材料开始日期
applyEndDate varchar(120) 纸质材料结束日期
tagValues varchar(120) 主题标签。1,成果转化;2,资金扶持;3,资格资质;4,人才引育;5,双创投资;6,减税降费;7,资源共享;8,知识产权;9,其他;10,技术创新;11,疫情政策;12,营商环境
content longtext 政策内容
isConfirm int(1) 是否人工确认;0 否 1 是 2 不推送
isPost int(4) 是否已推送;0 否 1 是 2 推送失败
updateTime timestamp 入库时间
country varchar(240) 适用地区(国家地区行政编吗)
supportIndustry varchar(120) 所属行业
keyWord varchar(500) 关键词
supportDirection varchar(120) 扶持方向
accossry varchar(800)
supportProfession varchar(120) 所属产业
summary varchar(1500) 摘要


  • 其他地区政策文本
  • 数据为 utf-8 格式的 json 文本文件
  • 包含其他地区的相关政策以及发布的 URL
  • json格式说明表


字段名 说明
bbd_url 链接地址
policy_org 发文机构
policy_title 标题
policy_code 发文字号
pubdate 发布日期
substr_title 标题精华
policy_province 所属省份
policy_theme 政策主题
policy_industry 所属行业


  • 企业工商信息
  • 数据为 utf-8 格式的 json 文本文件
  • 包含重庆当地企业的工商信息
  • json 格式说明表


字段名 说明
regno_or_creditcode 注册号/统一社会信用代码
credit_code 统一社会信用代码
regno 注册号
company_name 企业名称
company_type 类型
frname 法定代表人
frname_compid 法定代表人唯一ID
regcap 注册资金
realcap 实收资本
esdate 成立日期
approval_date 核准日期
opento 营业期限至
address 注册地址
operate_scope 经营范围
regorg 登记机关
enterprise_status 登记状态
parent_firm 派出企业名称
regcapcur 注册币种
operating_period 经营期限
bbd_history_name 历名名称
company_industry 行业分类
regcap_currency 注册资本_币种
realcap_currency 实收资本_币种
company_province 省份_映射结果
company_enterprise_status 登记状态_映射结果
company_companytype 企业类型代码
company_regorg 登记机关代码
ipo_company 上市公司标识
company_county 企业注册地行政区划代码


相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
4月前
|
自然语言处理 大数据 应用服务中间件
大数据-172 Elasticsearch 索引操作 与 IK 分词器 自定义停用词 Nginx 服务
大数据-172 Elasticsearch 索引操作 与 IK 分词器 自定义停用词 Nginx 服务
100 5
|
4月前
|
SQL 存储 分布式计算
ODPS技术架构深度剖析与实战指南——从零开始掌握阿里巴巴大数据处理平台的核心要义与应用技巧
【10月更文挑战第9天】ODPS是阿里巴巴推出的大数据处理平台,支持海量数据的存储与计算,适用于数据仓库、数据挖掘等场景。其核心组件涵盖数据存储、计算引擎、任务调度、资源管理和用户界面,确保数据处理的稳定、安全与高效。通过创建项目、上传数据、编写SQL或MapReduce程序,用户可轻松完成复杂的数据处理任务。示例展示了如何使用ODPS SQL查询每个用户的最早登录时间。
293 1
|
4月前
|
存储 数据采集 监控
大数据技术:开启智能决策与创新服务的新纪元
【10月更文挑战第5天】大数据技术:开启智能决策与创新服务的新纪元
|
2月前
|
机器学习/深度学习 人工智能 运维
智能化运维:AI与大数据在IT运维中的应用探索####
本文旨在探讨人工智能(AI)与大数据分析技术如何革新传统IT运维模式,提升运维效率与服务质量。通过具体案例分析,揭示AI算法在故障预测、异常检测及自动化修复等方面的实际应用成效,同时阐述大数据如何助力实现精准运维管理,降低运营成本,提升用户体验。文章还将简要讨论实施智能化运维面临的挑战与未来发展趋势,为IT管理者提供决策参考。 ####
|
3月前
|
机器学习/深度学习 存储 大数据
云计算与大数据技术的融合应用
云计算与大数据技术的融合应用
|
3月前
|
消息中间件 分布式计算 大数据
数据为王:大数据处理与分析技术在企业决策中的力量
【10月更文挑战第29天】在信息爆炸的时代,大数据处理与分析技术为企业提供了前所未有的洞察力和决策支持。本文探讨了大数据技术在企业决策中的重要性和实际应用,包括数据的力量、实时分析、数据驱动的决策以及数据安全与隐私保护。通过这些技术,企业能够从海量数据中提取有价值的信息,预测市场趋势,优化业务流程,从而在竞争中占据优势。
221 2
|
4月前
|
存储 分布式计算 druid
大数据-155 Apache Druid 架构与原理详解 数据存储 索引服务 压缩机制
大数据-155 Apache Druid 架构与原理详解 数据存储 索引服务 压缩机制
108 3
ly~
|
4月前
|
供应链 搜索推荐 安全
大数据模型的应用
大数据模型在多个领域均有广泛应用。在金融领域,它可用于风险评估与预测、智能营销及反欺诈检测,助力金融机构做出更加精准的决策;在医疗领域,大数据模型能够协助疾病诊断与预测、优化医疗资源管理和加速药物研发;在交通领域,该技术有助于交通流量预测、智能交通管理和物流管理,从而提升整体交通效率;电商领域则借助大数据模型实现商品推荐、库存管理和价格优化,增强用户体验与企业效益;此外,在能源和制造业中,大数据模型的应用范围涵盖从需求预测到设备故障预测等多个方面,全面推动了行业的智能化转型与升级。
ly~
471 2
|
4月前
|
Oracle 大数据 数据挖掘
企业内训|大数据产品运营实战培训-某电信运营商大数据产品研发中心
本课程是TsingtaoAI专为某电信运营商的大数据产品研发中心的产品支撑组设计,旨在深入探讨大数据在电信运营商领域的应用与运营策略。通过密集的培训,从数据的本质与价值出发,系统解析大数据工具和技术的最新进展,深入剖析行业内外的实践案例。课程涵盖如何理解和评估数据、如何有效运用大数据技术、以及如何在不同业务场景中实现数据的价值转化。
86 0
|
27天前
|
SQL 数据可视化 大数据
从数据小白到大数据达人:一步步成为数据分析专家
从数据小白到大数据达人:一步步成为数据分析专家
210 92