1.准备环境和资源
开始教程前,请按以下步骤准备环境和资源:
- 访问阿里云免费试用。单击页面右上方的登录/注册按钮,并根据页面提示完成账号登录(已有阿里云账号)、账号注册(尚无阿里云账号)或实名认证(根据试用产品要求完成个人实名认证或企业实名认证)。
- 成功登录后,在产品类别下选择大数据计算>数据计算与分析,单击云原生大数据计算服务 MaxCompute产品的立即试用。
- 在弹出的购买试用MaxCompute产品的面板上选择开通地域,本教程选择为华东1(杭州),其他参数可保持默认值,勾选服务协议后单击立即试用。
2.创建MaxCompute项目
- 登录MaxCompute控制台,在左上角选择地域,本教程使用的地域为华东1(杭州)。在左侧导航选择工作区 > 项目管理,在项目列表页面单击新建项目。
- 在弹出的新建项目配置页面中配置项目信息,核心配置参数如表所示。
参数 |
说明 |
项目名称 |
自定义项目名称。本教程设置为notebook_test_001。 【扩展知识】:项目名称需全局唯一,如果界面提示您项目名称已存在,您可根据提示修改项目名称。 |
计算资源付费类型 |
本教程选择:按量付费。 【注意】您通过免费试用选购的资源抵扣包仅可用于抵扣后付费资源消耗,本教程选择“按量付费”。 |
默认Quota |
用于实现计算资源分配。本教程选择:默认后付费Quota。 |
单SQL消费限制 |
本教程不设置。本参数为单SQL消费的最高阈值。单位:扫描量(GB)*复杂度。非必填项,当选择按量付费计费类型时建议设置,可以避免非预期的单SQL消费过高。同时也建议配置实时消费监控告警,多方位监控限制消费超出预期,详情请参见消费监控告警。 |
数据类型 |
MaxCompute数据类型包含1.0数据类型、2.0数据类型和Hive兼容类型。 本教程选择:2.0数据类型。 |
是否加密 |
指定创建的MaxCompute项目是否需要开启数据加密功能。更多数据加密信息,请参见数据加密。 本教程选择:不加密。 |
- 完成配置后单击确定,完成项目创建。
3.创建MaxCompute Notebook实例
- 登录并进入MaxCompute Notebook,在左上角选择地域,本教程使用的地域为华东1(杭州)。
- 在Notebook页面,单击启动。
- 在启动Notebook对话框,填写Notebook的名称。
- 单击启动,完成MaxCompute Notebook实例创建。
4.通过MaxCompute Notebook一分钟快速制作热点事件动态视频
您可自行在MaxCompute上创建所要做分析的数据表,基于MaxCompute Notebook内置demo及PyODPS丰富的数据分析及可视化扩展库,一分钟快速生成炫酷的动态分析视频。
- 准备数据。
您可在MaxCompute创建并上传所要分析的数据,表格式要求:包含分析类别、热度值、对应年/月份三个字段,建表并上传数据详情请参见建表并上传数据。
本示例中使用MaxCompute公共数据集表:近二十年中国各省GDP数据(bigdata_public_dataset.national_data.annual_gdp_by_province),生成近二十年中国各省GDP动态变化分析视频。 - 进入Notebook实例。
在MaxCompute Notebook页面,单击目标Notebook实例操作列的进入。 - 双击打开
一分钟快速制作热点事件动态视频.ipynb
脚本,根据文件中的提示信息,填写相关配置信息:
- 环境参数配置:
- 填写PROJECT_NAME值,本教程中填写为
"notebook_test_001"
(根据您创建的MaxCompute project进行修改)。 - 填写Endpoint值,本教程中填写为
"http://service.cn-hangzhou.maxcompute.aliyun.com/api"
。
- 分析数据准备:
- 填写table_name值,为您要分析的MaxCompute表,本教程中填写为
bigdata_public_dataset.national_data.annual_gdp_by_province
。 - 填写category、value、date等数据表字段名称,本教程中填写为
region
、gdp
、year
。
- 视频信息配置:
- 填写top_number值,为所要分析的前top_number项,默认为10。
- 填写title值,为视频标题,本教程中填写为
近二十年中国各省GDP动态变化分析
。
- 修改可视化效果。
您可直接修改代码脚本中以下的可视化部分代码,以生成更炫酷的可视化效果:
修改方式:
1)修改可视化库bar_chart_race参数:
可通过修改本次使用的可视化库:bar_chart_race相关参数,改变可视化效果,如修改柱状图颜色、增加背景颜色等。可参考官网说明。
2)修改引用的可视化库:
本次提供的demo脚本中采用的为bar_chart_race可视化库,为获得更好的可视化效果您可采用Python其他的可视化库,如pyplot、pyecharts、Matplotlib。