开发者社区> 阿里云MVP> 正文

基于阿里云大数据产品的重庆火锅数据分析实践案例

简介: 当一个外地人来到重庆时,可能就会想尝试一下重庆火锅的火辣,但是这时候他就会遇到去哪儿吃火锅、哪家火锅店评价高、火锅店的人均消费多少这些问题。因此这个时候他就需要一个能够系统的展示这些火锅店的各项数据排名等情况的数据门户。

一、项目背景
重庆作为中国名副其实的火锅之都,截至2016年5月,重庆市火锅店共计26,300家(含区县),火锅店零售额达221亿元,约占全市餐饮零售额的三分之一;直接从业人员接近500,000人,平均每30个人中,就有1人从事与火锅相关的行业;主城区火锅店密度高达17.65家/km2,平均每238米,就有1家火锅店……
当一个外地人来到重庆时,可能就会想尝试一下重庆火锅的火辣,但是这时候他就会遇到去哪儿吃火锅、哪家火锅店评价高、火锅店的人均消费多少这些问题。因此这个时候他就需要一个能够系统的展示这些火锅店的各项数据排名等情况的数据门户。

二、项目处理流程
1、数据爬取:
爬取大众点评、美团、口碑的重庆火锅相关数据。
2、数据预处理:
处理脏数据、缺失值、重复值。
3、数据分析:
通过阿里云数加平台对数据进行分析处理。
4、搭建推荐系:
利用前端开发技术和结巴分词等库来根据用户输入需求定制店铺推荐。

三、项目难点
1、各个数据爬取网站的反爬机制,在爬取数据时会浪费大量时间。
2、网站数据量展现不足带来数据量偏小的问题,不能展现全重庆的所有火锅店的数据分析报告。
3、项目实训时间较短,店铺推荐系统的整体设计比较粗糙,不够美观。

**四、项目结果及可视化呈现
**
1、店铺分布
image.png
2、人均消费
image.png
3、人气指数
image.png
4、综合评分
image.png
5、店铺推荐
image.png

版权声明:本文中所有内容均属于阿里云开发者社区所有,任何媒体、网站或个人未经阿里云开发者社区协议授权不得转载、链接、转贴或以其他方式复制发布/发表。申请授权请邮件developerteam@list.alibaba-inc.com,已获得阿里云开发者社区协议授权的媒体、网站,在转载使用时必须注明"稿件来源:阿里云开发者社区,原文作者姓名",违者本社区将依法追究责任。 如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件至:developer2020@service.aliyun.com 进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
+ 订阅

阿里云最有价值专家,是专注于帮助他人充分了解和使用阿里云技术的意见领袖。

官方博客
官网链接