我们扒下了全网所有“年夜饭”菜谱,找到了最有年味的一道菜

简介: 我们扒下了全网所有“年夜饭”菜谱,找到了最有年味的一道菜

说起过年,最有仪式感的一道程序可能就是年夜饭了。

从远方风尘仆仆赶回来的一家人,围坐一起,觥筹交错,是每个中国人心中对“年”最深的印象。

但不同地区、不同的人对吃也有千百种看法。千滋百味是中国菜的特色,但中国的“年味”到底是怎样的?

回答这个问题似乎可以从数据分析上入手。去年,文摘菌通过几个美食网站,获取了所有带有“年夜饭”这一关键词的菜谱,然后做了一个数据分析小项目,得出了一些很有意思的结果,大家可以和今年餐桌上的年夜饭对照一下,看看有没有什么新变化。

在这些网站上,爬下的菜谱除了系统推荐,相当大的一部分内容是活生生的用户大厨们主动上传。

简单来说,爬取这些“年夜饭”菜谱的过程,就像走进了千万家的除夕夜一样。文摘菌看着这一桌桌“年夜饭”备好出锅,关于中国“年味”的印象也就大致成形了。

分析过程

首先,当然是写爬虫,为了保证年夜饭分析的多样性,文摘菌踩点挑选了几个常用的美食网站:豆果美食、天天美食、美食天下、香哈网、心食谱等等,爬下了相关数据

爬虫脚本使用Python的requests+BeautifulSoup+selenium三大库来完成。

由于手比较生,没实现全自动化,采用的是简单粗暴地按页爬方式。主要锁定了几个维度:菜名、用料、食材+数量搭配、其他(包含口味|工艺|耗时)、制作步骤、Tips、url。

requests和BeautifulSoup 用来提取页面上的美食信息,selenium 用来自动触发ajax刷新下一页。

因为数据量不多,所以这一次直接存在了txt文件里面,说实话,暂时用不到MySQL、Hadoop一类的东西了。

分析结果
大吉大利,除夕吃鸡!

先来看看,人们最喜欢吃的肉是什么呢?我们把食材中的肉类又做一次聚类,发现了如下事实:

可以看得出,鸡肉是除夕餐桌上不可撼动的存在,第二名猪肉的份额也不错,达到了18%,其次是鱼肉和虾。

似乎在多数中国人的印象里,猪肉才是除夕餐桌上的霸王,毕竟是猪年嘛。但是,就算加上其他类的中的排骨,五花肉等等,猪肉也打不赢鸡肉。

果然,大吉大利,还是得吃鸡!

萝卜香菜,各有所爱!

肉类看完了,那么除夕夜,中国人对于蔬菜的选择又是怎样的呢?

第一名,萝卜,小人参的称呼不是白得的。白萝卜、胡萝卜,好存放又百搭,必须是冬天中国人餐桌上常见菜式,而且领先优势明显,比第二名玉米高了13个百分点。

玉米排名第二,毕竟像玉米地瓜球这样的甜点也逐渐走向了餐桌。


让很多人又爱又恨的“香菜”也名列前茅,不吃香菜的同学们可能要大跌眼镜了。

盐、葱、姜是中国人最爱

再来看看调味料。

虽然对于豆腐脑的南北咸甜之争一直没有答案,但是到了大菜上,显然,中国人还是好咸口。

通过对调味料的聚类分析,我们可以看出,最受欢迎的调味品还是盐。其次是葱,姜。中国人对于提“味”的执念真的很深了。

(PS:同类词已经合并,例如糖和白糖,都算做糖。)

而其他材料,包括八角、香叶、桂皮这些比较小众了一些,用的也比较少,加起来一共占比10%。

一切“适量”

中国文化的“中庸之道”在年夜饭的菜谱中也体现的淋漓尽致。在描述调味料用量的时候,“适量”以超出第二名7倍的提及量,妥妥儿的排名第一。

虽然这个描述每次我看到都很头疼,适量到底是多少?这可能是困扰万千家庭的大难题。

“炒”它!

另一个比较好玩的数据是年夜饭最常用的烹饪技法。

文摘菌统计发现,年夜饭菜谱里接近20%的菜,都是用炒的方式烹饪的,而炒相对于炖和煮来说,所用的时间还是比较少的。

现在快节奏的生活方式,最直接的反映在了做饭上面image.gif

排名第二的分别是拌和煮。嗯,这个统计结果也还算合理,毕竟一桌丰盛的年夜饭,怎么能少的了凉拌黄瓜、拌土豆丝、拌三丝这些凉菜。

中国菜的技艺复杂,煎炒炸蒸焖煮烧,“千奇百怪”。还有许多叫不上名字的做法已经占比达到了16%。

最有年味的菜原来是它!

好了,分析完食材原料烹饪技法,现在是时候完全按照分析结果,来杜撰一道最富有年味的菜了:

嫩鸡半只,适量胡萝卜,香菜和葱和蒜,生姜以及适量的酱油,盐和醋。然后少量的八角,花椒,桂皮。

鸡冼净切块,加料酒腌制备用。将萝卜切好,锅中放油,倒入腌好的鸡块,加八角,花椒,桂皮炒至鸡肉变色后,有香味出来时,加酱油调色,盛出备用。

锅中留油,放葱、姜、红辣椒爆香,再放入萝卜片翻炒片刻,倒入炒好的鸡块,再加入盐。

最后放入蒜再倒放调好的水淀粉,再略炒几分钟,加点酱油调色,加味精调味装盘即可。

炒出来可能是这个样子:

准备上桌。



相关文章
|
监控 数据可视化 大数据
蚂蚁金服数据洞察分析平台DeepInsight:人人都是数据分析师
小蚂蚁说: 大数据时代,由数据驱动的用户行为分析、运营分析、业务分析无疑是最被关注的“热词”,尤其对于拥有海量数据的大中型企业来说,对数据的需求已远远超越了传统数据报表所能提供的范畴。如何运用自助式BI实现当代企业精细化运营,已成为企业运营管理的新课题。
7690 0
|
人工智能 自然语言处理 机器人
对话阿里云CIO蒋林泉:AI时代,企业如何做好智能化系统建设?
10月18日, InfoQ《C 位面对面》栏目邀请到阿里云CIO及aliyun.com负责人蒋林泉(花名:雁杨),就AI时代企业CIO的角色转变、企业智能化转型路径、AI落地实践与人才培养等主题展开了讨论。
|
数据采集 机器学习/深度学习 存储
性能调优指南:针对 DataLoader 的高级配置与优化
【8月更文第29天】在深度学习项目中,数据加载和预处理通常是瓶颈之一,特别是在处理大规模数据集时。PyTorch 的 `DataLoader` 提供了丰富的功能来加速这一过程,但默认设置往往不能满足所有场景下的最优性能。本文将介绍如何对 `DataLoader` 进行高级配置和优化,以提高数据加载速度,从而加快整体训练流程。
2126 0
|
存储 消息中间件 API
OpenStack基本介绍
OpenStack是开源的云计算管理平台,旨在提供简单部署、可扩展的IaaS解决方案。由NASA和Rackspace发起,支持多种云环境,包括Nova(计算)和Swift(存储)两大核心模块。OpenStack通过API集成不同服务,如身份验证、数据库和消息代理,允许用户通过Web界面、命令行或API访问。它得到了多个大公司的支持,并快速增长,有望成为Eucalyptus的替代品。
344 2
|
自然语言处理 数据可视化 数据挖掘
首批!瓴羊Quick BI完成中国信通院大模型驱动的智能数据分析工具专项测试
首批!瓴羊Quick BI完成中国信通院大模型驱动的智能数据分析工具专项测试
537 1
|
存储 缓存 安全
Linux系统内核面试题
Linux系统内核面试题
267 3
|
算法 Java 测试技术
卓越工程之如何做好Code Review
本文主要从我们为什么需要CR?CR面临哪些挑战?CR的最佳实践几个方面分析,希望可以给读者一些参考。
|
存储 前端开发 Java
农产品销售|助农惠农|基于Springboot实现农产品销售管理系统
农产品销售|助农惠农|基于Springboot实现农产品销售管理系统
473 3
|
移动开发 双11 Android开发
|
C# 容器
WPF技术之Expander控件
WPF Expander控件是一个可折叠展开的容器,它允许用户在需要时展开或折叠其内容。它提供了一种在图形界面中组织和隐藏信息的方式。
859 0