云场景实践研究第1期:罗辑思维

简介: 罗辑思维是著名的知识服务商和运营商,随着品牌日积月累的沉淀,其跨年演讲和其相关业务需求不断增大。罗辑思维大量核心业务运行在阿里云,目前使用了阿里云ECS、CDN、OSS等20多款产品。

更多云场景实践研究案例,点击这里:【云场景实践研究合集】联合不是简单的加法,而是无限的生态,谁会是下一个独角兽

“非常感谢阿里倾囊相授双11成功经验,作为产品的用户很感动,你们服务非常贴切,彻底融入到我们团队了解我们的业务形态,给出很多有价值、切实际的建议,对我们帮助很大。”


——沈仁奎
罗辑思维技术负责人


罗辑思维大量核心业务运行在阿里云,目前团队使用了ECS、CDN、OSS、多款云数据库、负载均衡、容器服务、全链路压测PTS、Web应用防火墙、媒体转码、数据可视化等20多款产品。


采用阿里云的产品

  • 阿里云云服务器ECS
  • 阿里云内容分发网络CDN
  • 阿里云对象存储OSS
  • 阿里云数据库ApsaraDB
  • 阿里云负载均衡SLB
  • 阿里云容器服务Container Service
  • 阿里云性能测试PTS
  • 阿里云Web应用防火墙
  • 阿里云媒体处理ApsaraVideo for Media Processing
  • 阿里云DataV数据可视化
  • ......

为什么使用阿里云?

强有力的全链路压测

具备海量资源的弹性交付能力的ECS

分钟级一键部署和秒级海量容器启动的容器服务

一处构建,各处部署的CI/CD能力


关于 逻辑思维

罗辑思维是著名的知识服务商和运营商,有微信公众号、知识类音视频节目、知识服务得到App等产品。随着品牌日积月累的沉淀,其跨年演讲和其相关业务需求不断增大。

0b6e0bc8796457976ec0290058397448fec7f079


为什么选择阿里云?


全链路压测——技术大考前的必备演习
全链路压测是应战业务大促不可缺少的关键技术,这是阿里历年备战双11的利器,在此次罗辑思维备战中它同样被应用得淋漓尽致。通过全链路压测规划跨年期间的系统容量,确定基准吞吐量和扩容缩容策略,找到特定场景下集群服务器配比和集群的短板,对于压测中发现的问题及时调整。相比于经验判断和一般意义上的线上压测,全链路压测与业务场景更紧密相连,找到不同业务场景下的临界峰值,计算出每个业务应用的数量值,由点及线、由线及面从而获得整体情况;通过性能测试服务PTS(Performance TestingService)编排全局业务场景和构造真实业务流量,达到让业务和技术架构提前经历业务洪峰的检验,确保跨年活动和日常核心服务的稳定性和健壮性。

罗辑思维的全链路压测接口愈200个,整体覆盖率超过50%,囊括了其得到APP和其独立电商平台的所有核心业务。在不到三个月的时间内,罗辑思维和阿里云PTS团队一共进行了大大小小愈七百次的单链路压测、十六轮完整形态全链路压测,压测所耗费的资源相当于一百多万用户一同测试两个多小时。为了不影响到罗辑思维用户的体验,其中一些全链路压测都是在半夜和凌晨进行的。由于压测范围广,其发现问题能力和提升效果也相当显著。压测先后总计发现数百问题,经过逐一排查,压测目标的几乎所有主要后端服务的业务系统都被优化改造。举例说明,在压测中发现node侧应用CPU飙升的瓶颈,通过接入阿里Node.js性能平台,定位、分析异常并解决应用核心错误。经过技术人员们的不懈努力,系统吞吐能力提升上百倍。

ECS在手——资源呼风唤雨
在传统的基于IDC搭建业务情况下,必不可少的担心就是业务发展受制于固定且有限的资源。如果资源储备过多,那么在日常平峰或流量低谷时,就会造成巨大的资源浪费;可是如果资源准备不充分,在流量高峰时,又影响到用户体验。云计算时代,弹性计算是首要优势。罗辑思维选用了阿里云ECS,该产品具备海量资源的弹性交付能力,可以保证在一分钟内创建出近1000台云服务器。

罗辑思维日常情况下按照一定比例选用包年月和按量的两种服务器付费方式,在此次跨年演讲中增大了按量计费的服务器用量,峰值时该种服务器达1000+台,大大降低了计算资源成本和前期筹划准备成本。除去成本之外,更重要的是使用效果和体验。从计算性能稳定性而言,通常情况下,整体的ECS业务可靠性比线下物理机可靠性有大幅提升(99.95%业务可用性保证);若搭配高性能SSD云盘,则相当于数据可靠性和业务可用性双重保险,这也是罗辑思维此次的选择。另外,ECS提供丰富的企业级实例,罗辑思维选用了最新一代基于skylake处理器、25G网络的企业级实例、大数据分析的D1型实例、高性能数据库I2型实例等,在性能和成本上都很出色地满足了需求。

容器服务——撑起电商百倍高峰
在刚刚结束的跨年夜里,罗辑思维的电商业务售卖了数万件商品,其中单价为6.4W的积家手表一秒售罄。电商背后是怎样的技术支撑呢?容器技术的出现,使得软件从复杂的交付及运维中解放出来。

罗辑思维此次的电商业务依托于阿里云容器服务,通过分钟级一键部署和秒级海量容器启动,实现秒级的应用架构伸缩和一站式应用生命周期管理,不仅提高了系统资源利用率,降低了整体成本,而且简化了应用的管理及运维。同时容器服务整合阿里云能力,提供集成的实现无关的容器应用存储、负载均衡、高可用、监控及日志管理,极大的简化分布式应用的管理及运维工作。在业务高峰突然来临之时,容器服务提供应用容器及集群资源二级的自动弹性伸缩,从容应对高峰流量。在罗辑思维此次大促的电商准备阶段,在容器服务的支持和优化下,系统压测能力提升十倍。此次电商销售活动圆满完成,集群资源状况平稳、极小波动,支撑了较平时百倍压力的高峰流量。一些具体的优化有:针对跨年活动大流量场景,进行系统架构优化,针对场景进行网络参数优化;开启多核模式防止单核跑满;注意调配资源使用的策略,相关应用实现自动扩缩容;关注集群节点数、应用的实例数量配比等等。


DevOps——一处构建,各处部署
众所周知,软件的构建、打包和部署是发布中的关键步骤,企业级开发者往往需要依赖Make、Ant、Maven等一系列工具才能完成源代码的编译和链接;而多编程语言和分布式开发则无疑加大了项目构建管理难度。除了对业务服务高可用及平台管理的支持,容器服务预置DevOps能力:覆盖应用从构建到交付到运维的整个生命周期,提供多种应用发布方式和持续交付能力,支持容器持续集成及交付最佳实践,支持阿里云及开源CI/CD方案并提供工具链整合。

工程师们将应用打包成Docker镜像并共享发布到阿里云镜像服务中,这取代了传统的程序的分发及环境安装配置,Docker镜像使得开发、测试和生产环境的配置变得简单而高效,“一处构建,各处部署”。同时,通过编排模板,可以把一个应用的外部依赖、服务之间的关联,全部变成可追踪的代码;并且对版本管理进行更好的管控,以便快速上线和回滚。通过编排、和应用无关的不间断发布、蓝绿发布等发布策略的支持,极大提高了线上应用的高可用,降低了发布风险,提高业务系统的迭代速度。


关于罗辑思维的更多实践详情:罗振宇跨年演讲之夜 阿里云护航得到App

原文发布日期:2018-01-02

云栖社区场景研究小组成员:贾子甲,仲浩。

相关实践学习
使用ACS算力快速搭建生成式会话应用
阿里云容器计算服务 ACS(Container Compute Service)以Kubernetes为使用界面,采用Serverless形态提供弹性的算力资源,使您轻松高效运行容器应用。本文将指导您如何通过ACS控制台及ACS集群证书在ACS集群中快速部署并公开一个容器化生成式AI会话应用,并监控应用的运行情况。
深入解析Docker容器化技术
Docker是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的Linux机器上,也可以实现虚拟化,容器是完全使用沙箱机制,相互之间不会有任何接口。Docker是世界领先的软件容器平台。开发人员利用Docker可以消除协作编码时“在我的机器上可正常工作”的问题。运维人员利用Docker可以在隔离容器中并行运行和管理应用,获得更好的计算密度。企业利用Docker可以构建敏捷的软件交付管道,以更快的速度、更高的安全性和可靠的信誉为Linux和Windows Server应用发布新功能。 在本套课程中,我们将全面的讲解Docker技术栈,从环境安装到容器、镜像操作以及生产环境如何部署开发的微服务应用。本课程由黑马程序员提供。     相关的阿里云产品:容器服务 ACK 容器服务 Kubernetes 版(简称 ACK)提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力,打造云端最佳容器化应用运行环境。 了解产品详情: https://www.aliyun.com/product/kubernetes
相关文章
|
数据采集 前端开发
突破技术限制:使用 request-promise 库进行美团数据获取
本文展示了如何用`request-promise`爬取美团数据,重点是通过代理IP避免封禁。安装库后,配置含代理的请求选项,如`proxy`, `auth`和`headers`,并用`cheerio`解析HTML获取餐厅菜单。通过代理服务可以提高爬虫效率。
764 0
突破技术限制:使用 request-promise 库进行美团数据获取
|
iOS开发
iOS - QRCode 二维码
1、QRCode 在 iOS7 以前,在 iOS 中实现二维码和条形码扫描,我们所知的有,两大开源组件 ZBar 与 ZXing。iOS7 之后可以利用系统原生 API 生成二维码, iOS8 之后可以生成条形码, 系统默认生成的颜色是黑色。
3063 0
|
存储
73年前,香农已经给大模型发展埋下一颗种子
【7月更文挑战第13天】克劳德·香农1951年的论文《印刷英语的预测和熵》预示了大模型的未来。他探索了语言统计特性在预测下一个字母出现中的作用,开创性地计算了语言熵,为信息传输效率提供了评估手段。香农的工作虽限于英语和单个字母预测,但其思想为现代大模型的训练、评估和应用奠定了基础。[🔗](https://www.princeton.edu/~wbialek/rome/refs/shannon_51.pdf)**
201 9
2022年最新IDEA激活教程,亲测有效(免费分享IDEA激活码、IDEA注册码)
最近新换了电脑,IDEA需要重新激活,分享一下我的激活经验
37263 2
2022年最新IDEA激活教程,亲测有效(免费分享IDEA激活码、IDEA注册码)
|
存储 调度 块存储
十二年磨一剑:三代架构演进,打造高性能、低成本的块存储!
上周,全球计算机存储顶会USENIX FAST 2024 在美国加州圣克拉拉召开,继去年获得国内首个FAST最佳论文奖后,凭借在分布式块存储上的创新,阿里云新作再次斩获FAST大会最佳论文奖。这也是国内唯一一家连续两年获得FAST最佳论文奖的科技公司。
106800 105
|
机器学习/深度学习 存储 数据挖掘
基于YOLOv8深度学习的生活垃圾分类目标检测系统【python源码+Pyqt5界面+数据集+训练代码】目标检测
基于YOLOv8深度学习的生活垃圾分类目标检测系统【python源码+Pyqt5界面+数据集+训练代码】目标检测
|
Android开发 开发者
科普技术贴:个人开发者的那些赚钱方式
公众号:smart_android 作者:耿广龙|loonggg   移动互联网的火爆,衍生出了许多新兴的职业,比如:个人开发者,自媒体等等。还出现了许多所谓的互联网思维,反正就是带来了许多让人无法理解或者可以轻松赚钱的渠道。因为我是一名程序员,我今天就来谈谈个人开发者是如何来赚钱的。     其实最直接的方式无非就有两种,一种是接私活,一种是加广告。    
2968 0
|
SQL 分布式计算 数据库
离线数仓--大数据技术之DolphinScheduler
离线数仓--大数据技术之DolphinScheduler
1222 2
ArcGIS修改图层标签标注(Label)对应字段与内容的方法
ArcGIS修改图层标签标注(Label)对应字段与内容的方法
465 1