虎嗅:四年覆盖9成互联网企业中高层的网站架构演变

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
对象存储 OSS,20GB 3个月
简介: 本期大咖秀的分享嘉宾是虎嗅网联合创始人韩祖利老师,韩老师和阿里云资深架构师江南一起为大家分享了他们的上云实践。

直播视频:

                

                                                               (点击图片观看)

 幻灯片下载地址:https://oss-cn-hangzhou.aliyuncs.com/yqfiles/638c6edabb06d539f82d34539613ecaf.pdf

                                                     

在本次直播的开场,主持人阿里云架构师江南简单回顾了三月份阿里云组织的8场大咖秀直播活动。云栖社区3月份的大咖秀邀请到了游族网络,驴妈妈,小咖秀,空格,涂鸦科技,美柚,有货,微博等8位阿里云客户与阿里云资深架构师们一起分享他们的上云实战。往期视频及文字回顾 本期大咖秀邀请到了虎嗅网联合创始人韩祖利老师。

 

虎嗅网架构演进

 

技术架构演变:从单机到多机,系统不断解耦,架构不断完善,阿里云一路相伴


                
 

在最开始的时候,虎嗅的业务形态不是十分确定,整体访问量也不是太大,最初只使用单机,选择了阿里云ECS的低配机器。但是随着业务发展,虎嗅发现注册用户和每天需要发送的邮件越来越多,发送邮件问题成为了瓶颈。所以后来开始将Mail网关从原有系统中独立出来,再到后来网站的访问量越来越大,业务的压力也与日俱增,整体的产品逻辑也越来越复杂。导致数据库的压力越来越大,于是虎嗅网从原本的单机中将数据库独立出来,后来又将图片的服务器独立出来。


图片独立两个主要原因:

  • 第一:整个业务的压力不断变大,未来单机的ECS可能会变为多机,而多机则会存在静态资源同步的问题,所以提前将图片业务剥离出来。
  • 第二:就是随着业务的发展,虎嗅的各个平台对于所使用的图片资源的尺寸大小品质等都有不同的要求。

将图片服务器独立出来,可以解决这些问题。在韩老师分享了将图片服务器独立的一些经验之后又接着谈一些虎嗅网关于图片存储方面观点


图片存储的主要几个作用:


                
 

  • 裁剪:将图片内容分发到Web端和APP,同一张图用到的尺寸,对品质的要求都不一样,需要通过对图片等剪裁实现全能缩放、品质调整等功能,
  • 加速:对于用户而言,网页的响应速度非常重要,将图片服务器独立出来能将CDN直接挂到图片上,这样客户访问就会非常快。
  • 分发:当CDN发生故障或者线路发生故障时荣造成网站访问都到影响。虎嗅选择了使用多个CDN,当一个线路出现问题,将会快速切换线路,保证用户无感知。当用户或者编辑想向图片存储服务器上传图片时,服务器会自动同步到几个CDN上去,同步可以保证快速切换,并且起到数据冗余的作用。
  • 外图缓存:对于虎嗅这样的类似轻社区的公司而言,有时候不可避免要应用外部图片,而外部图片往往因为外部网站不希望占用其带宽,而使用使用防盗链,这样会导致外部图片不稳定,导致无图或者加载缓慢。虎嗅网采取的策略是自动缓存下载外图到本地服务器上。

因为当时虎嗅网开始研发图片存储技术的时间比较早,所以并没有使用阿里云的OSS系统,当时的图片存储系统属于使用ECS自建系统。


主持人江南在这里谈到:不仅是对图片的使用,还有裁剪等一系列要求,是当时虎嗅自建图片存储的原因。其实随着阿里云产品的不断演进,从架构上更建议用户将像图片这样的静态资源存储到阿里云的开放存储服务OSS系统;另外从成本上看,自建的存储往往是在云端购买ECS 配套的云盘,这个价格和OSS的价格相比几乎要相差一倍以上。韩老师也讲到,虎嗅对图片的存储还有一定的需求,这个对目前阿里云的很多用户而言都是常见的一个场景,阿里云OSS就针对于媒体提供了一些额外的服务,比如在图片这方面,阿里云OSS系统就可以对上传的图片进行像修图,添加水印这一类的操作,而用户在访问这些图片时只需要在其URL后加上一个样式的字符串,这时得到的图片就是经过裁剪或者是添加水印之后的图片资源。阿里云OSS不仅能将图片存储到服务器上,还能对图片进行一系列的处理。而且客户在调用这些处理时和其他的方式不同,用户只需要像访问网页那样发送一个URL,就可以得到处理后的图片。


除了对图片资源的存储处理以外,江南还建议虎嗅网的视频类资源也参考阿里云OSS及相关的一些服务,因为OSS上存储视频资源是可以和阿里云的媒体转码服务MPS产品直接互通,互通之后就可以对上传到OSS的视频自动调用用户事先定义好的MTS模板对其进行媒体处理,包括转码、截图、打水印、剪辑、按分辨率缩放,这些处理都能很方便地完成。这样在云上的用户,在今后遇到类似场景时就不必自己搭建应用服务系统来处理这些媒体数据资源。


韩祖利老师也非常认同江南的观点,韩老师认为当时虎嗅在自建图片存储时还没有这么完善阿里云OSS系统,如果当时能够使用OSS系统,虎嗅网的整个开发周期和成本将会降低很多。


图片服务器独立之后,虎嗅网又将像JS,CSS这样的静态资源独立出来,以便提高整体响应速度,业务量不断上升 系统压力也越来越大。于是虎嗅将单机ECS横向扩展成为多机的ECS来做计算。多机计算采用阿里的SLB来做多机前端的负载均衡,但是这是虎嗅发现计算问题解决了,但是数据库又面临巨大压力,于是采取在中间加入了缓存的策略,虎嗅在众多的缓存方式中选择了简单的MemCache。

 

主动式缓存管理:


                
 

在缓存管理方面,主动式缓存管理分为了两大部分,一部分是业务缓存,另一部分是基础数据缓存。


所谓业务缓存是指将基础数据经过业务处理缓存起来,举个例子比方说用户在访问虎嗅网的首页,这时候其实用户打开首页的过程需要系统数据库对十几张表进行查询,然后将整个数据处理整合之后再展现给用户。由于这个过程先是访问数据库,之后计算再去组合,导致过程比较长。所以虎嗅网将用户查询的数据先缓存起来,当其他用户再次访问相同内容时就无需等待过长的时间,这样整体上减少了CPU的计算量,包括后端服务器的查询量,用户等待的时间就比较短,用户体验上就会感觉非常快。


虎嗅网的缓存的管理还是采用了相对比较一般的方式,使用了map式的管理方式。其实对于缓存暂时没有更好的实现方式,所以使用map式的管理做了联动。当页面涉及的数据发生变化时,缓存会主动去清理那些无效的数据。


缓存管理的另外一个方面就是基础数据的缓存,基础数据缓存从某些角度来讲其实就是数据库某些基础数据的映射,当用户去读取某一个数据的时候,系统会将用户读取的数据全部缓存起来,当表中发生数据变化的时候,系统会主动清理掉之前对该数据查询的缓存。这是通过把整个MVC的Model层改造的方式实现的。这样成本降低了,而且仅对于写Model部分的工程师来讲会麻烦一点,而对于写业务逻辑的工程师而言则是感觉不到的。这样做的好处在于极大地降低了数据库的压力,提高了整个网站的响应速度。


在分享完关于缓存方面的经验,韩老师又接着和大家分享虎嗅网的架构演变,随着业务的不断发展,访问量越来越大,并且知名度也越来越高。虎嗅网也遇到了安全性问题,一个是最直接的攻击,比如DDos,CC还有一些暴力破解,跟踪扫描等。后来增加了防火墙并且使用的是阿里的高防服务。虎嗅经常会用到高达为几十个G的即时量,对于像虎嗅这样的创业公司或者是以轻模式运行的公司来讲,几十个G带宽的采购成本是非常高的,选用高防服务之后,整体的成本就会显得非常低了。对于一些CC的攻击,虎嗅的负载均衡使用了阿里云RDS服务。使用了高防服务之后就无需太过关心这些问题,攻击存不存在对网站而言影响不大。而且在受到攻击时,用户是感知不到的。对于网站工程师来讲则会收到通知,系统的压力也会有所上升,但是不至于使系统崩溃。

 

除了安全问题以外,还有一个问题就是垃圾,大家都知道,当网站影响力越来越大的时候,一些恶意用户就会希望发一些广告和垃圾信息。虎嗅网最初采用了一套非常严格的垃圾过滤系统,从内容到行为去过滤信息。但是后来发现,当这样的垃圾过滤规则越来越严格的时候,对用户的友好性就越来越差。但是如果不严格就又过滤不掉,所以后来接入了阿里云的反欺诈系统。这样当用户着陆到虎嗅的网页的时候,系统就可以得到当前用户的一个评分,由此判断用户的信用等级是良好还是其他,如果信用等级是良好,系统在后端就会减少垃圾过滤系统对用户的限制。但是对于信用评分特别低的用户,也就是说存在风险的用户,对于他们发的内容就会先进行审后发。再有就是对这样用户的行为进行判断,如果用户发布很多内容是重复的,或者行为像一个机器人,系统就会去跟踪其行为。如果说反映给系统的评分是风险,可能就会直接拒绝这样的用户。

 

主此人江南提到虎嗅也是反欺诈服务的典型用户,如果用户自己构建一个这样的评分过滤系统的话,因为底层用来支持的数据可能不足而容易造成“误杀”的情况,也会有很多“漏网”的情况。而阿里在安全方面的优势在于阿里云的安全产品包括其他的服务产品都是基于原有的海量数据信息,这些数据信息有的可能是来自阿里集团内部的业务系统,因为阿里集团本身内部的业务线也非常完整,非常庞大,我们十几年来接了大量的终端用户,对他们的行为可以说是心里有数。另外我们当然也会从互联网上利用我们的技术获取到一些行为分析的结论,动用这些结论加在一起形成一个庞大的知识库,支持我们像在垃圾过滤,反欺诈这样的一些应用场景内的一些安全的服务。

 

现在阿里的反欺诈产品现在已经成为阿里云云盾产品的一部分,阿里云也以很多不同的模式输出给用户去使用反欺诈的能力,像刚才韩总介绍的拿到一个用户之后,系统可以通过用户的基础信息,对其风险进行核实,判断其是否存在欺诈风险以及风险的程度,这就是云盾的反欺诈产品提供的一项服务。在这个服务的过程中,服务器端也就是业务端就可以根据返回的用户评分的结果去控制下一步业务执行应该往哪一个流程上走,在往流程上走的时候应该给与用户多大的权限。

 

此外在反欺诈方面,还有一些针对于风险识别,风险拦截这两个场景下的一些服务的模式。在风险识别这边,可以根据用户在客户端页面上提交上来的一些行为数据,通过反欺诈服务器对其进行分析,最后得到一个经过分析的风险识别结果,当业务系统调用这个风险识别结果的时候,就会判断出该用户是可疑还是存在风险,进而指导后续的业务流程走向。像这样的风险识别对于一些防营销作弊,薅羊毛这种行为,包括在支付过程中给予的一些保护,还包括在论坛上进行一些类似灌水,发垃圾信息,发违规信息这些场景的处理来说,都能起到非常好的作用。

 

另外像刚才提到的像风险拦截,现在大家在登录淘宝的时候,可能发现,原来传统的图片验证码的方式已经变成了滑块的方式,这其实也是风险拦截提供的一种服务方式,它通过滑块的这个过程对用户进行一个简单的判定,如果判定访问用户可信的话,会颁发一个可信签名的串,后续使用这个串进行登录等一系列操作,这样配合前端有效地控制风险。这样对于防止垃圾注册、恶意登录,像刷库撞库这些行为也都是非常有好处的。所以整体上来看呢,阿里云基于庞大的数据资源和强大的安全体系的技术的能力为像虎嗅这样的用户提供反欺诈的服务。

 

实际上像这样的服务使用由海量数据支持的云服务的优势还是比较明显的,如果说自建的话还是非常困难的。


在搜索方面,随着虎嗅网用户量的不断上升,搜索的量也变得非常大。搜索也会对系统造成非常大的压力,之前虎嗅网维护着一套非常大的搜索系统,但是发现不如使用阿里云的OpenSearch的服务,在使用之后发现,使用阿里云的OpenSearch服务能让网站集中精力关注的自身业务,整个系统不用自己去维护,虎嗅在对系统进行不断解耦的过程中也把评论系统,包括数据统计系统等都完全独立出来。因为评论量比较大,将评论系统从原系统中解耦出来,使得评论的页面的响应速度大大加快。

 

架构思想

                
 

总结虎嗅整个架构思想,从一开始到现在始终贯穿的就是解耦的思想。当你的业务不是非常稳定时,系统一定会存在巨大的变化,可能今天是这样,明天就会变一个样子,变化速度非常快。如果整个系统全部耦合在一起,就容易造成混乱,所以尽量去解耦。


另外一点就是保持简单的结构,简单的结构给系统带来的好处就是能够使维护非常轻松。网站的维护成本以及开发人员的成本都会极大地降低。


第三个就是尽量使用云服务,这样可以整个地去减少维护成本。我们经常会遇到这样的情况,比如在公司里面,看到某些系统的维护成本比其开发成本要高很多,但是当使用云服务这些非业务核心的服务或者系统的时候,几乎不需要自己去维护,对成本的降低是非常可观的。

 

虎嗅为什么选择阿里云呢?


                
 

其实阿里云的优势非常之多,第一是极大降低系统自建时间和人力成本。第二是系统集成非常的简单和高效。阿里云的优势之三在于健全的配套基础服务,虎嗅网的专职运维人员基本为零,也就是说使用阿里云相当于拥有了一个有强大技术支持的大型外包的运维团队。这样可以使我们专注于研发部分,在需要的时候就去购买相应的云服务。再一个优势就是阿里云的服务的系统的数据是互通的。当你使用OpenSearch,你不需要自己同步数据,只需要进行简单的设置就可以将数据同步到RDS上过去。

 

江南也谈到其实在阿里云设计之初就认为在阿里云生态内部的所有产品之间应该存在天然的数据互通和协作,像前面谈到OSS上存储的视频服务能直接和阿里云上的一个视频转码服务直接互通,这就是一个例子。除此这外,还有像韩老师刚才提到的OpenSearch和RDS这两个产品是天然互通的。其实更多的像阿里云有很多大数据类的产品或者数据仓库类的产品,它和阿里云经典的云产品之间也是存在着天然的互通性。因为我们现在看到,用户使用阿里云的基础云资源搭建自身的业务系统,这些业务系统必然会产生日常运营的业务数据,这些日常运营数据就可以天然地通过阿里云内部的互通灌入到一些像大数据的数据仓库里面去。

 

如果像虎嗅有一些未来数据分析的业务需求的话,这个产品之间的互通将会变得非常简单,几乎可以一键式完成。我们也能看到,阿里云的一些用户可能不是将全部的数据放在云上,有一些数据是存储到自己的一些IDC或者自建的机房里面,这样如果他们的数据产生在云端,那么就需要每天将这些数据先下载到本地再进行一定的处理,这个过程中不仅产生了大量的公网流量费用,而且对于网络带宽占用造成网络延迟,将原本可以进行实时分析的系统变成了一个只能够离线进行数据分析的系统,这可能对业务层面造成影响。

 

从这个角度讲,阿里云和其他云服务厂商比较大的区别就是我们提供了一个非常完善的产品线,用户想做的很多业务都可以在阿里云上找到合适的云产品加以解决,并且这些云产品之间拥有非常良好的互通性。这就比其他的一些云服务提供商所谓的能在某一点上提供服务要更占据优势。


韩老师表示,他们在网站开发运维过程中也有感受,虎嗅网也在进行一些大数据的尝试,在内部建立系统时总结时发现最大的困难是数据的同步问题,后来发现阿里云的数据互通优势就足以解决所遇到的问题。



关于虎嗅


虎嗅网是一个用户可以参与的商业资讯与观点交流平台,看起来更像是资讯与轻社区的结合,核心是关注互联网与移动互联网公司的起轨迹,产业潮汐的动力与趋势,以及互联网与移动互联网如何改造传统行业。虎嗅网对自己的定义是一家互联网公司,目标是聚合幼稚的创新信息人群


相关系列文章:


相关文章
|
1月前
|
运维 Cloud Native 持续交付
深入理解云原生架构及其在现代企业中的应用
随着数字化转型的浪潮席卷全球,企业正面临着前所未有的挑战与机遇。云计算技术的迅猛发展,特别是云原生架构的兴起,正在重塑企业的IT基础设施和软件开发模式。本文将深入探讨云原生的核心概念、关键技术以及如何在企业中实施云原生策略,以实现更高效的资源利用和更快的市场响应速度。通过分析云原生架构的优势和面临的挑战,我们将揭示它如何助力企业在激烈的市场竞争中保持领先地位。
|
20天前
|
监控 数据可视化 架构师
为什么企业需要开展架构治理?
随着数字化转型加速,企业面临的技术和业务环境日益复杂,传统架构难以应对快速变化的需求。企业架构治理成为数字化转型的关键,通过确保技术与战略对接、优化资源利用、降低风险和复杂性,提升企业灵活性、效率和创新能力,支持快速响应市场变化,推动数字化转型成功。
87 7
为什么企业需要开展架构治理?
|
20天前
|
监控 数据可视化
如何通过建模工具实现企业架构治理全流程管理
企业架构治理工具通过构建统一的架构语言、可视化建模、流程管理、资源整合和多场景分析,实现企业架构的全生命周期管理。该工具赋能企业数字化转型,确保业务、平台、数据及技术相互耦合闭环,提供从规划到决策的一站式服务,助力提升业务运营、优化组织管理和加速数字化建设。
38 2
如何通过建模工具实现企业架构治理全流程管理
|
6天前
|
人工智能 运维 监控
云卓越架构:企业稳定性架构体系和AI业务场景探秘
本次分享由阿里云智能集团公共云技术服务部上海零售技术服务高级经理路志华主讲,主题为“云卓越架构:企业稳定性架构体系和AI业务场景探秘”。内容涵盖四个部分:1) 稳定性架构设计,强调高可用、可扩展性、安全性和可维护性;2) 稳定性保障体系和应急体系的建立,确保快速响应和恢复;3) 重大活动时的稳定重宝策略,如大促或新业务上线;4) AI在企业中的应用场景,包括智能编码、知识库问答、创意广告生成等。通过这些内容,帮助企业在云计算环境中构建更加稳定和高效的架构,并探索AI技术带来的创新机会。
|
7天前
|
监控 架构师 安全
企业架构(EA)项目开发综合指南
企业架构(EA)是一种全面的方法,用于对齐企业的业务目标与其 IT 战略和资源。EA 涵盖了企业的各个层面,包括业务流程、信息流、应用系统和技术基础设施。本指南将详细探讨 EA 项目开发的关键步骤、[EA](https://www.visual-paradigm.com/features/enterprise-architecture-diagram-tool/) 与 TOGAF、ArchiMate 以及其他建模图(如 BPMN 和 UML)之间的关系,以及推荐 Visual Paradigm 作为 EA 团队的最佳解决方案。
39 3
|
21天前
|
弹性计算 负载均衡 安全
企业业务上云经典架构方案整体介绍
本次课程由阿里云产品经理晋侨分享,主题为企业业务上云经典架构。内容涵盖用户业务架构现状及挑战、阿里云业务托管经典架构设计、方案涉及的产品选型配置,以及业务初期如何低门槛使用。课程详细介绍了企业业务上云的全流程,帮助用户实现高可用、稳定、可扩展的云架构。
|
2月前
|
Cloud Native 持续交付 云计算
云原生架构:重塑企业IT的未来####
本文深入探讨了云原生架构的兴起背景、核心理念、技术优势以及在现代企业IT系统中的应用实践。云原生架构以其高度的灵活性、可扩展性和敏捷性,正逐步成为企业数字化转型的关键驱动力。通过容器化、微服务、持续集成/持续部署(CI/CD)等关键技术,云原生架构能够加速软件开发周期,提升系统稳定性和运维效率,为企业带来前所未有的商业价值。 ####
51 0
|
1月前
|
弹性计算 API 持续交付
后端服务架构的微服务化转型
本文旨在探讨后端服务从单体架构向微服务架构转型的过程,分析微服务架构的优势和面临的挑战。文章首先介绍单体架构的局限性,然后详细阐述微服务架构的核心概念及其在现代软件开发中的应用。通过对比两种架构,指出微服务化转型的必要性和实施策略。最后,讨论了微服务架构实施过程中可能遇到的问题及解决方案。
|
2月前
|
Cloud Native Devops 云计算
云计算的未来:云原生架构与微服务的革命####
【10月更文挑战第21天】 随着企业数字化转型的加速,云原生技术正迅速成为IT行业的新宠。本文深入探讨了云原生架构的核心理念、关键技术如容器化和微服务的优势,以及如何通过这些技术实现高效、灵活且可扩展的现代应用开发。我们将揭示云原生如何重塑软件开发流程,提升业务敏捷性,并探索其对企业IT架构的深远影响。 ####
53 3
|
2月前
|
Cloud Native 安全 数据安全/隐私保护
云原生架构下的微服务治理与挑战####
随着云计算技术的飞速发展,云原生架构以其高效、灵活、可扩展的特性成为现代企业IT架构的首选。本文聚焦于云原生环境下的微服务治理问题,探讨其在促进业务敏捷性的同时所面临的挑战及应对策略。通过分析微服务拆分、服务间通信、故障隔离与恢复等关键环节,本文旨在为读者提供一个关于如何在云原生环境中有效实施微服务治理的全面视角,助力企业在数字化转型的道路上稳健前行。 ####
下一篇
开通oss服务