《泛娱乐行业技术服务白皮书》——三、泛娱乐典型业务架构与场景——3.1直播类泛娱乐——3.1.5 通用直播场景(2) https://developer.aliyun.com/article/1231101?groupCode=supportservice
从角色分工来看流程如下:
•CDN+OSS(对象存储)场景
在处于上云的初步阶段的客户,在此阶段架构师一般会为客户制定了定制化的业 务架构方案,部分客户的架构为CDN+OSS形式,其中还会用到OSS镜像回源技术回 源到某客户源站。在具体实践中,某些客户的运维部门提出上云的一切数据配置类操 作均由云厂商负责配置之类的需求,介于业界友商基本存在这种模式,为更好配合业 务人员的工作和加快某客户上量的节奏,所以在确认风险以及相关团队的支持下,
CDN+OSS方案中,关于OSS镜像回源域名是由厂商产研负责维护并进行配置, 具体涉及架构如下:
需求对接过程沉淀如下:
(1)某客户新增bucket时会提供对应的bucket名称,和回源的IP,技术服务侧 侧收集整理相关信息后,提产品需求单给OSS研发人员进行配置,OSS研发会给某客 户分配OSS镜像回源域名(此域名未备案,仅用于OSS的镜像回源域名解析),用以 解析某客户源站IP。
(2)配置完成后技术服务侧侧会测试镜像回源域名是否正常解析到了某客户的 源站IP地址,并观察CDN加速域名的回源状态码是否正常,同时同步某客户侧双向测 试确认,某客户侧确认无异常后,此配置需求正常交付。
3.1.5.3 活动重保方法论
3.1.5.3.1 全量监控
某客户域名出现多次5XX状态码异常波动,最终确认是某客户调度域下的节点集 群的设备性能较差,引起的多次5XX异常,因某客户目前处于上量阶段,为保障某客 户业务稳定运行,使用天眼哨兵系统主动监控某客户全量域名业务指标,优化措施如下:
(1)某客户调度域下更换硬件设备性能较优的节点,提升节点稳定性。此专项 优化为期1个月,已将设备性能节点较差的vcache节点全部剔除,并替换成设备性能 节点较优的imagehost的节点类型;
(2)目前某客户CDN域名分为大流量域名,小流量域名,未上量域名三个维度
设置不同的阈值进行监控;
(3)在钉钉告警群关注监控告警,根据告警排查原因;
(4)若告警属于偶发,未持续,且看各项业务指标均正常,可观察一段时间,
无需通知某客户;若告警一直持续,且判断已影响正常的业务,则主动告知某客户, 让某客户确认业务是否有异常,并配合某客户一起排查
《泛娱乐行业技术服务白皮书》——三、泛娱乐典型业务架构与场景——3.1直播类泛娱乐——3.1.5 通用直播场景(4) https://developer.aliyun.com/article/1231099?groupCode=supportservice