什么是 API?
概述应用编程接口(API)是一组用于构建和集成应用软件的定义和协议。API 的工作原理是什么?通过 API,您无需了解实施原理,也能将您的产品或服务与其他的互通。这样可以简化应用的开发,节省时间和成本。在您开发新的工具和产品,或管理现有工具和产品时,强大灵活的 API 可以帮助您简化设计、管理和使用,并带来更多创新机遇。API 有时被视为合同,而合同文本则代表了各方之间的协议:如果一方以特定方式发送远程请求,该协议规定了另一方的软件将如何做出响应。由于 API 简化了开发人员将新应用组件集成到现有基础架构中的方式,继而也对业务和 IT 团队之间的协作提供了帮助。随着数字市场日新月异,业务需求通常也会出现迅速变化,新的竞争对手利用新的应用即可改变整个行业。为了保持竞争力,支持快速开发和部署创新服务尤为重要。云原生应用开发是提高开发速度的一个明确办法,依赖于通过 API 连接 微服务应用架构。API 是通过云原生应用开发来连接您自己的基础架构的一个简化方式,此外还支持您向客户和其他外部用户分享您的数据。公共 API 有着独特的商业价值,因其可以简化和扩展您与合作伙伴的联系方式,并有望支持您从数据中实现盈利(Google Maps API 便是其中一个广为人知的案例)。例如,我们假设有这样一家图书发行公司:该发行商可以提供一个云应用,供书店店员查看书的库存情况。这款应用的开发成本高昂、有平台限制、开发周期较长,还需进行日常维护。或者,该发行商也可以提供一个 API 来查询库存情况。这一方法有以下几个好处:API 可以帮助他们将所有库存相关信息汇集到一处,供客户方便地访问数据。只要 API 的行为不发生变化,该图书发行商就能在不影响客户的情况下更改内部系统。借助公开可用的 API,开发人员可为该图书发行商、图书销售商或第三方开发一个应用,帮助客户查找所需的图书。这样不仅能提高销量,还能带来其他的商机。简而言之,API 既能让您开放自己的资源访问权限,又能确保安全性并让您继续握有控制权。如何以及向谁开放访问权限由您自己决定。API 安全防护离不开良好的 API 管理,其中包括对 API 网关的使用。借助整合各种资源(包括传统系统和物联网(IoT))的分布式整合平台,可以连接至 API 并创建使用 API 所提供的数据或功能的应用。API 发行政策私有这类 API 仅供内部使用,能让公司最大限度地控制自己的 API。合作伙伴您会和特定的业务合作伙伴共享这类 API。它能在不影响质量的情况下带来额外收益。公共这类 API 可供所有人使用。第三方可以使用这类 API 来开发应用,以便与您的 API 进行互动或实现某种创新。利用 API 实现创新通过向合作伙伴或公众提供您的 API,可以:创造新的收入渠道,或拓展现有收入渠道。扩大您的品牌覆盖范围。通过外部开发和协作,推动开放创新或提高效率。听上去还不错,对吗?但是,API 是如何做到上述几点的呢?我们继续以刚才的那个图书发行公司为例。假设该公司的某个合作伙伴开发了一个应用,可以帮助人们查找书店书架上的图书。这种体验的改进为书店带来了更多的客户(该发行商的客户),并拓展了现有的收入渠道。或许会有第三方使用某个公共 API 来开发应用,以便人们直接从该发行商处(而非书店)购书。这样就能为该图书发行商打开新的收入渠道。与特定合作伙伴或全世界共享 API 能带来积极的影响。除了自己公司的营销活动之外,每一个合作关系都能帮助您提高品牌辨识度。以公共 API 的形式向所有人开放技术,可以激励开发人员以您的 API 为中心构建应用生态系统。有更多的人使用您的技术,就意味着可能会有更多的人与您做生意。公开技术可以带来意外之喜。有时,这些惊喜更会颠覆整个行业。对于这家图书发行公司而言,新形态的公司(比如图书出借服务)可能会完全改变他们的业务模式。借助合作伙伴和公共 API,您可以激发社区成员的创意(其人数远超您的内部开发团队)。各种奇思妙想会源源不断地涌现,公司只需明辨市场的变化情况并做好相应的准备。API 大有用处。API 简史API 概念的出现,始于计算机时代的初期,远远早于个人电脑诞生之前。当时,API 常被当作操作系统的库,而且基本上都在本地系统上运行,仅偶尔用于大型机之间传递消息。将近 30 年后,API 走出了它们的本地环境。到了 21 世纪初,API 成为了用于实现数据远程集成的一种重要技术。远程 API远程 API 旨在通过通信网络进行互动。这里的远程是指 API 操控的资源不在提出请求的计算机上。由于互联网是应用最广泛的通信网络,所以大多数 API 都是基于 Web 标准来设计的。并非所有的远程 API 都是 Web API,但可以认为 Web API 都是远程 API。Web API 通常会使用 HTTP 来传输请求消息,并提供响应消息的结构定义。这些响应消息通常都会以 XML 或 JSON 文件的形式来提供。XML 和 JSON 都是首选格式,因为它们会以易于其他应用操纵的方式来呈现数据。SOAP VS REST随着 Web API 的不断普及,相应的协议规范也随之产生了,从而推动了信息交换的标准化:简单对象访问协议,简称 SOAP。使用 SOAP 设计的 API 会使用 XML 格式来收发消息,并通过 HTTP 或 SMTP 来接收请求。使用 SOAP 时,在不同环境中运行的应用或使用不同语言编写的应用能够更加轻松地共享信息。相关的规范还有一个,即表述性状态传递(REST)。遵循 REST 架构约束的 Web API 被称为 RESTful API。REST 与 SOAP 有着根本区别:SOAP 是一种协议,而 REST 是一种架构模式。这意味着 RESTful Web API 没有官方标准。正如 Roy Fielding 在论文"Architectural Styles and the Design of Network-based Software Architectures"(架构模式以及基于网络的软件架构的设计)中定义的那样,只要 API 符合 RESTful 系统的 6 个导向性约束,就算作 RESTful API:客户端/服务器架构:REST 架构由客户端、服务器和资源构成,通过 HTTP 来处理请求。无状态:请求所经过的服务器上不会存储任何客户端内容。与会话状态相关的信息会存储在客户端上。可缓存性:通过缓存,可免去客户端与服务器之间的某些交互。分层系统:客户端与服务器之间的交互可以通过额外的层来进行调解。这些层可以提供额外的功能,如负载均衡、共享缓存或安全防护。按需代码(可选):服务器可通过传输可执行代码来扩展客户端的功能。统一接口:这项约束是 RESTful API 的设计核心,共涵盖 4 个层面:识别请求中的资源:请求中的资源会被识别,并与返回给客户端的表示内容分离开来。通过不同的表示内容来操纵资源:客户端会收到表示不同资源的文件。这些表示内容必须提供足够的信息,以便执行修改或删除操作。自描述消息:返回给客户端的每个消息都包含充足的信息,用于指明客户端应该如何处理所收到的信息。将超媒体作为应用状态的引擎:在访问某个资源后,REST 客户端应该能够通过超链接来发现当前可用的所有其他操作。虽然看似有很多约束需要遵循,但是这些约束遵循起来要比遵循规定的协议容易得多。因此,RESTful API 现在变得比 SOAP 更为普及。近年来,OpenAPI 规范已发展成为定义 REST API 的通用标准。OpenAPI 为开发人员提供了一种与语言无关的方式来构建 REST API 接口,从而最大程度减少不确定的因素,让用户安心工作。另一个新兴的 API 标准是 GraphQL,这是一种可替代 REST 的查询语言和服务器端运行时。GraphQL 可优先让客户端准确地获得所需的数据,没有任何冗多余。作为 REST 的替代方案,GraphQL 允许开发人员构建相应的请求,从而通过单个 API 调用从多个数据源中提取数据。
逾百位开发者到场,超 2 万人线上观看!龙蜥社区开发者服务 devFree MeetUp 精彩回顾来啦
春末夏初,细雨漫漫,龙蜥社区迎来了首届开发者服务平台(devFree)线下 MeetUp。此次沙龙吸引了不少来自行业头部公司、机构的代表参与主题分享,现场更是有百余位业内的专家与开源技术爱好者、工程师参与了关于如何做好开源社区,如何通过基础设施为开源赋能的讨论。5 月 27 日,北京。濛濛细雨,挡不住开发者对技术的追求。来自阿里云、电子五所、中兴通讯|中兴新支点、浪潮信息、联通数科、统信软件、中科曙光、中科微润以及成都东软学院、中南大学等众多厂商及科研院所的 12 位专家和教授,分享了 12 场精彩主题演讲。线上超两万人观看并参与互动,现场近百家龙蜥社区的合作伙伴委派代表参与了关于开源基础设施的讨论,其中包括开放原子开源基金会、工信部电子一所、工信部电子五所、工信部电子四院、国内主流基础软硬件厂商,同时吸引了国际知名开源操作系统厂商。大家围绕着基础设施如何帮助开源社区可持续高质量发展,开发者服务平台如何帮助开发者进行价值提升,创意升级展开的多场次交流。最后在 MeetUp 现场,启动了龙蜥社区”众测共创“仪式。该计划专注于诚邀全球开发者打造国内一流的开源基础设施生态,共同为开源社区服务,共建开发者服务新范式,共创龙蜥未来! (图/现场嘉宾合影)(图/阿里云基础软件工程与效能团队负责人 石晓海)会议伊始,阿里云基础软件工程与效能团队负责人石晓海发表了开场致辞,首先对会议现场嘉宾以及线上热情参与的观众们表示了诚挚的感谢;其次分享了龙蜥社区基础设施现状及演进思路,重点介绍了龙蜥社区基础设施 3+6+3 模式(3 个基础底座体系、6 大能力支撑、3 种演进模式);最后结合龙蜥特色开源社区基础设施的建设理念,阐述了基础设施如何定义一个开源社区的运作形态、生态发展、以及开发者服务模式等思考。(图/龙蜥社区基础设施 SIG Maintainer 张永超)龙蜥社区基础设施 SIG Maintainer 张永超分享了《开发者服务平台 devFree 2.0 Overview》主题演讲,介绍了开发者服务平台的建设思路及现状,向现场嘉宾展示了开发者服务平台的全貌,共同探讨面向未来的开发者服务新范式以及思考。他表示开发者服务平台 devFree 2.0 致力于打造成业界最完备的开发者自助服务体系,让开发者的参与更简单、更高效,并希望能孵化出更多优秀的开源项目!最后,张永超宣布,开发者服务平台 devFree 2.0 正式发布,诚邀业内开发者参与共建!(图/工业和信息化部电子第五研究所软件与系统板块测评工具研发负责人 杨攀飞)工业和信息化部电子第五研究所软件与系统板块测评工具研发负责人杨攀飞做了《T-One: 全场景质量协同平台》精彩演讲。他从测评机构的角度为听众深刻剖析了软件质量测试的挑战、与龙蜥社区 T-One 的结识过程,并分享了 T-One 的核心能力以及下一步的参与计划。他表示后续会继续加强开放合作,继续探索质量保障基础设施技术方案,打造软件质量检测服务新范式!(图/中科曙光首席工程师、龙蜥社区 Cloud Kernel SIG 核心成员 段廷银)ABS 提供了免费、稳定、可靠、安全、可信的一键构建能力以及简单易用的编译构建环境,通过它可以高效完成 RPM 包、OS 镜像 、内核源码、云原生等构建任务。龙蜥社区 Cloud Kernel SIG 核心成员、中科曙光首席工程师段廷银分享了《龙蜥社区官方构建平台 ABS(Anolis Build Service)》。他说:”ABS 平台方便了我们在龙蜥 OS 上软件包的检索、构建,提高了客户及合作伙伴的业务支持效率,加速了我们衍生版操作系统的研发进程。未来 ABS 必将为更多的开发者赋能,助力 IT 信息系统等国家基础设施国产化。"(图/龙蜥社区 QA SIG Maintainer、联通数科的 CULinux 测试负责人 宋彦岭)龙蜥社区 QA SIG Maintainer、联通数科的 CULinux 测试负责人宋彦岭分享了《龙蜥 CI 服务,社区产品质量保障的第一道防线》。他详细介绍了覆盖内核、软件包、容器镜像、第三方 OOT 模块等多种类型代码仓库的 CI 机制。宋彦岭表示在社区提交的 PR,只要符合规范均可以通过 CI 机器人自动触发 CI 测试,通过 CI 机制可以提前暴露代码问题,提升研发效率,减少测试压力。(图/成都东软学院 施刚教授)龙蜥社区和成都东软学院合作已近一年,通过将龙蜥操作系统引入计算机相关专业核心课程中,有力推动了成都东软学院这些专业和课程的教学改革。成都东软学院的施刚教授在本次 MeetUp 上分享了《龙蜥操作系统和龙蜥实验室在高校计算机专业课中的应用与实践》。他表示“龙蜥实验室强大的能力以及便捷的使用方式极大提升了学生们的学习兴趣,简化了学生们的学习门槛。对高校计算机相关专业来说,国产操作系统龙蜥是学习和研究 Linux 和操作系统类课程非常优秀的对象。同时,龙蜥社区的龙蜥实验室更是为 Linux 的学习和实践提供了一个非常便捷的网络平台。希望更多的高校师生能投入龙蜥社区的大家庭,共同推动国产操作系统的进步!”(图/龙蜥社区 KeenTune SIG Maintainer 、统信软件研发工程师 李林杰)统信 UOS 研发团队在 2021 年 10 月 KeenTune SIG 创建之时,就已经开始参与项目共建,并且积极推动 KeenTune 在 UOS 的适配、应用以及场景落地。龙蜥社区 KeenTune SIG Maintainer 、统信软件研发工程师李林杰为大家带来了《KeenTune:统信 UOS 性能调优利器》的主题演讲。他介绍了 KeenTune 产品在 UOS 的龙蜥及 Ubuntu 版本的每一个演进上的适配和应用。简述了在业务场景的性能调优以及智能容量评估领域上达成的出色效果。也介绍了他和团队参与到 KeenTune 几项重要特定的研发:集群管控、keentuned 替换、环境资源探测等。另外,还分享了他作为开发者,主动且独立地为 KeenTune 提供的命令补全和 man 查询功能。最后,李林杰补充道:“在 KeenTune SIG 参与了整个产品的研发和演进,非常好的增强了团队凝聚力和个人能力,也很自豪为统信和龙蜥社区做出了自己的贡献。”(图/龙蜥漏洞管理负责人、阿里云技术专家 张世乐)安全漏洞管理是操作系统安全防护的重要组成部分。龙蜥漏洞管理负责人、阿里云技术专家张世乐,中科微澜闫志全做了《CVECenter 龙蜥漏洞管理体系》主题演讲。张世乐在演讲中向嘉宾介绍,龙蜥社区已基于 CVECenter 建立了全流程的安全漏洞管理体系,包含安全漏洞情报感知、威胁分析与风险评估、漏洞修复、安全公告发布全生命周期的管理流程。得益于 CVECenter 全生命周期、全流程自动化管理平台,大大地降低了龙蜥操作系统漏洞管理人力成本,处理效率提升超 80%,特别在内核漏洞管理自动化修复率超 40%,真正实现了降本增效。他强调道“龙蜥社区正积极开展社区安全合作,与多个安全组织及三方安全厂商在漏洞扫描与漏洞挖掘上展开合作,共建龙蜥安全生态!”(图/中科微澜 闫志全)在漏洞感知领域,由于漏洞基数庞大,漏洞获取途径复杂等原因,开源社区在进行漏洞感知需要较大的人力和资源成本。随后中科微澜闫志全介绍了 openBrain 开源漏洞感知系统,它是依托漏洞情报自动化获取、知识化与智能分析等技术而形成新型安全基础设施。目前也正在积极参与龙蜥社区合作,能够在降低人力投入的同时极大提升开源社区安全保障能力,解决漏洞管理过程中复杂棘手的问题,让漏洞管理变得轻松简单。(图/浪潮信息系统软件架构师 宋凯)浪潮信息系统软件架构师宋凯在分享中提到,浪潮信息作为龙蜥家族的一员积极参与龙蜥社区硬件兼容性、T-One 等 SIG 的建设,通过 T-One + Ancert + 自研的有效结合,实现了基于 Ancert 的硬件兼容性自动化测试平台,有效解决了浪潮信息在硬件兼容性测试过程中遇到的测试过程繁杂、测试工作量大等痛点问题。在浪潮信息龙蜥实验室中完成近百款硬件与龙蜥的兼容性认证,并联合阿里推出了《操作系统硬件兼容性标准》,可以说硕果累累。通过众测共创不仅解决了公司实际需求,也拓展了社区生态,实现了公司与社区的优势互补,探索出了合作共赢的新路径,宋凯也呼吁大家积极参与到众测共创的大潮中来。(图/龙蜥社区下一代质量技术 SIG Maintainer、中南大学特聘副教授 施鹤远)龙蜥社区下一代质量技术 SIG Maintainer 、中南大学特聘副教授施鹤远为大家带来了《开源社区与高校合作模式的探讨》主题分享。施鹤远教授结合自身科研实践经历,分享了高校科研团队与开源社区在科研工作、课程教学、学生培养等方面合作模式的思考,介绍了所在科研团队在开源社区需求导向科研、科研成果反哺开源社区、基于开源社区的产教融合等方面的研究思路与实践成果,并提出了开源社区对学生能力培养以及高质量就业方面的价值。(图/龙蜥社区 QA SIG Maintainer 苏庆明)龙蜥社区 QA SIG Maintainer 苏庆明介绍了《龙蜥社区众测共创指南》。龙蜥社区的质量保障体系依赖所有社区参与者的共同创建,在龙蜥 OS 各版本的发布过程中,已经有很多社区合作伙伴参与其中,包括统信软件、龙芯中科、联通数科、中科方德、红旗软件、万里红等合作单位和广大社区开源爱好者,为龙蜥 OS 的版本质量和软硬件生态贡献了自己的力量。苏庆明表示:“龙蜥社区的测试服务构建在开发者服务平台多个工具之上,具备高度自助服务能力,社区开源项目开发者,在提交代码的同时提交单元测试用例,在 PR 提交时,就会自动触发 CI 测试,将缺陷拦截在代码合入之前,有效降低问题修复成本。龙蜥社区众测共创是构建高质量社区产品的基石,欢迎广大开源爱好者加入!”(图/中兴通讯操作系统工具平台经理程圣宇)最后的合作讨论环节由龙蜥社区社区经理王劲男主持,本次讨论的话题聚焦社区技术合作。来自中兴通讯的操作系统工具平台经理程圣宇介绍了内存缺陷检测技术以及在中兴内部的工程应用实践,并表达了与龙蜥社区更加紧密合作的意愿。此工具可以紧密地与龙蜥社区的 CI 系统进行有效地结合,帮助开发者提前发现潜在的系统性安全风险。程圣宇表示“中兴通讯刚刚加入龙蜥社区不久,因此希望该工具后续能通过社区这个平台进行共建共创,发挥更大的社会价值!”现场反响热烈,多家单位表示要参与共建。(图/众测共创启动仪式)值得一提的是,在本次活动上,龙蜥社区社区经理王劲男邀请了阿里云基础软件工程与效能团队负责人石晓海,开放原子开源基金会常雨莎,工业和信息化部电子第五研究所软件与系统板块测评工具研发负责人杨攀飞,龙蜥社区 Cloud Kernel SIG 核心成员、中科曙光首席工程师段廷银,龙蜥社区 KeenTune SIG Maintainer 、统信软件研发工程师李林杰,龙蜥社区 QA SIG Maintainer、联通数科 CULinux 测试负责人宋彦岭,浪潮信息系统软件架构师宋凯和中兴通讯操作系统工具平台经理程圣宇上台,同现场嘉宾一起隆重发布了社区众测共创指南。 精彩一刻本次活动不仅有干货满满的开发者服务平台技术介绍,现场也准备了 demo 体验环节,嘉宾们可以直接体验开发者服务。现场几十位嘉宾参与体验,对社区进展表现出极大的兴趣,数位嘉宾表示后续会持续关注并参与社区工作。当然我们还准备了互动环节,大家都踊跃参与,现场氛围热闹非凡。近些年来开源社区在全球范围内迅速发展,全球开发者预计很快突破 1 亿人,同时国内就有 800 多万开发者。龙蜥社区自成立以来,汇聚了超过 300 家来自各厂商以及科研院所等覆盖操作系统全产业链的合作伙伴,同时开发者在短短两年多时间已经超过 2 万人。如何让开发者的参与更简单、更高效,如何通过开源社区孵化更多优秀的开源项目,是我们持续追求的目标,现诚邀业内开发者参与龙蜥、参与众测共创行动,打造一个高质量、繁荣的社区!本次沙龙,是一个新的起点也是一个新的征程。我们相信,在龙蜥社区合作伙伴的共同努力下,龙蜥社区一定能够创造出更加辉煌的成绩,为国内的开源事业发展注入更加强大的动力。在这里,让我们再次感谢所有参与和支持本次线下技术沙龙的同事和朋友,因为有你们的参与和分享,所以才让这个沙龙更加精彩,更加有意义。让我们共同期待下一次的聚会,一起探讨和分享更多的技术话题,共同成长和进步。感谢出席本次活动的嘉宾:常雨莎、张永超、杨攀飞、段廷银、宋彦岭、施刚教授、李林杰、张世乐、闫志全、宋凯、施鹤远教授、苏庆明、程圣宇。感谢为 MeetUp 组织活动付出巨大心血的运营委员们:蔡佳丽、孙林林、金美琴、袁艳桃、夏敏琪、崔开、张梦瑶。重点鸣谢本次活动的每一位志愿者:总协:刘寅,周絮签到处:冷益群,艾依琪视频&直播:李晔,谭伯龙摄影:王润哲,颜森道,黄睿技术演示:单凯伦,吴朝峰,孙飞宇,刘长生,吕飞,胡玉溪,陈宇翱另外,对于错过此次 MeetUp 的开发者,我们也将在近期安排在「龙蜥大讲堂」进行线上《基础设施》系列主题分享,感兴趣的小伙伴还请持续关注龙蜥公众号【OpenAnolis龙蜥】,留意后续的预告。—— 完 ——加入龙蜥社群加入微信群:添加社区助理-龙蜥社区小龙(微信:openanolis_assis),备注【龙蜥】与你同在;加入钉钉群:扫描下方钉钉群二维码。
带你读《2022技术人的百宝黑皮书》——第14个天猫双11,技术创新带来消费新体验(1)
作者:大淘宝技术出品:大淘宝技术“技术和商业是密不可分的,今年是第14届天猫双11,在过去的13年里,伴随着商业的快速发展,天猫淘宝的底层技术基础设施得到了深厚的积累,同时也支撑了云计算的大规模发展。未来,我们将通过持续的技术创新和突破,让商家更好的做生意,让用户享受更好买、好逛、好玩的线上体验。” 淘宝天猫CTO若海说。今年,聚焦“技术引领新消费”的方向,大淘宝技术团队在“好买、好逛、好玩”三大领域,围绕体验升级的目标,用技术创新不断探索数字时代下最理想的消费方式和生活方式。接下来小编带你了解今年双11在消费者“好买、好逛、好玩”,以及商家经营上的核心技术解读。淘宝天猫CTO 余刚(若海)好买,买得舒服又贴心淘宝购物车全新升级,云原生数据库Tair大规模应用今年淘宝购物车全新升级,实现了所有用户购物车容量扩充到300个商品,并能够实现购物车商品自定义分组、排序、置顶,让消费者选购商品更轻松、更便捷。在双11的场景下,做购物车的扩容和自定义管理,会带来非常复杂的挑战:例如购物车的加载时长变长、数据的存储成本增加,以及上下游的业务链路关系变更等。在此次购物车整体架构升级的背后,我们采用了阿里自研的高性能云原生内存数据库Tair,Tair拥有性能极高的读写速度,通过PUSH模式执行器和内联算子等最新实时处理技术对购物车场景进行优化。通过轻量化连接、异步投递技术,能够进一步支撑起超大连接数,使得Tair 单集群访问流量达100GB/秒,相当于每秒都可以下载两部蓝光电影。通过大连接、高吞吐的数据库Tair的支撑,购物车容量从120成功升级至300,且能够在拖动交互同时支持分组与加载数据行为,保障用户的流畅购物体验。此外,为了能在对用户放量新功能时,保证系统的稳定和体验不打折,我们建立起一套业务变更灰度染色的系统保障能力,能够有效实现淘宝APP新功能丝滑上线。
驻云联合阿里云打造Landing Zone解决方案,助力企业快速上云与高效运营
引言传统IDC理念方法论已无法满足企业业务快速发展的需求,迫切需要一套规划完整的顶层设计和IT治理框架,帮助企业提升运营效率与业务增长。驻云帮助企业基于先进的云上IT管理和治理体系,在深入适应阿里云的过程中,将阿里云的生态能力和企业IT管理战略相结合,助力企业规范上云、体系用云、全面管云。CloudCare介绍驻云作为国内阿里云首批Cloud MSP云管理服务商,秉承“守护每一个系统,成就每一个客户”发展使命,拥抱“成为数字时代社会不可或缺的企业”美好愿景,已成功助力金融、政府、教育、零售、酒店、制造、医疗健康等行业的4200多家企业和机构客户“云转型”,是云上数字化转型过程中可信赖的合作伙伴。驻云拥有百人规模的弹性云工程师团队,涵盖了云、网络、数据库、安全、Devops、容器等多个领域,为客户提供阿里云的咨询、迁移、实施、运维、安全等一站式云转型服务。CloudCare Landing Zone解决方案能力作为阿里云多年的使命级合作伙伴,驻云意识到越来越多企业在数字化转型与IT治理过程中面临各类的治理痛点和风险,故将阿里云Landing Zone管理框架与近十年项目实践相结合,推出了 CloudCare Landing Zone 服务,它集成了驻云自研产品与技术优势,可为客户提供灵活可定制的 Landing Zone 解决方案。一站式运维服务矩阵: 集合观测云-全链路可观测、Cloudlinker-运维审计、Clouddirector-数据指挥中心大屏、CloudAlpha统一监控告警、Cloudticket-统一事件平台为数字底座,采用标准化的运维流程保障客户云上业务稳定性。通过自动化数据采集、自动化运维诊断及资产数字化报告,为业务决策提供数据支撑。客户案例驻云与客户云事业部及安全团队深度合作,制定了整体的云上资源架构规划,包含云上混合云组网设计、云上安全合规基线制定、自动化巡检与IT标准化操作、不同供应商账号管理流程标准等,保障客户50+的应用上云,整体效率提高35%。此外,驻云成立了超过20人的企业专属专家团队,依靠自动化运维为底座,7X24小时故障响应,为客户业务稳定提供强有力的支撑。结束语未来,驻云将与阿里云携手合作,持续打造更多基于云上多样化业务场景的联合解决方案。驻云将基于在云基础架构、自动化运维、定制化云管平台、云原生应用、云上云下混合组网、制化云管平台等业务场景拥有丰富的最佳实践经验,帮助企业快速上云与高效运营,保障企业在云上业务稳定运行和长足发展。
带你读《2022技术人的百宝黑皮书》——第14个天猫双11,技术创新带来消费新体验(1)
作者:大淘宝技术出品:大淘宝技术“技术和商业是密不可分的,今年是第14届天猫双11,在过去的13年里,伴随着商业的快速发展,天猫淘宝的底层技术基础设施得到了深厚的积累,同时也支撑了云计算的大规模发展。未来,我们将通过持续的技术创新和突破,让商家更好的做生意,让用户享受更好买、好逛、好玩的线上体验。” 淘宝天猫CTO若海说。今年,聚焦“技术引领新消费”的方向,大淘宝技术团队在“好买、好逛、好玩”三大领域,围绕体验升级的目标,用技术创新不断探索数字时代下最理想的消费方式和生活方式。接下来小编带你了解今年双11在消费者“好买、好逛、好玩”,以及商家经营上的核心技术解读。淘宝天猫CTO 余刚(若海)好买,买得舒服又贴心淘宝购物车全新升级,云原生数据库Tair大规模应用今年淘宝购物车全新升级,实现了所有用户购物车容量扩充到300个商品,并能够实现购物车商品自定义分组、排序、置顶,让消费者选购商品更轻松、更便捷。在双11的场景下,做购物车的扩容和自定义管理,会带来非常复杂的挑战:例如购物车的加载时长变长、数据的存储成本增加,以及上下游的业务链路关系变更等。在此次购物车整体架构升级的背后,我们采用了阿里自研的高性能云原生内存数据库Tair,Tair拥有性能极高的读写速度,通过PUSH模式执行器和内联算子等最新实时处理技术对购物车场景进行优化。通过轻量化连接、异步投递技术,能够进一步支撑起超大连接数,使得Tair 单集群访问流量达100GB/秒,相当于每秒都可以下载两部蓝光电影。通过大连接、高吞吐的数据库Tair的支撑,购物车容量从120成功升级至300,且能够在拖动交互同时支持分组与加载数据行为,保障用户的流畅购物体验。此外,为了能在对用户放量新功能时,保证系统的稳定和体验不打折,我们建立起一套业务变更灰度染色的系统保障能力,能够有效实现淘宝APP新功能丝滑上线。
带你读《升舱 - 数据仓库升级交付标准白皮书》——6、附:数据仓库升级实施云上组件(下)
带你读《升舱 - 数据仓库升级交付标准白皮书》——6、附:数据仓库升级实施云上组件(上) https://developer.aliyun.com/article/1242443(3)SQL 兼容改造工具针对新旧数仓数据库的 SQL 语法进行兼容性改造,主要用于 ETL 作业脚本和数据库对象 DDL 脚本的改造工作,主要依赖阿里云数据库和应用迁移(AdvcancedDatabase and Appliction Migration,简称 ADAM)工具实现。该工具是阿里巴巴多年去 IOE 的方法论和经验的工具化成果,可以借助该工具自动化评估某传统数据仓库厂商到ADB PG在SQL语法、DDL转换方面的兼容点、不兼容点以及改造优化建议。(4)数据迁移同步工具数据迁移同步可采用阿里云迁移工具 DTS,支持传统数据仓库到阿里云数据库端到端的数据迁移工作。DTS 可以在两个数据源之间同步正在进行的数据变更。 数据同步通常用于OLTP 到OLAP 的数据传输。 数据同步包括以下两个阶段:1)同步初始化:DTS 将源数据库的存量数据加载到目标数据库。2)数据实时同步:DTS 同步正在进行的数据变更,并保持源数据库和目标数据库的同步数据迁移过程包括三个阶段,即结构迁移、全量数据迁移和增量数据迁移。 如果需要在迁移期间保持源数据库的正常运行,当您在配置迁移任务时,必须将结构迁移、全量数据迁移和增量数据迁移都选为所需的迁移类型。1)结构迁移:在迁移数据之前,DTS 需要在目标数据库中重新创建数据结构。 对于异构数据库之间的迁移,DTS 会解析源数据库的 DDL 代码,将代码转换成目标数据库的语法,然后在目标数据库中重新创建结构对象。2)全量数据迁移:在全量数据迁移阶段,DTS 会将源数据库的存量数据全部迁移到目标数据库。 源数据库保持运行状态,在迁移过程中仍不断进行数据更新。 DTS 使用增量数据读取模块来获取全量数据迁移过程中发生的数据更新。 当全量数据迁移开始时,增量数据读取模块将被激活。 在全量数据迁移阶段,增量数据会被解析、重新格式化并存储在本地 DTS 服务器上。3)增量数据迁移:当全量数据迁移完成后,DTS 会检索本地存储的增量数据,重新格式化,并将数据更新应用到目标数据库中。 此过程将持续下去,直到所有正在进行的数据变更都复制到目标数据库,并且源数据库和目标数据库完全同步。(5)数据稽核校验工具数据仓库动则数万张表,升级实施中经常要做数据迁移、ETL 测试,在迁移结束或测试数据时,需要频繁的做数据稽核比对,阿里云青天鉴就是一个支持多源异构数据源的数据校验工具,辅助我们做数据稽核时实现工具化、自动化,青天鉴功能示意图如下该数据稽核校验工具支持全量校验和指标校验两方面:1. 全量校验,即源端 A 表到目标端 B 表,所有记录完全一致,主要用于同构数据迁移的场景。2. 指标校验,即表数据量或内容计算结果一致性校验,即源端和目标端 count()、sum() 等聚合结果对比。尤其是大规模数据仓库迁移,字段比较非常耗时,需要在绝对准确性和效率上追求合理的时间成本和相对准确性。因此,指标校验主要适用于数据仓库迁移后源和目标数据库的数据量校验。数据仓库中常常统计业务含义的指标,青天鉴支持带 group by 的指标校验,即业务方指定的源端指含(一个或多个字段,group by条件作为 pk)和目标端指标(一个或多个字段,group by 条件作为 pk)对比。(6)批量调度运行平台DataWorks( 大 数 据 开 发 治 理 平 台) 是 阿 里 云 重 要 的 PaaS(Platform-as-a-Service)平台产品,提供数据集成、数据开发、数据地图、数据质量和数据服务等全方位的产品服务,一站式开发管理的界面,帮助企业专注于数据价值的挖掘和探索。DataWorks 支持多种计算和存储引擎服务,包括离线计算 MaxCompute、开源大数据引擎 E-MapReduce、实时计算(基于 Flink)、机器学习 PAI、云原生数据仓库AnalyticDB for PostgreSQL,云原生数据仓库 AnalyticDB for MySQL,并且支持用户自定义接入计算和存储服务。DataWorks 为您提供全链路智能大数据及 AI 开发和治理服务。在过程中,可以使用 DataWorks 进行数据源(如 MaxCompute)到 ADB PG 的数据传输、转换和集成。
带你读《升舱 - 数据仓库升级交付标准白皮书》——6、附:数据仓库升级实施云上组件(上)
附:数据仓库升级实施云上组件数据仓库升级是一个大型数据工程再造。除了需要有合适的云原生数据仓库承载某传统数据仓库厂商的业务外,还需要有周边丰富的生态工具来确保升级工作高效完成。该传统数仓厂商往往包含上万个作业,每个作业都涉及到大量的 SQL 语句,几百到上千行不等,同时新老数仓往往很难做到百分百的语法兼容,不能单纯靠人力解决。使用工具可以有效避免大量的重复动作,以下我们重点介绍围绕云原生数据仓库 ADB PG 进行某传统数据仓库厂商升级替换中需要用到的云上实用工具组件。(1)云原生数据仓库首先需要一款对标某传统数据仓库厂商的云原生数据仓库——阿里云AnalyticDBPostgreSQL 版(以下简称 ADB PG),是一种大规模并行处处(MPP)数据仓库服务,可提供海量数据在线分析服务。ADB PG 主要功能特征如下:1. 性能优异。ADB PG 搭载自研向量执行引擎,针对火山模型的缺点和现代硬件的特点,结合向量化计算、即时编译 (Just In TIme, JIT) 等技术,专注于执行性能、特别是 OLAP 场景的执行性能提升。2. 管理和使用成本低。ADB PG 基于开源项目 Greenplum 构建,由阿里云深度扩展,兼容 ANSI SQL 2003,兼容 PostgreSQL/Oracle 数据库生态,支持行存储和列存储模式。既提供高性能离线数据处理,也支持高并发在线分析查询,是各行业有竞争力的PB 级实时数据仓库方案。3. 生态丰富。ADB PG 具备完善和开放的生态系统,支持无缝对接业界以及阿里云生态的数据管理工具,BI 报表可视化工具,ETL 工具,数据迁移工具,同时可以与业界流行的流式处理系统,日志类系统,大数据类系统,传统数仓及数据库类系统互通。4. 低成本。ADB PG 采用计算节点本地存储的模式,支持行式存储和列式存储,支持非易失存储、固态硬盘、机械硬盘等多种存储介质,支持单节点最大 10TB 存储空间。在此基础之上,ADB PG 进一步提供了存储压缩能力、OSS 外表存储能力和共享存储格式、存储分层等能力,满足用户在不同场景的需求。5. 优良的可扩展性。ADB PG 拥有良好的弹性能力,同时支持水平扩展和垂直升降配,以满足不同场景的扩展和弹性需求。(2)一站式升级交付工作台阿里云提供一站式的现场交付工作台 KOC,将传统数仓升级这样的大工程由人力驱动升级为流程驱动,将手工操作升级为自动化操作,通过在交付中引入 KOC 实现以下五大能力:1. 交付流程化:每一个交付动作串联成 SOP,建立依赖约束,交付各角色围绕 SOP严格执行到位2. 交付职责清晰明确:每个交付动作责任落实到人,对动作交付结果和完成时间是否符合预期负责3. 操作质量保证:每个交付动作有核查人,工具执行有日志记录,手工做操作有结果截图证明4. 进度里程碑管理:为项目设定合理的排期、里程碑,据此考察项目进度是否落后,聚焦于项目风险和卡点5. 关键交付物归集:将项目过程中持续产生的操作文档、技术方案、工具沉淀收集整理,作为后续复盘和新项目启动时的宝贵资产KOC 工作台可以有效的确保数仓升级实施高标准、高质量完成,达到前述 L2 自动级及以上的实施标准,弥补统一升级实施过程中技术人员的水平差异、保证操作质量、提高项目管理质量。带你读《升舱 - 数据仓库升级交付标准白皮书》——6、附:数据仓库升级实施云上组件(下) https://developer.aliyun.com/article/1242439
带你读《升舱 - 数据仓库升级交付标准白皮书》——2.2 数仓升级的四个原则
2.2 数仓升级的四个原则要达成传统数据仓库升级成功的三个目标,我们需要的不仅仅是一套技术交付方案,更 需要一套能够指引行动的“原则”。正如雷 - 达里奥在《原则》一书中提到:原则犹如 指引行动的“灯塔”,它连接着我们的目标与行动。解决不确定性靠敏捷、解决复杂性 靠原则,越是复杂的系统越需要一套原则来保证。过去以国外厂商为主导的数据仓库平台很好地解决了企业从零到一的取数、用数问题。 经过多年的长期迭代建设和大量投入,在现有数据仓库平台体系内积累了许多符合企业自身业务需求的经验和实践,比如在数据架构上采用分层设计思想初步实现了将数据分 类处理、建设了大量主题数据模型、建设了统一的数据交换平台,这些都是企业多年经 营的心血和结晶,是最重要的数据资产之一,数据仓库平台的升级要尽可能考虑复用企 业现有投入,把企业花了大力气积累的数据资产平滑过渡到新的数据仓库平台,避免推 倒重来的重复建设开销。如下图所示,我们将高效实现数仓升级所需要的原则总结为“四边形”原则:该模型可细化解读为如下四个方面:1)原关联上下游渠道不受影响:升级数据仓库涉及到对现网上下游多种类型系统的数 据集成工作,要确保升级数仓前后业务渠道和系统功能不变、数据交换平台功能不变、 批量调度平台功能不变。 2)原数仓平台数据体系不变:原数仓平台通过分层设计的数据治理模型不变,比如 ODS、数据缓冲层、基础数据层、公共汇总层、数据集市等能在新数仓平台复用。 3)原数仓平台兼容性:具有对原有数据仓库平台一定功能上的的兼容能力,确保对原 数据仓库平台有一定的使用习惯和功能上的兼容能力。 4)采用云原生技术进行优化改造:考虑技术前瞻性、时代必然性,采用云原生组件对 传统数仓平台进行优化改造,并且改造后的业务功能不受影响。基于以上四个原则,采用云原生组件进行传统数据仓库优化升级可以让企业在云计算时 代充分享受云计算的红利。云计算的本质是随着虚拟化技术的突破而带来了用虚拟化技 术高效使用来池化底层的硬件资源,最重要的一点是利用好云原生数据仓库的存储和计 算资源服务化特性,让用户根据自身的需求灵活选择资源规格、并根据数据量增长需求 随时变更资源配置,还能做到对上层应用无感知,达到投入资源收益最大化;此外,分 布式并行计算、透明可扩展、高可用、同城容灾等都是传统企业长期以来功能刚需,是 云上数据仓库在云上与生俱来的能力,可以让企业实现开箱即用的良好体验;因此,企 业在升级传统数仓时选型一套经过大规模验证的、用于支撑新数据仓库平台生产运行的 IaaS 和 PaaS 平台,可以让升级工作事半功倍。
【活动回顾】PostgreSQL中文社区 × PolarDB开源数据库技术沙龙(武汉站)圆满落幕!
6月3日,由PostgreSQL中文社区和PolarDB开源社区联合举办的数据库技术沙龙(武汉站)圆满落幕!本次活动邀请到来自阿里云、成都文武,四维纵横,拓数派,斗鱼、武汉大学等多位资深技术专家与老师,这次技术交流活动围绕未来数据库展开讨论和分享。通过探讨未来数据库的概念和特点,了解未来数据库在数据管理、智能分析、数据驱动等领域的应用和机遇,为智能化时代的发展提供更多的支持和服务。接下来让我们一起回顾活动精彩吧!
阿里云PolarDB数据库技术专家吴辉静分享的议题是《PolarDB PostgreSQL企业级特性解读——Global Cache》。首先介绍了PostgreSQL的缓存机制data cache和meta cache,并分析了其中存在的问题,随后提出了PolarDB的global cache优化方案,吴老师在分享中详细说明了global cache的架构与实现。
成都文武信息科技公司朱贤文老师带来了议题是《鸿鹄数据库一体机企业特性》,朱老师介绍了鸿鹄数据库一体机的架构和特点,强调了鸿鹄一体机为了实现可靠性、安全性以及高性能所做出的努力。
拓数派的郭罡老师分享的议题是《PieCloudDB: 云原生分布式虚拟数仓的诞生之路》,介绍了PieCloudDB为什么选择了走存算分离云原生数据库这条道路,详细说明了产品演进过程中的设计考量、所采取的技术方案和PieCloudDB的未来展望。
武汉大学廖书楠分享的议题是《PostgreSQL数据库Detoast缓存机制研究》,分享了他对PostgreSQL中Detoast操作的优化方案——Detoast缓存池。
北京神脑资讯技术有限公司总裁陈卫星老师在本次沙龙中分享的议题是《数据库人才培养创新与变革》,介绍了他们在国内数据库人才培养中的重要贡献。
北京四维纵横架构师曹明星老师分享的议题是《YMatrix助力企业实现降本增效》,介绍了企业需要降本增效的背景,以及YMatrix数据库如何助力降本增效,最后曹老师分享了一些实际案例。
斗鱼资深数据库DBA周伦光老师分享的议题是《pgvector构建私域知识库之存储和查询向量嵌入》,介绍了斗鱼如何利用pgvector插件在PostgreSQL中拓展向量数据库的能力,从而构建私域数据库。周老师分析了基本原理,并介绍了具体实现。
在广大社区开发者与生态伙伴的支持下,本次 PolarDB开源数据库 × PostgreSQL中文社区技术沙龙(武汉站)圆满落幕。感谢各位参与者的热情参与和分享,相信大家都能在本次活动中有所收益。期待在未来PolarDB开源社区的技术沙龙中再次相遇,共同探讨数据库的发展趋势及应用。
带你读《升舱 - 数据仓库升级交付标准白皮书》——4.2 数据仓库升级主要内容
4.2 数据仓库升级主要内容基于以上的原因,申万宏源决定选择全新的云原生数据仓库进行升级,在综合对比多家厂商性能后,选择携手阿里云通过采用 AnalyticDB for PostgreSQL 等云上组件成功将服役了十几年的某厂家传统数据仓库平台云化升级,在云平台底座上,成功搭建了具备数据接入、数据存储、数据计算、横向扩展、数据共享的先进数据仓库平台。阿里云结合多年行业沉淀的申万宏源的 SDOM 模型经验,高效实现了数据模型从原数据仓库向新平台的平滑迁移。申万宏源的数据仓库系统整体性能提升 40% 以上,支撑了数万张核心表,为运营及业务快速发展提供了可靠、高效的云上基础设施环境。该项目的数据仓库平台升级实施涉及一百多套上游业务源系统、三十余套下游系统、两万多个任务、近1000 多个服务接口、500 多 TB 数据(日新增 500 多 GB 数据)的业务规模,完成了几乎不可能完成的任务,整体的迁移过程如下图 13 所示。由于数据协同的上下游系统较多,原厂家的传统数据仓库平台升级替换耗时约 12 个月,在各方的共同努力下,最终完成所有预计目标的平稳迁移,同时保障现有业务平稳有序运转,帮助该证券公司实现自主可控、成本与风险双降,数据快速赋能业务。那么,数据仓库升级是如何一步一步展开的?如何通过交付标准化手段,围绕交付标准流程、交付工具及数字化工作台,确保数据仓库迁移高质量高稳定履约,帮助客户数据业务转型升级?以下主要将结合该项目中总结沉淀出的数仓升级经验进行介绍。