逆境清醒_个人页

个人头像照片 逆境清醒
个人头像照片
6
25
0

个人介绍

https://blog.csdn.net/weixin_69553582

擅长的技术

获得更多能力
通用技术能力:

暂时未有相关通用技术能力~

云产品技术能力:

阿里云技能认证

详细说明

暂无更多信息

2024年04月

2023年12月

2023年11月

2023年10月

2023年09月

2023年08月

2023年07月

  • 发表了文章 2024-04-20

    2023年上半年信息系统项目管理师___综合知识真题与答案解释(2)

  • 发表了文章 2024-04-08

     2023年上半年信息系统项目管理师综合知识真题与答案解释(1)

  • 发表了文章 2023-12-01

    评测|PolarDB MySQL 版 Serverless

  • 发表了文章 2023-12-01

    评测|PolarDB MySQL 版 Serverless

  • 发表了文章 2023-08-22

    初试搭建个人博客(使用ECS和RDS)

  • 发表了文章 2023-07-08

    【朱颜不曾改,芳菲万户香。AIGC人物图片创作---InsCode Stable Diffusion 美图活动一期】

正在加载, 请稍后...
滑动查看更多
  • 回答了问题 2023-12-21

    开发业务需求有必要引入 TypeScript 吗?

    1.你会在业务中引入TypeScript吗?

    有需要就会用

    2.你认为TypeScript会取代JavaScript吗?为什么?

    我认为TypeScript不会完全取代JavaScript。

    TypeScript提供了一些明显的优势。越来越多的大型项目和企业开始采用TypeScript来开发前端应用和后端服务。

    但尽管如此,JavaScript仍然是目前最广泛使用的编程语言之一,而且具有很强的生态系统和社区支持。JavaScript已经被用于构建各种应用和平台。许多现有的项目和代码库都是使用JavaScript编写的,将它们转换为TypeScript可能需要一定的成本和工作量。

    3.对于现代前端框架的发展,你有什么看法或期待?

    未来的前端框架应该在性能、开发体验、跨平台支持、组件生态系统和团队协作等方面不断改进和创新,以满足日益复杂和多样化的前端应用程序需求。

    踩0 评论0
  • 回答了问题 2023-12-20

    年度编程语言将花落谁家?

    1、你预测年度最受欢迎的编程语言会是什么?

    我猜C#或python

    2、TIOBE 认为 C# 最有可能成为年度编程语言,你同意吗?为什么?

    有可能,C#是一种通用的面向对象编程语言,具有强大的类型安全性和可扩展性,并且对于开发企业应用程序非常有用。C#还拥有丰富的开发工具和框架,如.NET和ASP.NET,使得开发人员能够更加高效地构建各种应用。

    不过很难说,去年很多人猜python是年度编程语言,因为多个月份都是python占第一,但最后是C#成为年度编程语言。

    2023-12-18_235322.jpg

    编程语言的流行度是一个动态的概念,受到许多因素的影响。跟风不如选择一款适合自己实际需要的,并且对此编程语言有足够了解和熟练程度的编程语言,并且符合自己喜好的语言才是适合的。

    3、AI时代已经到来,你有学习新语言的打算吗?

    有时间精力就一定会学,学无止境,学海无涯苦作舟

    踩0 评论0
  • 回答了问题 2023-12-20

    【藏经阁一起读(81)】读《云原生节点管理最佳实践白皮书》,你有哪些心得?

    一、云原生节点管理模式产生背景

      随着云计算应用的普及,Kubernetes集群规模迅速增加,同时节点管理的重要性也日益凸显。作为云原生架构的关键组成部分,节点管理直接影响着整个云原生应用的稳定性和性能。然而,现有的基础架构管理方法更倾向于虚拟机管理,并缺乏对工作负载的深度感知,无法适应大规模节点管理的要求。为了应对大规模节点管理场景,云原生节点管理模式应运而生。

      在云原生的浪潮下, Kubernetes 集群在规模和数量上快速增长, 进而使得在大规模集群中,节点管理的重要性日益突出。在这样的环境下,高效 的节点管理成为确保集群稳定性、性能优化和资源利用率最大化的关键因素。

      计算节点作为云原生架构的关键组成部分,节点的管理直接影响着整个云原生应 用的成本和稳定性。然而,现有的基础架构管理方法更偏向于传统的虚拟机管理 理念,缺乏对工作负载的深度感知,无法适应大规模集群的节点管理要求。 面对大规模的节点管理的场景,越来越多的人愿意尝试云原生式的节点管理模式。 云原生节点管理是基于云原生理念,使用专为此目的设计的操作系统底座 ContainerOS 和配套基础设施,提供的一种有效的节点管理方案。这种新的管 理方案旨在优化云上环境的大规模节点的管理成本,并同时提供更佳的弹性、灵 活性、稳定性和安全性。

      Kubernetes 是开源的容器编排平台,用于自动化部署、扩展和管理容器化应用程序。 Kubernetes 的基本架构由几个核心组件组成。

    m2023-12-15_191625.jpg

    二、云原生节点的定义

      Worker 节点(简称节点)是构建云原生应用平台的基础,承载着管理容器生命周期和物 理资源的重要任务。

    节点职责:

    • ♦ 提供容器运行环境:节点使用容器运行时来处理容器的创建、启动、停止和销毁。通过 全生命周期管理,使容器能够始终保持在期望状态。
    • ♦ 合理分配资源:节点负责为工作负载分配所需的运行资源。包括计算资源(如 CPU 和 内存)、持久化存储和网络资源等。通过合理的资源分配,节点不仅能够满足容器的运 行需求,更能保证不同容器间的资源隔离。
    • ♦ 提供高可用和故障恢复:节点应具备基本的高可用和故障恢复能力,在可预料的异常发 生时,主动干预使工作负载向期望状态靠拢,以提供基础的稳定性和可靠性

    节点局限性

    • ♦ 单节点无法解决非预期的错误,比如容器运行时的异常,节点的恢复手段十分有限。并且由于缺乏全局视角,在集群容量不足时,因单节点的故障导致整个集群的雪崩也时有发生。
    • ♦ 由于宿主节点自身的管理并没有被 Kubernetes 集群标准化,随着集群规模变得庞大时,千奇百怪的手动运维操作,极易使 得集群中节点的配置存在差异,加剧环境腐化。

    三、云原生节点管理

      云原生节点管理是指在云上环境中,利用云的弹性、可用性和计量计费等特点,最大化发挥节点的自管理能力,并通过集群化手段弥补单一节点的局限性,构建成本可控、易于管理、敏捷、安全和高可用的集群基础设施。通过云原生节点管理实践,可以有效的进行大规模集群的管理,满足不同工作负载的需求,并确保整个集群的稳定运行。这种管理实践对于构建可靠、可扩展的云原生应用平台至关重要。

      节点管理成本主要涉件成本和运维成本两部分。

      降低节点管理成本在构建可持续发展的云原生应用平台中十分重要。在云上环境中,我们可以利用云的标准化和弹性等特点,以通过系统化手段降低集群整体复杂度的方式,获得更可控的管理成本和更稳健的应用平台。

    采用云原生节点管理实践,可以获得以下益处。

      ♦ 节约计算资源成本:充分利用云上环境的极致弹性特点,对集群内的资源使用状况动态感 知,可以根据实际需求进行峰时扩容,低谷时缩容,避免资源浪费。这种灵活的资源调配 方式可以有效降低计算资源的开销,降低硬件成本。

      ♦ 提高运维效率:通过大规模自动化和面向终态的配置能力,减少部署和配置的复杂性。自 动化的节点管理流程可以减少人工操作的错误和时间消耗,提高运维效率,降低节点运维 成本和故障风险,使运维人员能够更专注于核心业务,提高整体运维人效。

      ♦ 提高可用性和安全性:一致的执行环境可以大大降低应用程序出现异常的可能性。通过节 点实时监控和节点自愈能力,可以及时发现并解决节点故障,确保应用程序的稳定运行, 减少业务中断和损失

      云原生节点管理是以云原生理念为基础的实践方法论,主要目标是在满足日常运维需求的 同时,有效应地应对大规模集群节点管理的挑战。而操作系统作为节点底座,是云原生节点管理的重要组成部分。

    传统操作系统在云原生场景面临的问题。

    问题一:体积臃肿
    问题二:版本零散
    问题三:运维方式落后

    ContainerOS设计原则:

    原则一:小型化与极速弹性
    原则二:安全增强
    原则三:镜像原子更新与版本化管理
    原则四:云原生场景开箱即用

      云原生节点管理提供了集群侧管理和节点侧管理两个维度的理论实践和工具集。

    四、读后感

      云原生节点管理是云原生架构中的重要组成部分,它涉及到如何高效地管理和维护云原生集群中的节点。
      云原生节点管理作为一种全新的节点管理范式,是根据当前 Kubernetes 集群的使用局限 性提出的系统化和工程化的解决方案。

      以下是我从文中学到的云原生节点管理的一些知识和想法:

    (1)、弹性伸缩:

      云原生节点管理应该具备弹性扩展的能力。根据负载需求自动调整节点的数量和规模。使用自动化调度工具来动态调整节点数量,以便根据负载需求来应对流量峰值和低谷。通过监控集群资源使用情况,根据需求自动增加或减少节点的数量,以满足不同工作负载的需求。
      Kubernetes 集群支持以弹性伸缩的方式管理集群节点,当面临突发流量急需工作负载水平扩容时,弹性伸缩可以迅速增加节点数量,确保集群能够快速响应并保持高可用性。通过节点的弹性伸缩,集群可以在短时间内适应不断变化的需求,保证工作负载的正常运行。 这种弹性能力使得业务能够轻松应对高峰期的流量,并在需要时自动缩容以降低成本。
      快速的弹性伸缩能力还可以提高集群的可靠性和容错能力。

    (2)、节点运维监控工具

      ContainerOS 提供了一种新的解决方案:运维容器。
      在运维容器中,用户可以轻松查看系统进程信息、网络信息、系统配置等关键信息,以便 进行系统的监控和管理。将用户的操作隔离在运维容器中,一定程度上得以降低误操作带 来的破坏性。

    (3)、声明式配置

      声明式配置管理带来了多个优势,不仅简化节点配置的过程和维护的复杂性。还可以避免 黑屏运维带来的风险和错误。同时,声明式配置结合 ContainerOS 分层更新的能力,使 得无论是存量节点还是新增节点,集群内的节点始终保持相同的配置,避免因为节点版本 差异引发的非预期行为。

    (4)、节点故障自愈

      节点故障自愈是指在集群节点池中,当节点发生异常时,自动进行节点恢复操作,以保持 节点的正常运行状态。节点自愈功能包括问题诊断、恢复决策和恢复任务。节点故障自愈 是通过将专家经验自动化,并根据故障特异性指标进行自动排查和故障恢复。
      节点自愈的好处不仅可以提高集群的稳定性和可靠性。系统自动的诊断和恢复节点异常状 态,还可以减少手动排查和修复故障的时间和精力成本。更及时的发现节点异常情况,并 在故障放大前采取相应的恢复操作。减少故障对用户的影响,提高了系统整体的容错能力。

    2023-12-20_224709.jpg

    (5)、降低节点管理成本

      采用云原生节点管理实践,可以

    • 节约计算资源成本
    • 提高运维效率
    • 提高可用性和安全性

    (6)、安全性

      云原生节点管理需要具备一定的安全性措施。采取适当的安全措施来保护节点和云原生环境。通过使用安全认证、授权和加密等技术,保护节点和集群的安全性,防止恶意攻击和数据泄露。

    踩0 评论0
  • 回答了问题 2023-12-13

    服务器操作系统与 AI 和云计算的结合,将会掀起一股什么样的热潮?

      本文图片来源于龙蜥,仅做介绍时引用用途,版权归属龙蜥和相关设计人员。

    一、《国产服务器操作系统发展报告(2023)》称操作系统已步入 2.0 时代,服务器操作系统与 AI 和云计算的结合已是大势所趋,你认为龙蜥开源操作系统在云+AI 的时代面临哪些挑战?对此你有什么看法?

      CentOS 停服为本土服务器操作系统厂商带来机会的同时也加剧了服务器市场的竞争。
      为解决CentOS停服的问题,让更多的人留意到龙蜥开源操作系统。。。。。。

    2023-12-08_114733.jpg

      CentOS 停服?CentOS 是什么?龙蜥开源操作系统又是什么?

      我们从头理清一下这件事:

    1.1、CentOS开源操作系统简介

      目前全球服务器操作系统主流的代表有 Windows、Unix、Linux。Linux 服务器操作系统天然支持云计算、虚拟化和容器化等技术,又因为其源代码开放,用户可免费得到多种应用程序,因此,在服务器领域得到了广泛应用,在安全性和稳定性方面得到了用户充分的肯定。Linux 服务器操作系统在全球市场上极具竞争优势。

    2023-12-12_113923.jpg

      CentOS(Community Enterprise Operating System,社区企业操作系统)是Linux发行版之一,是免费的、开源的、可以重新分发的开源操作系统 。

      CentOS Linux发行版是一个稳定的,可预测的,可管理的和可复现的平台,源于Red Hat Enterprise Linux(RHEL)依照开放源代码(大部分是GPL开源协议规定释出的源码所编译而成)。

      CentOS 项目是一个由社区驱动的免费软件,提供了丰富的基础平台,供开源社区使用。它提供了两个 Linux 分发版本:CentOS Linux 和 CentOS Stream,这两者在功能上都兼容其上游来源。

      CentOS 在国内有着大量的用户,几乎是所有互联网公司的标配。

      2020 年,Red Hat CentOS 项目宣布,宣布未来将终止对CentOS 8 和 CentOS 7 的服务支持,包括停止对后续漏洞的更新修复。CentOS 7 将在其生命周期结束后停止维护(2024年1月30日)。CentOS 的一生走到了尽头...以后发展CentOS Stream 8。

    2023-12-08_051704.jpg

    1.2、CentOS 停服原因分析

      红帽公司为什么要关闭 CentOS呢?我们来看一下大致的发展史:

      2014年,红帽公司收购了 CentOS ,包含 CentOS 项目商标的所有权,以及大量核心开发人员,这时,旗下就有了三个主要的 Linux 发行版产品线:Fedora、RHEL、还有 CentOS 。

      Fedora 作为实验版本,快速迭代更新各种新功能;而这些特性被评估为稳定版本以后则会添加到 RHEL 中;

      CentOS Linux 则是去除商标等信息之后的 RHEL “免费”版本。CentOS 是公司唯一免费的产品。

      RHEL是需要购买的商业版版本。

      CentOS Stream是2019年推出的。

      宣布不再支持 CentOS 后续发展后,官方提示:不推荐将 CentOS Stream 用于企业生产环境,因此 CentOS Stream 不再适合作为企业版 Linux 操作系统使用。意思就是,CentOS 停止更新,改成推出 CentOS Stream 做为社区版本,而且不推荐将 CentOS Stream 用于企业生产环境,如果大家需要使用在企业生产环境呢,那就需要付费购买 RHEL 商业版。

      利用开源,刚开始确实很美好,也符合开源社区的精神。但,开源组织背后是公司,他们产生变化后,下游公司是需要付出巨大的代价。如果决定走开源的路,就必须先考虑好怎么解决企业长期生存的办法,即如何用恰当的商业化支持开源。

      CentOS 停服为本土服务器操作系统厂商带来机会的同时也加剧了服务器市场的竞争。目前 CentOS 7 支持到 2024 年1月支持截止,对于众多互联网公司来讲,还有几年的缓冲时间。

      伴随着选择国产服务器操作系统的比例不断上升的趋势及CentOS 停服影响,国产服务器操作系统正在强势崛起。国内的服务器操作系统创新形式有了很大改观,形成了协同攻关、优势互补、融合发展的格局,推动产业链供应链现代化水平不断提升,并加速向价值链高端迁移。

      CentOS 停服为本土服务器操作系统厂商带来机会的同时也加剧了服务器市场的竞争。

      为解决CentOS停服的问题,让更多的人留意到龙蜥开源操作系统。

      以龙蜥社区、欧拉社区为代表的中国开源社区正在构建以自主技术为核心的产业生态,国产服务器操作系统已基本具备有开发者社区、有知识产权、高安全、高可用、可定制、可重构的特征。

      目前,操作系统在党政、金融、电信、互联网等行业的国产产品装机量也在逐步提升,国产服务器操作系统逐渐成为各行业替换首选,根据近期中国信息通信研究院(简称“中国信通院”)面向用户群体的调研显示,龙蜥操作系统位列用户意愿迁移系统的首位。以龙蜥操作系统为代表,其装机量已超过 500 万,服务各个行业用户超过 70 万。

    1.3、龙蜥开源操作系统和龙蜥社区

      2021年10月19日的大会上,阿里云发布全新操作系统“龙蜥”并宣布开源。龙蜥操作系统定位于服务器端,支持X86、ARM等多种芯片架构和计算场景。

      2022年6月13日,龙蜥社区对外公布了下一代龙蜥操作系统(Anolis OS 23)研发路线图,PoC 版已在社区官网上线,正式版本2023 年发布,它支持 X86、ARM-v9、RISC-V 等多种芯片架构,并集成更多核心自研组件。

      2023年7月20日消息,龙蜥社区宣布推出自研根发行版-Anolis OS 23,新增对智能计算的全面支持,内置 rpm 格式的 AI 组件、主流 AI 框架 tensorflow2、pytorch ,支持一键安装 nvidia GPU 驱动、CUDA 库等。龙蜥社区将基于 Anolis OS 23 构建 AI 容器镜像生态,提供主流的 AI 训练/推理镜像,并发布开箱即用的 modelscope / huggingface AI 大模型实践镜像,稳步提升 AI 的支持蓝图。

      龙蜥操作系统是基于双内核策略的。

      龙蜥操作系统(Anolis OS)的诞生肩负双重使命:

    • 为 CentOS 用户提供 100% 兼容的服务,
    • 在 CentOS 结束生命周期为广大的 CentOS 用户提供平滑的过渡支撑;同时为广大开发者和运维人员提供稳定、高性能、安全、可靠、开源的创新操作系统发行版。

      在此背景下,Anolis OS 同时提供两个版本的内核,分别为:
    • RHCK(RHEL Compatible Kernel,RHEL 兼容内核)
    • ANCK(Anolis Cloud Kernel,Anolis 云内核)。ANCK 是由 OpenAnolis 龙蜥社区 Cloud Kernel SIG 基于上游 Linux Kernel 研发,提供在稳定性,性能,隔离能力等方面的增强,和对龙芯、飞腾、海光、兆芯、鲲鹏等芯片的完善支持。

      当前 龙蜥操作系统(Anolis OS)提供 Anolis OS 7、Anolis OS 8 和 Anolis OS 23 三个主要版本。
      三个主要版本均集成 ANCK 内核版本(Anolis Cloud Kernel,Anolis 云内核),ANCK 是由社区 Cloud Kernel SIG 组基于上游 Kernel 研发,一款定制优化版的内核产品,在Cloud Kernel 中实现了若干针对云基础设施和产品而优化的特性和改进功能,旨在提高云端和云下客户的使用体验。

    2023-12-13_172604.jpg

      龙蜥社区(OpenAnolis)成立于 2020 年 9 月,立足云计算打造数字创新基石,聚拢产业生态力量,共创数字化发展开源新基建。汇聚企事业单位、高等院校、科研单位、非营利性组织、个人开发者等多元角色,作为面向国际的 Linux 服务器操作系统开源根社区及创新平台,龙蜥社区持续推动软、硬件及应用生态繁荣发展。

    1.4、龙蜥开源操作系统在云+AI 的时代面临的挑战

      我个人对龙蜥实践经验并不足,但研究了相关的资料,个人看法如下:

      作为一家开源操作系统,龙蜥面临的首要挑战是如何与商业化的云计算和AI技术相结合,并满足用户对稳定性、可靠性和安全性的需求。此外,随着云计算和AI技术的不断发展,新的应用场景和需求也随之涌现,龙蜥需要努力跟进并提供相应的解决方案。龙蜥开源操作系统需要在开放、专业化、安全、性能等多方面不断提升自身,在云+AI的时代中才能保持竞争力。

    具体有以下几点:

    ▶(1)、加强对云计算和AI技术的研发和应用

      加强团队建设,提高自身的研发和技术实力。解决新时期开源操作系统发展的挑战需要龙蜥开发团队加强对云计算和AI技术的研发和应用,提升操作系统的性能、稳定性和安全性。随着大数据、人工智能等应用的不断发展,服务器操作系统的性能和稳定性要求越来越高,龙蜥开源操作系统需要不断提升自身的性能和稳定性,以满足用户的需求。

      云+AI时代对操作系统的要求也在不断提高,特别是对于支持大规模数据处理、高并发访问等方面的能力要求更高,龙蜥需要不断改进和优化相关的技术方案,提升系统的性能和可扩展性。
    fdnnkqblozoufhnvyigz.png

    ▶(2)、确保操作系统的稳定性

      维持和确保操作系统的弹性伸缩和负载均衡能力,不因并发请求和负载量增加导致操作系统稳定性下降。

      并发请求和负载量增加,会导致服务器操作系统稳定性下降。随着云计算的快速发展,服务器操作系统需要具备较强弹性伸缩和负载均衡的能力,以适应动态变化的工作负载需求。

      同时,服务器操作系统接口稳定性直接影响服务器的可用性,操作系统需要保持对新接口的支持和适应能力。随着新技术的不断出现,不同版本的服务器操作系统之间可能存在接口差异,这对于现有的应用程序和系统集成来说可能带来迁移和兼容性问题。

    ▶(3)、兼容性

      智能终端不断涌现,兼容性成为影响操作系统应用的关键因素。

      随着智能应用在各行各业逐步普及,服务器操作系统需要能够适配不同的硬件架构和设备,并提供相应的驱动程序支持。多元化的设备和平台有自己的特点和要求,应用程序为满足不同终端用户的需求需要跨平台开发,技术的快速变革也要求操作系统不断更新和升级以适应新的需求和技术,这些都对服务器操作系统的兼容性提出了更高的要求

    ▶(4)、人才和技术

      云计算和人工智能领域处于快速发展阶段,需要不断拥有人才和技术来跟进和维护。龙蜥开源操作系统需要拥有一支有经验且具备相关技能的团队,来提供更加专业和高效的解决方案。

      当前的教育和培训体系在服务器操作系统底层生态方面存在滞后。传统教育体系更注重理论知识和基础技能,而在底层系统开发、驱动程序等领域的实际应用技能得不到充分培养。我国大多数学生并未系统接受过开源教育,仅部分高校开设开源通识课程。现有开源课程仅面向部分计其机及软件专业开设,难以建立系统化的开源知识体系。

    ▶(5)、安全性

      随着互联网规模的不断扩大,云计算和人工智能的普及,安全问题也越来越紧迫,网络安全问题变得越来越棘手,服务器操作系统需要具备更高的安全性能,避免出现数据泄露等安全问题。因此,龙蜥开源操作系统需要在安全方面加强自我防御能力,比如强化安全审计和加密技术等,预防黑客攻击和数据泄露等安全问题的发生。

      云+AI时代的安全需求也更加重要,需要对系统的各个层面进行全面的安全保护,包括应用层的漏洞修复、网络层的安全设置、系统层的权限管理等方面,龙蜥需要不断加强系统的安全性能,以确保用户的数据安全和隐私保护。

      虽然现在龙蜥有个“龙蜥安全漏洞管理体系”,但能否全生命周期闭环的安全漏洞管理,我们还需要观察。
    2023-12-09_062300.jpg

    ▶(6)、核心技术

      国产操作系统核心技术仍存在依赖国外开源社区的问题,如内核、驱动、虚拟化等技术,这些技术是操作系统的重要组成部分,涉及到大量的底层代码和特定的技术细节。一旦发生社区停服或者地缘政治等因素影响,我国将出现核心版本无法获取,相关的功能、安全等组件无法更新使用等情况,甚至影响到我国服务器操作系统生态的构建。

      这些问题不是一家公司能独立解决的,但必须考虑并尝试解决办法。

    ▶(7)、云服务整合,高云端和云下客户的使用体验。

      随着云计算的成熟,越来越多的企业开始采用云服务,希望能够实现数据的快速、高效、便捷的共享和传输。

      当前 龙蜥操作系统(Anolis OS)提供 Anolis OS 7、Anolis OS 8 和 Anolis OS 23 三个主要版本。三个主要版本均集成 ANCK 内核版本(Anolis Cloud Kernel,Anolis 云内核),ANCK 是由社区 Cloud Kernel SIG 组基于上游 Kernel 研发,一款定制优化版的内核产品,在Cloud Kernel 中实现了若干针对云基础设施和产品而优化的特性和改进功能,旨在提高云端和云下客户的使用体验。

      龙蜥开源操作系统如何更加深入的整合云服务生态系统,提供丰富的服务和应用程序来满足用户需求,这些都是需要考虑的。

    ▶(8)、积极参与行业标准制定,提高自身的开放性和专业化水平。

      开源操作系统越来越多,龙蜥开源操作系统需要不断提高自身的开放性和专业化水平,以吸引更多的用户和贡献者。

      这些年,龙蜥牵头制定《服务器操作系统迁移指南》社区标准,编写并发布《服务器操作系统硬件兼容性要求》社区标准,联合制定标准初稿《OS 质量测试标准》,。。。。

      仍需朝这个方向继续努力。

    ▶(9)、积极与硬件厂商合作

      积极与硬件厂商合作,加强操作系统与硬件之间的兼容性,开展开放、共享和协作的工作。提高自身的可用性。

    ▶(10)、积极与软件行业公司合作

      积极与软件行业开发公司的合作,加强操作系统与软件之间的兼容性,开展开放、共享和协作的工作。提高自身的可用性。

    ▶(11)、加强用户教育和培训

      加强用户教育和培训,提高用户使用和管理操作系统的能力,为用户提供更好的服务和支持。

    ▶(12)、建立发展维护一个长期主义的生态体系

      一个操作系统的成功与否,不仅取决于其技术水平,还在很大程度上取决于其生态环境。一个健康、活跃的生态系统可以吸引更多的开发者、用户和企业参与进来,从而形成一个良性循环。如何建立一个长期的良好生态体系。

      服务器操作系统涉及上下游适配问题,商业合作有助于产品兼容、优势互补,创造良好产业生态。商业化合作优势互补商业化合作可以实现资源的整合与共享。

    2023-12-11_200838.jpg

    二、国产操作系统发展壮大的根本在于建立一个长期主义的生态体系,你认同吗?2023 龙蜥操作系统大会召开在即,你对本次龙蜥大会抱有什么样的期待?你最关注哪个论坛的演讲,为什么?

    2023-12-09_160210.jpg

      我认同国产操作系统发展壮大的根本在于建立一个长期主义的生态体系。

      对于2023年龙蜥操作系统大会,我认为这是一个非常重要的会议,有望展示国产操作系统的技术实力和应用前景。我期待本次龙蜥大会能顺利举行,并期待看到国内外技术专家和大咖分享他们的最新成果和思想,以及他们对于未来操作系统发展的看法和建议,这将有助于增加各界对于国产操作系统的认识和理解,并且有助于推动国内操作系统产业的发展。

      我认为所有论坛的演讲都值得关注,因为每个演讲都有其独特的视角和价值,可以为人们开拓思路,提供新思路和灵感。

    ​  我个人最关注的论坛演讲是“全面进化一云多芯”和” 全面建设安全生态“主题论坛的演讲。

      “一云多芯”在最近是云计算领域的一个热词,不仅代表着云平台向着开放化标准化发展,也反映出IT安全的刚性要求。一云多芯是云化数据中心为用户提供异构硬件资源能力的关键技术,用一套云操作系统来管理不同架构的硬件服务器集群。狭义的“一云多芯”是指在一个云平台内可同时采用多种异构CPU等类型的国产芯片,而广义的“一云多芯”要求提供从CPU扩展到GPU、网络设备,以及各类行业生态应用、客户自建应用的全域兼容能力,能够支持云平台从建设、应用迁移、到运维管理的全生命周期的能力要求,助力客户构建安全可信的IT基础设施。

      随着云计算和云服务的普及,大量的互联网流量通过云平台进行域名解析,云平台作为一个关键的中间层,承担着将用户请求路由到相应的服务实例的重要角色。针对云平台域名解析服务的网络攻击不断发生,而云平台的规模和复杂性也增加了域名解析安全的挑战,云平台多个分布式组件和服务构成,涉及多个域名解析点和网络层次,增加了攻击面和潜在的安全漏洞。全面建设安全生态迫在眉睫。

    三、参考

    ODCC 《国产服务器操作系统发展报告(2023)》
    龙蜥社区各种介绍资料

    踩0 评论0
  • 回答了问题 2023-12-13

    【藏经阁一起读(80)】读《2023龙蜥社区白皮书》,你有哪些心得?

    【藏经阁一起读】(80)__《2023龙蜥社区白皮书》

      这本书的简介里,介绍这本书是从解决CentOS停服的问题出发为广大用户的业务连续性提供了坚定的保障。。。。。CentOS 停服?CentOS 是什么?龙蜥开源操作系统又是什么?

      我对龙蜥开源操作系统并不熟悉,通过查阅资料略有收获,我们从头理清一下这件事:

    一、CentOS开源操作系统简介

      目前全球服务器操作系统主流的代表有 Windows、Unix、Linux。Linux 服务器操作系统天然支持云计算、虚拟化和容器化等技术,又因为其源代码开放,用户可免费得到多种应用程序,因此,在服务器领域得到了广泛应用,在安全性和稳定性方面得到了用户充分的肯定。Linux 服务器操作系统在全球市场上极具竞争优势。

    2023-12-12_113923.jpg

      CentOS(Community Enterprise Operating System,社区企业操作系统)是Linux发行版之一,是免费的、开源的、可以重新分发的开源操作系统 。

      CentOS Linux发行版是一个稳定的,可预测的,可管理的和可复现的平台,源于Red Hat Enterprise Linux(RHEL)依照开放源代码(大部分是GPL开源协议规定释出的源码所编译而成)。

      CentOS 项目是一个由社区驱动的免费软件,提供了丰富的基础平台,供开源社区使用。它提供了两个 Linux 分发版本:CentOS Linux 和 CentOS Stream,这两者在功能上都兼容其上游来源。

      CentOS 在国内有着大量的用户,几乎是所有互联网公司的标配。

      2020 年,Red Hat CentOS 项目宣布,宣布未来将终止对CentOS 8 和 CentOS 7 的服务支持,包括停止对后续漏洞的更新修复。CentOS 7 将在其生命周期结束后停止维护(2024年1月30日)。CentOS 的一生走到了尽头...以后发展CentOS Stream 8。

    2023-12-08_051704.jpg

    二、CentOS 停服原因分析

      红帽公司为什么要关闭 CentOS呢?我们来看一下大致的发展史:

      2014年,红帽公司收购了 CentOS ,包含 CentOS 项目商标的所有权,以及大量核心开发人员,这时,旗下就有了三个主要的 Linux 发行版产品线:Fedora、RHEL、还有 CentOS 。

      Fedora 作为实验版本,快速迭代更新各种新功能;而这些特性被评估为稳定版本以后则会添加到 RHEL 中;

      CentOS Linux 则是去除商标等信息之后的 RHEL “免费”版本。CentOS 是公司唯一免费的产品。

      RHEL是需要购买的商业版版本。

      CentOS Stream是2019年推出的。

      宣布不再支持 CentOS 后续发展后,官方提示:不推荐将 CentOS Stream 用于企业生产环境,因此 CentOS Stream 不再适合作为企业版 Linux 操作系统使用。意思就是,CentOS 停止更新,改成推出 CentOS Stream 做为社区版本,而且不推荐将 CentOS Stream 用于企业生产环境,如果大家需要使用在企业生产环境呢,那就需要付费购买 RHEL 商业版。

      利用开源,刚开始确实很美好,也符合开源社区的精神。但,开源组织背后是公司,他们产生变化后,下游公司是需要付出巨大的代价。如果决定走开源的路,就必须先考虑好怎么解决企业长期生存的办法,即如何用恰当的商业化支持开源。

      CentOS 停服为本土服务器操作系统厂商带来机会的同时也加剧了服务器市场的竞争。目前 CentOS 7 支持到 2024 年1月支持截止,对于众多互联网公司来讲,还有几年的缓冲时间。

      伴随着选择国产服务器操作系统的比例不断上升的趋势及CentOS 停服影响,国产服务器操作系统正在强势崛起。国内的服务器操作系统创新形式有了很大改观,形成了协同攻关、优势互补、融合发展的格局,推动产业链供应链现代化水平不断提升,并加速向价值链高端迁移。

      CentOS 停服为本土服务器操作系统厂商带来机会的同时也加剧了服务器市场的竞争。

      为解决CentOS停服的问题,让更多的人留意到龙蜥开源操作系统。

      以龙蜥社区、欧拉社区为代表的中国开源社区正在构建以自主技术为核心的产业生态,国产服务器操作系统已基本具备有开发者社区、有知识产权、高安全、高可用、可定制、可重构的特征。

      目前,操作系统在党政、金融、电信、互联网等行业的国产产品装机量也在逐步提升,国产服务器操作系统逐渐成为各行业替换首选,根据近期中国信息通信研究院(简称“中国信通院”)面向用户群体的调研显示,龙蜥操作系统位列用户意愿迁移系统的首位。以龙蜥操作系统为代表,其装机量已超过 500 万,服务各个行业用户超过 70 万。

    2023-12-08_114733.jpg

    三、龙蜥开源操作系统和龙蜥社区

      2021年10月19日的大会上,阿里云发布全新操作系统“龙蜥”并宣布开源。龙蜥操作系统定位于服务器端,支持X86、ARM等多种芯片架构和计算场景。

      2022年6月13日,龙蜥社区对外公布了下一代龙蜥操作系统(Anolis OS 23)研发路线图,PoC 版已在社区官网上线,正式版本2023 年发布,它支持 X86、ARM-v9、RISC-V 等多种芯片架构,并集成更多核心自研组件。

      2023年7月20日消息,龙蜥社区宣布推出自研根发行版-Anolis OS 23,新增对智能计算的全面支持,内置 rpm 格式的 AI 组件、主流 AI 框架 tensorflow2、pytorch ,支持一键安装 nvidia GPU 驱动、CUDA 库等。龙蜥社区将基于 Anolis OS 23 构建 AI 容器镜像生态,提供主流的 AI 训练/推理镜像,并发布开箱即用的 modelscope / huggingface AI 大模型实践镜像,稳步提升 AI 的支持蓝图。

      龙蜥操作系统是基于双内核策略的。

      龙蜥操作系统(Anolis OS)的诞生肩负双重使命:

    • 为 CentOS 用户提供 100% 兼容的服务,
    • 在 CentOS 结束生命周期为广大的 CentOS 用户提供平滑的过渡支撑;同时为广大开发者和运维人员提供稳定、高性能、安全、可靠、开源的创新操作系统发行版。

      在此背景下,Anolis OS 同时提供两个版本的内核,分别为:
    • RHCK(RHEL Compatible Kernel,RHEL 兼容内核)
    • ANCK(Anolis Cloud Kernel,Anolis 云内核)。ANCK 是由 OpenAnolis 龙蜥社区 Cloud Kernel SIG 基于上游 Linux Kernel 研发,提供在稳定性,性能,隔离能力等方面的增强,和对龙芯、飞腾、海光、兆芯、鲲鹏等芯片的完善支持。

      当前 龙蜥操作系统(Anolis OS)提供 Anolis OS 7、Anolis OS 8 和 Anolis OS 23 三个主要版本。
      三个主要版本均集成 ANCK 内核版本(Anolis Cloud Kernel,Anolis 云内核),ANCK 是由社区 Cloud Kernel SIG 组基于上游 Kernel 研发,一款定制优化版的内核产品,在Cloud Kernel 中实现了若干针对云基础设施和产品而优化的特性和改进功能,旨在提高云端和云下客户的使用体验。

    2023-12-13_172604.jpg

      龙蜥社区(OpenAnolis)成立于 2020 年 9 月,立足云计算打造数字创新基石,聚拢产业生态力量,共创数字化发展开源新基建。汇聚企事业单位、高等院校、科研单位、非营利性组织、个人开发者等多元角色,作为面向国际的 Linux 服务器操作系统开源根社区及创新平台,龙蜥社区持续推动软、硬件及应用生态繁荣发展。

    四、文中知识点摘要

    分层分类算法

      龙蜥社区以 MVP 方式构建新一代自研龙蜥操作系统,全面掌握产品核心技术。

      在打造 Anolis 23 版本时,统信软件针对龙蜥操作系统提出了分层分类算法作为操作系统构建方法 理论。

      分层分类基于目前上游软件包组织关系的既成事实,梳理软件包的依赖关系,并根 据软件包对操作系统构建运行的重要程度将其划分出层级,并从各个维度对其进行分类。 该算法是对以往复杂的 Linux 软件关系体系进行的一次梳理和规划的尝试,使操作系统发 行版逐步走向遵循架构设计思想的层次化,结构化的现代软件构建模式。该算法的提出有 效提高了操作系统构建的效率,为龙蜥操作系统的迭代做出了巨大的贡献。

    aohr6odutqrw6_0fa7f424a6ed4d47809b60746a31c339.png

    2023-12-13_174833.jpg

      龙蜥对软件包分为了五个层级;并将软件包从形态特征,功能特征,以及常见 的使用场景三个维度,对其进行了三种维度的分类(如上图)。上述软件包的五层三类信 息,作为软件的元数据信息记录在软件元数据仓库,以方便后续使用该信息构建操作系统, 和对软件包进行管理和查询。

    2023-12-13_174001.jpg

      分层分类思想不仅指导社区操作系统发行版的软件包选型策略,也在社区技术生态布局方 面发挥着积极的作用。

    zqkmnjzqwszkmihhqokl.png

    azioeegdchyorsndhfox.png

    fkzqnadswsuxeqxhznjg.png

    五、参考

    ODCC 《国产服务器操作系统发展报告(2023)》
    龙蜥社区各种介绍资料

    踩0 评论0
  • 回答了问题 2023-12-04

    如何看待AI的版权问题?

    你的AI生成物侵权了吗?


    本文目录:
    一、前置背景
      1.1、什么是版权
      1.2、什么是作品
      1.3、什么是创作
      1.4、什么是肖像权
      1.5、什么是名誉
    二、AI生成的作品是否具备版权?如果具备,版权应该属于谁?
    三、AI 学习时如果使用版权材料(如知名歌手的歌曲),是否属于侵权行为?为什么?
      3.1、无侵权行为
      3.2、有侵权行为
      3.2.1、未经著作权人的许可
      3.2.2、涉及侵犯录音录像权
      3.2.3、侵犯所使用音乐配词作品的著作权
      3.2.4、侵犯歌手的“声音权”
      3.2.5、侵犯该歌手的肖像权
      3.2.6、侵犯该歌手的个人信息权
      3.2.7、算法模型的使用涉及版权
      3.2.8、Ai学习版权材料过程中上传行为侵权。
    四、如果AI可以使用版权材料进行学习,社会将会产生什么变化?
    五、参考附录

    一、前置背景

      Ai的迅速发展,AIGC的普及,大量的Ai作品被创作出来,但我们在这个过程中既没有规定AI能学什么,也没有规定AI不能学什么。对于AI生成出来的作品,也没有任何明确的法律保护和指引规范。
      这样的不平衡发展导致的结果必然是:版权争议和纠纷不断,制约了Ai的进一步发展。如果我们不给予AI生成物一定适当的版权保护,让人们随意使用,甚至是商业应用,那势必会严重打击和降低AI投资者和开发者的积极性,对Ai作品的创新创作和AI产业的发展带来负面影响。同时,由于Ai生成物的开发过程中需要用到大量的传统素材,如果没有恰当的版权保护,对传统行业(绘画、影音、娱乐。。。)的打击也会有深远影响。
      我在学习人工智能过程中,也接触过Ai创作,文中的配图就是本人通过Ai生成的。我们利用Ai不止可以创作设计图片,还可以是视频、音乐等等领域。本文试着探讨一下Ai作品的版权问题。

    1.1、什么是版权

    版权定义:
    《中华人民共和国著作权法》
    第六章 第六十二条 本法所称的著作权即版权。

    1.2、什么是作品

    77124601b3104c4fa2c18198415d8a4c.jpeg

    作品定义:
    《中华人民共和国著作权法实施条例》
    第二条 著作权法所称作品,是指文学、艺术和科学领域内具有独创性并能以某种有形形式复制的智力成果。

    1.3、什么是创作

    a095d4018c1e4a9cadbf9c5ef418bac7.jpeg

    创作的定义:
    《中华人民共和国著作权法实施条例》
      第三条 著作权法所称创作,是指直接产生文学、艺术和科学作品的智力活动。
      为他人创作进行组织工作,提供咨询意见、物质条件,或者进行其他辅助工作,均不视为创作。

    1.4、什么是肖像权

    2023-12-04_124848.jpg

    肖像权定义:
    《中华人民共和国民法典》第四章 肖像权
      第一千零一十八条 自然人享有肖像权,有权依法制作、使用、公开或者许可他人使用自己的肖像。
    肖像是通过影像、雕塑、绘画等方式在一定载体上所反映的特定自然人可以被识别的外部形象。

    1.5、什么是名誉

    名誉定义:
    《中华人民共和国民法典》  第五章 名誉权和荣誉权
      第一千零二十四条 民事主体享有名誉权。任何组织或者个人不得以侮辱、诽谤等方式侵害他人的名誉权。
      名誉是对民事主体的品德、声望、才能、信用等的社会评价。

    48a4ff2159cc4468af66cf37e3cb6a91.png

    二、AI生成的作品是否具备版权?如果具备,版权应该属于谁?

    5558d9cafeaa46d5a55a9e5580a0420f.jpeg
      根据不同的国家和地区的法律规定,AI生成的作品是否具备版权存在争议。

      一些国家认为,AI生成的作品应该被认为是自动创作的结果,因此应该被赋予版权;

      一些国家则认为,AI实际上是由人类编程和设计的,因此AI生成的作品应该由其制作者拥有版权。

      现阶段的AI工具,是通过模型训练,通过大量学习素材后,根据用户的需求进行创作。在这过程中难免会产生一些与原作相似的作品,并且遭受到一些原创作者的抵触。

      据悉,"全球知名视觉艺术网站ArtStation的上千名画师发起联合抵制,禁止用户将其画作投放AI绘画系统,ArtStation认为,任由系统学习模仿画作是在侵犯版权。

      在实际应用来看,目前对于AI绘画对其他画师的著作权构成侵权,认定依旧困难。为规避版权风险,Getty Images、Shutterstock等大型付费图库不再接收由Stable Diffusion、Midjourney等生成的AI画作。"

    7ba094e83b7046459d9d3cc8909a7055.png

      伴随着技术的进步,AI已经对知识产权制度形成了新的挑战。AI创作都需要庞大的人类作品数据库来做训练样本,通过算法大量学习即有作品的创作风格、内容题材,来产生相应的ai作品。当AI创作了自己的绘画、文章、动画、歌曲等作品后,其版权又如何界定?

      AI创作的版权问题涉及两个方面,
        一是AI创作的内容涉及侵犯他人著作权的问题,
        二是AI创作的内容在受版权保护的情况下被他人侵权。

      根据著作权法规定,AI创作作品如果是用于个人学习研究之目的,是可以构成合理使用的,即不会构成侵权。

      这里涉及到可能存在侵权问题的AI作品的使用者归属,到底是AI本身,还是背后操作AI的行为主体在进行使用。对于AI创作物可能主张权利的主体,可能包括AI发明人、该AI所属的公司或公司投资人,或者AI的具体操作者等,他们都有可能是主张权利的人。对应的这些人的行为,是否符个人学习欣赏之目的,目前仍然存在分歧的。

      2019年5月国内首例AI创作版权引发的纠纷案,AI创作内容被判不具备著作权。

      Ai创作的作品,包括AI歌手和AI绘画会处在今天这个尴尬的处境,归根到底还是因为我们的法律发展滞后于AI的发展。

      在任何情况下,AI生成的作品的版权问题都需要根据实际情况来评估,并根据适用的法律规定来确定。在某些情况下,版权可能会被分配给AI的制作者,而在其他情况下,版权可能会被分配给AI生成的作品的使用者或所有者。

      Ai的迅速发展,AIGC的普及,大量的Ai作品被创作出来,但我们在这个过程中既没有规定AI能学什么,也没有规定AI不能学什么。对于AI生成出来的作品,也没有任何明确的法律保护和指引规范。这样的不平衡发展导致的结果必然是:版权争议和纠纷不断,制约了Ai的进一步发展。如果我们不给予AI生成物一定适当的版权保护,让人们随意使用,甚至是商业应用,那势必会严重打击和降低AI投资者和开发者的积极性,对Ai作品的创新创作和AI产业的发展带来负面影响。同时,由于Ai生成物的开发过程中需要用到大量的传统素材,如果没有恰当的版权保护,对传统行业(绘画、影音、娱乐。。。)的打击也会有深远影响。

    48a4ff2159cc4468af66cf37e3cb6a91.png

    ​三、AI 学习时如果使用版权材料(如知名歌手的歌曲),是否属于侵权行为?为什么?

    486f48797ae1413a8e928851319e8bd2.jpeg

      AI 学习时如果使用了版权材料,是否属于侵权行为,这个问题需要分成两种情况来判断。

    3.1、无侵权行为

      AI 在进行学习时,使用的训练素材是一些经过许可或公共领域中的材料,例如公共领域中的图片、文学作品或自由版权音乐、视频等,或者作者已经明确表示可以在其允许范围内免费使用的各种材料。

      或者AI 在进行学习时,使用的是通过购买相关版权材料,或使用经过版权材料版权人合法授权的版权材料,同时整个创作过程中都遵守相关的各种法律规定,这样生成Ai作品不会有侵权行为。

      根据《著作权法》第四节 权利的限制 第二十四条 规定,AI创作作品如果是用于个人学习研究之目的,是可以构成合理使用的,即不会构成侵权。所以如果在整个过程中,只有自己学习使用用途,同时整个创作过程中都遵守相关的各种法律规定,没有任何其他复制拷贝和分享,应该也不算触犯侵权。

      否则,使用未经授权的版权材料将可能面临版权侵权的法律纠纷。

    c7e18db0c69746dd918d662bd3cdf2c9.jpeg

    3.2、有侵权行为

      版权是一种法律保护作品的权利,包括文学、艺术作品、音乐、电影等。只有版权持有人或经过其授权,才能使用、复制、传播这些受版权保护的作品。如果在学习过程中使用了未经授权的版权材料(如知名歌手的歌曲),就属于侵犯了版权持有人的权利。

      以最近流行的Ai歌手为例,开发者用知名歌手的歌曲作为训练材料,演唱其他歌手的歌曲。这样的“AI歌手”们是否侵权呢?有的人认为AI未经授权使用了知名歌手的声音进行训练,属于侵权;有的人认为AI是学习歌手的声音,而不是直接复制,且AI演唱的并不是歌手本人的作品,属于学习后再创作,并没有侵权。

      AI 歌手的版权归属可能会有不同的情况,具体取决于歌曲的创作者和演唱者。

      如果是由AI生成的原创作品,版权可能属于AI创作程序的开发者或使用者。

      如果是AI模拟了现有歌手的歌声,那么版权可能属于原歌曲的版权所有者以及AI技术的使用者。

      总之,AI歌手的版权归属需要根据具体情况来确定。

      但AI 学习时如果使用了未经过授权的版权材料就属于侵权行为。

      原因有以下几点:

    b5725afb1f0f449dbcc94a85e7962281.jpeg

    3.2.1、未经著作权人的许可

    AI 学习时使用版权材料用于人工智能训练未经著作权人的许可。

    《中华人民共和国著作权法释义》里:

      著作权是赋予作者的一种专有权利,即一旦这项权利归某人所有,其他人如果要利用产生这种权利的作品,都必须经过著作权人的许可。

      《中华人民共和国著作权法》第四节——权利的限制——第二十四条,描述了可以不经著作权人许可合理使用版权作品的几种情形。但是将其用于人工智能训练,显然无法适用合理使用中的任一情形,同样也无法适用《著作权法》中规定的法定许可,从而需要获得相关词、曲著作权人及录音制作者等著作邻接权人同意后才能使用。

      虽然现在国际上有部分国家已经将用于人工智能的数据训练增加到合理使用的范畴之内,但其也是相关明确的条件限制。

      我国《著作权法》和相关的法律条例目前尚未增加人工智能的数据训练相关条款。

      因此如果我们将版权作品私自用于人工智能训练,显然未经相关权利人授权,侵犯了该版权作品的著作权。

      《中华人民共和国著作权法》第十条 著作权包括下列人身权和财产权:
    (五)复制权,即以印刷、复印、拓印、录音、录像、翻录、翻拍、数字化等方式将作品制作一份或者多份的权利;

    b5725afb1f0f449dbcc94a85e7962281.jpeg

    3.2.2、涉及侵犯录音录像权

      如果AI 学习时所使用版权材料作品属音乐作品,如果没有取得著作权人许可并支付报酬,会侵犯版权权益人的录音录像权。例如词/曲作品的著作权、歌手的表演者权、录音录像制作者的录音制作者权。

    《中华人民共和国著作权法》第三节 录音录像

    第四十二条 录音录像制作者使用他人作品制作录音录像制品,应当取得著作权人许可,并支付报酬。
    录音制作者使用他人已经合法录制为录音制品的音乐作品制作录音制品,可以不经著作权人许可,但应当按照规定支付报酬;著作权人声明不许使用的不得使用。

    第四十三条 录音录像制作者制作录音录像制品,应当同表演者订立合同,并支付报酬。

    第四十四条 录音录像制作者对其制作的录音录像制品,享有许可他人复制、发行、出租、通过信息网络向公众传播并获得报酬的权利;权利的保护期为五十年,截止于该制品首次制作完成后第五十年的12月31日。
    被许可人复制、发行、通过信息网络向公众传播录音录像制品,应当同时取得著作权人、表演者许可,并支付报酬;被许可人出租录音录像制品,还应当取得表演者许可,并支付报酬。

    第四十五条 将录音制品用于有线或者无线公开传播,或者通过传送声音的技术设备向公众公开播送的,应当向录音制作者支付报酬。

    3.2.3、侵犯所使用音乐配词作品的著作权

    b5725afb1f0f449dbcc94a85e7962281.jpeg

      如果AI 学习时所使用版权材料作品属音乐作品,例如背景音乐,伴奏,配乐,歌词等,有可能会侵犯该音乐作品的著作权。

    《中华人民共和国著作权法释义》
      音乐作品是指以乐谱形式或未以乐谱形式出现的能演奏或配调演唱的作品,其基本表现手段为旋律和节奏,如交响乐、歌曲等。音乐作品中需要注意的一个问题是:配词的乐曲,如果调和乐曲连在一起使用,则配调包括在音乐作品之内,如果配调来和乐曲连在一起使用,也可以包括在文字作品之内。

    b5725afb1f0f449dbcc94a85e7962281.jpeg

    3.2.4、侵犯歌手的“声音权”

      如果AI 学习时所使用版权材料属某位歌手的声音,未经允许,会侵犯该歌手的“声音权”。
    “声音权”:

      根据《民法典》第一千零一十九、一千零二十三条,自然人的声音参照肖像权保护,即通常所谓的“声音权”,以技术手段伪造自然人的声音构成侵权行为,未经自然人同意,不得制作、使用、公开自然人的声音。

      第一千零一十九条 任何组织或者个人不得以丑化、污损,或者利用信息技术手段伪造等方式侵害他人的肖像权。未经肖像权人同意,不得制作、使用、公开肖像权人的肖像,但是法律另有规定的除外。
      未经肖像权人同意,肖像作品权利人不得以发表、复制、发行、出租、展览等方式使用或者公开肖像权人的肖像。

    《民法典》

      第一千零二十三条 对姓名等的许可使用,参照适用肖像许可使用的有关规定。

      对自然人声音的保护,参照适用肖像权保护的有关规定。

    b5725afb1f0f449dbcc94a85e7962281.jpeg

    3.2.5、侵犯该歌手的肖像权

      如果AI 学习时所使用版权材料属某位歌手的肖像,未经允许,会侵犯该歌手的肖像权。

    《民法典》

      第一千零一十九条 任何组织或者个人不得以丑化、污损,或者利用信息技术手段伪造等方式侵害他人的肖像权。未经肖像权人同意,不得制作、使用、公开肖像权人的肖像,但是法律另有规定的除外。
      未经肖像权人同意,肖像作品权利人不得以发表、复制、发行、出租、展览等方式使用或者公开肖像权人的肖像。

    《民法典》中规定

    第五章 民事权利
    

      第一百一十条 自然人享有生命权、身体权、健康权、姓名权、肖像权、名誉权、荣誉权、隐私权、婚姻自主权等权利。

      第四章 肖像权

      第一千零一十八条 自然人享有肖像权,有权依法制作、使用、公开或者许可他人使用自己的肖像。
      肖像是通过影像、雕塑、绘画等方式在一定载体上所反映的特定自然人可以被识别的外部形象。

      第一千零一十九条 任何组织或者个人不得以丑化、污损,或者利用信息技术手段伪造等方式侵害他人的肖像权。未经肖像权人同意,不得制作、使用、公开肖像权人的肖像,但是法律另有规定的除外。
      未经肖像权人同意,肖像作品权利人不得以发表、复制、发行、出租、展览等方式使用或者公开肖像权人的肖像。

      第一千零二十条 合理实施下列行为的,可以不经肖像权人同意:
      (一)为个人学习、艺术欣赏、课堂教学或者科学研究,在必要范围内使用肖像权人已经公开的肖像;
      (二)为实施新闻报道,不可避免地制作、使用、公开肖像权人的肖像;
      (三)为依法履行职责,国家机关在必要范围内制作、使用、公开肖像权人的肖像;
      (四)为展示特定公共环境,不可避免地制作、使用、公开肖像权人的肖像;
      (五)为维护公共利益或者肖像权人合法权益,制作、使用、公开肖像权人的肖像的其他行为。

      第一千零二十一条 当事人对肖像许可使用合同中关于肖像使用条款的理解有争议的,应当作出有利于肖像权人的解释。

      第一千零二十二条 当事人对肖像许可使用期限没有约定或者约定不明确的,任何一方当事人可以随时解除肖像许可使用合同,但是应当在合理期限之前通知对方。
      当事人对肖像许可使用期限有明确约定,肖像权人有正当理由的,可以解除肖像许可使用合同,但是应当在合理期限之前通知对方。因解除合同造成对方损失的,除不可归责于肖像权人的事由外,应当赔偿损失。

      第一千零二十三条 对姓名等的许可使用,参照适用肖像许可使用的有关规定。

    b5725afb1f0f449dbcc94a85e7962281.jpeg

    3.2.6、侵犯该歌手的个人信息权

      如果AI 学习时所使用版权材料属某位歌手,未经允许,会侵犯该歌手的个人信息权。

      个人信息是以电子或者其他方式记录的能够单独或者与其他信息结合识别特定自然人的各种信息,包括自然人的姓名、出生日期、身份证件号码、生物识别信息、住址、电话号码、电子邮箱、健康信息、行踪信息等。

      例如歌手的声音在向公众发行、演唱音乐作品时是基于自身的愿望行为发布的,但仅用于公众以及相关主体在观看欣赏该歌手音乐作品的范围内使用歌手其个人信息。

      因此如果在该歌手声音未经其本人授权同意下私自使用,提取其声纹数据用于AI 学习训练,属于私自使用个人敏感信息,侵犯歌手个人信息安全权。

    相关的法律条文如下:

    个人信息:

      《个人信息保护法》以及《信息安全技术个人信息安全规范》(35273)规定个人生物识别信息属于个人敏感信息,而声纹属于个人生物识别信息。

    48eb83e1398d4be88ee0640e15dd2672.jpeg

    《中华人民共和国个人信息保护法》
    第四条 个人信息是以电子或者其他方式记录的与已识别或者可识别的自然人有关的各种信息,不包括匿名化处理后的信息。
    个人信息的处理包括个人信息的收集、存储、使用、加工、传输、提供、公开、删除等。

      第四章 肖像权
      对自然人声音的保护,参照适用肖像权保护的有关规定。
      如果没有符合《中华人民共和国个人信息保护法》第十三条 规定情形的,个人信息处理者方无权处理个人信息:

    第十条 任何组织、个人不得非法收集、使用、加工、传输他人个人信息,不得非法买卖、提供或者公开他人个人信息;不得从事危害国家安全、公共利益的个人信息处理活动。

    《民法典》

    第五章 民事权利
    第一百一十一条 自然人的个人信息受法律保护。任何组织或者个人需要获取他人个人信息的,应当依法取得并确保信息安全,不得非法收集、使用、加工、传输他人个人信息,不得非法买卖、提供或者公开他人个人信息。

    第一千零三十四条 自然人的个人信息受法律保护。
      个人信息是以电子或者其他方式记录的能够单独或者与其他信息结合识别特定自然人的各种信息,包括自然人的姓名、出生日期、身份证件号码、生物识别信息、住址、电话号码、电子邮箱、健康信息、行踪信息等。
      个人信息中的私密信息,适用有关隐私权的规定;没有规定的,适用有关个人信息保护的规定。

      第一千零三十五条 处理个人信息的,应当遵循合法、正当、必要原则,不得过度处理,并符合下列条件:
      (一)征得该自然人或者其监护人同意,但是法律、行政法规另有规定的除外;
      (二)公开处理信息的规则;
      (三)明示处理信息的目的、方式和范围;
      (四)不违反法律、行政法规的规定和双方的约定。
    个人信息的处理包括个人信息的收集、存储、使用、加工、传输、提供、公开等。

    《民法典》
      第一千零三十八条 信息处理者不得泄露或者篡改其收集、存储的个人信息;未经自然人同意,不得向他人非法提供其个人信息,但是经过加工无法识别特定个人且不能复原的除外。
      信息处理者应当采取技术措施和其他必要措施,确保其收集、存储的个人信息安全,防止信息泄露、篡改、丢失;发生或者可能发生个人信息泄露、篡改、丢失的,应当及时采取补救措施,按照规定告知自然人并向有关主管部门报告。

    b5725afb1f0f449dbcc94a85e7962281.jpeg

    3.2.7、算法模型的使用涉及版权

      如果所使用的算法模型为github上公开的一个开源算法模型,则无须获得相关权利人的同意,但需要遵守其主页上的使用条款。

      通常开源算法模型会标明仅供个人交流学习使用,不得进入生产环节;在发布生成物料时,不仅要表明该物料由AI生成,还要表明用于生成的原始声音来源,如果该原始声音来源于其他声音合成算法,还需遵守该等算法的使用规则。如使用者拟将模型用于生产领域等超出开源使用范围的使,需提前联系其开发团队。

    7cb74d24e0e244dbb5c625f4cab299ce.jpeg

    以下图片是使用算法模型后按开源要求标明声音版权的网络示例截图
    312dd79717e54606a6bab9c0eda610bd.jpeg

    a237148921ee4c5a82b7d0311123c2d1.jpeg

    ad4b5b3c84fe424cbd09ec9c4630ac7d.jpeg

    ca39c955ae2a41a6b869345101b02971.jpeg

    b5725afb1f0f449dbcc94a85e7962281.jpeg

    3.2.8、Ai学习版权材料过程中上传行为侵权。

      如果在Ai学习版权材料的过程中,发生将原素材或合成后的歌曲上传的互联网,会涉及侵权行为。

      例如将合成后的AI cover歌曲上传到互联网视频/音频网站,会侵犯了原词曲著作权人、录音制作者的信息网络传播权,如果用于直播,还会侵犯广播权。同时侵犯了版权歌手的“声音权”、个人信息相关权利。

      如果使用了未经授权的版权材料进行AI学习,并在AI学习过程中上传了受版权保护的材料,则可能会构成侵权行为。这可能会导致法律风险和版权所有者提起诉讼。大多数在线学习平台都有明确的政策,禁止用户上传受版权保护的材料。如果您的上传行为被发现侵犯了版权,可能会导致法律后果,包括被起诉和赔偿版权所有人的损失。

      因此,在使用任何版权材料进行AI学习之前,应该先获取版权所有者的授权或使用公共领域中的材料。同时,在任何情况下,都应该遵守适用的法律法规和道德标准,以确保不会侵犯任何人的权利。因此,在上传任何材料之前,请确保您有权使用该材料,或者取得了版权所有人的明确许可。

    四、如果AI可以使用版权材料进行学习,社会将会产生什么变化?

    7a7061e3e08347bfb325596e0c869d36.jpeg

    如果AI可以使用版权材料进行学习,社会将会产生以下变化:

    ▶ 1、对知识产权的认识可能会改变,促进相关的法律条文形成。
      现代社会非常注重知识产权,如果AI也可以使用版权材料学习,这可能会引发对知识产权的重新思考和辩论,因为AI使用版权材料可能被视为侵犯版权和知识产权,因此需要明确规定法律责任和法律保护。

    ▶ 2、法律和监管体系可能需要做出调整。
      如果AI可以使用版权材料进行学习,那么法律和监管体系可能需要更加严谨和复杂的规定和程序,以确保知识产权和商业利益得到保护。

    ▶ 3、AIGC等Ai专业知识将会普及。
      AI使用版权材料进行学习将有助于专业知识普及,因为没有了版权限制学习,AI使用的学习材料大大增加,推进了AIGC的普及。同时Ai相关的机器学习算法可以在大量的文献和材料中迅速获取关键信息和领域知识,进而提高专业水平。

    ▶ 4、教育和科学研究会受益良多。
      AI如果可以使用版权材料进行学习,这将为教育和科学研究带来极大的好处。将改变教育方式和学习方式,因为教育机构和学习者可以使用AI技术和资源,从而提高学习效率和学习质量。AI将能够更快、更深入地学习知识,从而为这些领域带来革命性的变化。

    ▶ 5、娱乐和媒体产业可能会受到影响。
      如果AI可以使用版权材料进行学习,那么这将打破目前娱乐和媒体产业的商业模式,可能会导致他们的收入下降。

    ▶ 6、更多的创新产出。
      AI使用版权材料进行学习可能会带来更多的创新产出,因为AI可以在大量的文献和材料中发现新的模式和趋势,从而启发新的创意和想法。

    ▶ 7、数据隐私问题:
      AI使用版权材料进行学习可能会引发数据隐私问题,因为AI需要获取大量的数据进行学习和分析,这可能会涉及个人隐私信息的使用和保护。

      总之,如果AI可以使用版权材料进行学习,这将是一个影响深远的变化,可能会引发各种社会、经济和法律问题。

    48a4ff2159cc4468af66cf37e3cb6a91.png

    五、参考附录

    https://mp.weixin.qq.com/s/9pF-imax4O5P4zS02lFRRw
    https://www.thepaper.cn/newsDetail_forward_23055228
    http://www.xinhuanet.com/politics/2019-12/02/c_1125295745.htm
    https://mp.weixin.qq.com/s?__biz=MzAxMDI2MzQyNA==&mid=2650873242&idx=1&sn=a740a34247f00c22d3ad8484bc91c170&chksm=80a6b375b7d13a6329960aab6b3785d10d5e85619b6a54d320f7390f90a3eac7bdd8b717d2df&scene=178&cur_album_id=2345740510742773762#rd
    https://space.bilibili.com/1409720561
    https://www.bilibili.com/video/BV1gm4y1g71w
    https://www.bilibili.com/video/BV14u41177uJ

    踩0 评论0
  • 回答了问题 2023-11-28

    【藏经阁一起读(78)】读《Apache Tomcat 的云原生演进》,你有哪些心得?

    一、读后感

      Tomcat 是一个非常完整、完善、功能非常强大的开源项目。我们每个人开始做开发,接触的第一个项目可能就是 Tomcat。在应用服务器的发展历程中,Apache Tomcat 在其中扮演着极其重要的角色。从最初的 WebLogic 到 Jboss , 到Tomcat/Jetty , 再 到 现 在 Spring Boot 使 用 的 嵌 入式 Tomcat,我们见证了应用服务器从封闭到开源,逐步轻量化的演变过程。
    2023-11-27_214721.jpg

      文章中,威胁建模部分的分析提醒我们注意,在云原生时代,针对Tomcat的威胁建模需要结合具体的云环境和应用场景进行分析和评估,综合采取多种防护手段,以确保应用程序的安全性和稳定性。

    2023-11-27_232921.jpg

      在云原生时代,威胁建模是指对云原生环境中的威胁进行建模和评估,以便确定可能的威胁来源、攻击方式和影响程度,并采取相应措施进行预防和应对。这是云原生安全的重要组成部分,因为云原生环境具有高度动态性和复杂性,而传统安全防护手段已经不能完全适应。

      Tomcat是一个开源的Web应用服务器,常用于Java应用程序的部署和运行。由于Tomcat具有广泛的使用和部署,因此也成为了攻击者针对Web应用程序的目标之一。

      不同公司有不同企业文化,在威胁建模应用上面的要求和部署也大不相同。一些企业可能因为在功能设计上的一个缺陷,后期维护运营时需要花上数百倍费用来修补,当然需要在设计阶段更多下功夫。在云原生时代,威胁建模对各个流程环节的细化把控,应用的级别,也会有理念上的冲突,需要全局权衡来看待里面的安全风险和解决方案。

    ​​

    二、文章知识点摘要

    2.1、Tomcat的技术内幕和在喜马拉雅的实践

      主要对 Tomcat 的网络 io,线程模型,内存模型,类加载机器,以及对像池技术做了一个介绍

      作者通过在喜马拉雅的实践,总结出了以下几点经验:

      NIO 模型主要分为三个部分 Accept 线程,Poller 线程,Catalina work 线

      NIO2和 NIO区别比较图:
    2023-11-27_204934.jpg

      那么到底怎么选呢?

      作者在文章中给出了建议:

      Tomcat 9 和 10 默认的还是 NIO。通过官方的配置我们也能看得出来,它建议的还是 NIO。
      虽然切换次数减少了,系统调用次数减少,系统的切换减少了。但是性能在我们平时功能可能感觉不到,所以对于稳定还是 NIO 这种模式。

    2.2、GraalVM static compilation in web container application(Web容器应用程序中的GraalVM静态编译)

    2023-11-27_210114.jpg
    2023-11-27_210151.jpg

      从这张图我们可以看到,一个 Java 应用从启动到运行到性能的峰值,中间还是会经过一个比较长的时间,包括虚拟机初始化、应用初始化、应用预热等等过程。这就是 Java 应用/Java Web 应用启动比较耗时的原因。

      解释执行编译的过程,Java 程序它是解释执行,它在解释的过程中会把我们的代码全部逐步地加载到内存中,因为它不知道哪一块代码需要,哪一块不需要,所以实际加载的代码会比实际要执行的代码要多很多。这个就是应用在运行过程中的额外的内存开销。

      解决办法是静态编译技术

    2023-11-27_213552.jpg
    2023-11-27_213820.jpg

      上图右侧是微服务的框架,在适配了静态编译之后,展示了在启动速度、运行时、内存占用方面的表现,可以看到提升还是非常大的。

    2023-11-27_214028.jpg

      任何技术都有两面性,静态编译也是一样。它虽然有很多优势,但也存在着一些不足。

    • 它让动态特性使用起来比较麻烦,
      如果它把某些代码误识别为不需要执行了,这些代码就不会包含在可执行文件里了。因此就会使运行过程出现问题。
      解决这个问题的方法是,动态特性可以通过配置文件,把程序里的动态特性做一些标注。
    • 在静态编译的时候,它会把配置文件里相关的类编译进去。

      解决这个问题的方法是,动态特性可以通过配置文件,把程序里的动态特性做一些标注。在静态编译的时候,它会把配置文件里相关的类编译进去。

    2023-11-27_214436.jpg

      GraalVM 提供了native-image-agent 的工具,也就是在静态编译之前,我们预执行一下,这样它就可以把应用程序中所有和动态特性的内容都扫描出来了,然后把它记录在配置文件里。等到静态编译的时候,它就会把相关的东西都包含进去,这样就解决了代码里面动态特性可能会被误识别的问题。

    2023-11-27_214605.jpg

    静态编译助力 Java Web 容器云原生

    2023-11-27_215011.jpg

      作者测试的一些比较复杂的 demo,可以看到不光是简单的应用,复杂的应用通过静态编译之后,它的启动时间、运行时内存占用也都有非常明显的改善。

    2.3、威胁建模

    2023-11-27_233114.jpg

      在信息安全领域,很重要的三个基本要素是CIA——

    • 机密性(Confidentiality):保护信息免向未授权的人披露
    • 一致性(Integrity):保护信息免受未授权的人更改
    • 可用性(Availability):让信息供已授权的人需要时可取用

      当我们谈论安全时,我们会想到三个支柱或者想要达到的三个理想状态,它们是保密性、完整性和可用性。

      STRIDE 模型是为您的应用程序创建威胁模型的有用工具。
      STRIDE 是首字母缩略词,它包含:

    • Spoofing欺骗
    • Tampering篡改
    • Repudiation否认
    • Information disclosure信息披露
    • Denial of service拒绝服务
    • Elevation of privilege特权提升

    2.4、Apache Sling

    apache-sling-logo-CB1E5A5F90-seeklogo.com.png

    Apache Sling是一个基于Apache Felix OSGi容器构建的开源Web框架。它旨在通过提供一个 RESTful Web 框架来简化面向内容的 Web 应用程序的开发,该框架将 HTTP 请求 URL 映射到基于 JCR(Java 内容存储库)规范的内容资源。

      Apache Sling提供了一个模块化架构,允许开发人员通过使用OSGi捆绑包来添加功能。这种模块化设计使扩展和定制框架变得容易,以满足特定的项目要求。

      Apache Sling的主要功能之一是能够以各种格式呈现内容,包括HTML、JSON、XML等。这使得开发可供各种客户端(包括移动应用程序、Web 浏览器和其他系统)使用的 Web 应用程序变得容易。

      Apache Sling 是一个基于 Java 开发 web 应用程序的框架。它的主要特征是 RESTful,它组织了你的数据库或者分层结构中的资源。

      现在 Apache Sling 中的一条信息被称为资源,它有一个名字,非常简单的属性,可以是字符串、日期、二进制属性和可选的父属性。

    2023-11-28_001224.jpg

      这基本上就是创建分层所需要做的一切,所以你不需要弄清楚如何创建一致的资源树,你的 API 端点应该是什么,是 /user/articles /comments 等等。你已经创造了资源并将它们填到了树中,就像在数据库中创建条目一样。当然也有一些,您可以从 Apache Sling 中
    获得默认表示。所以不需要写 JSON 导出器,默认 XML 等。

      Apache Sling 的特殊之处在于它维护了用户的身份贯穿应用的所有层。这个的意思是,当用户请求使用浏览器或者命令行工具的时候,它自带会话 cookie 或身份验证数据。当它转到 Sling 时,Sling 能够确认用户的身份,然后将“这是 John Doe”,转给内容存储库。

      Apache Sling 的另一个特点是有安全性,即 XSS 保护。这意味着当在模板的脚本中呈现内容时,HTML 模板语言引擎意识到它是在 HTML 上下文中编写的,它会根据上下文自动转义输出。如果是 HTML 标签,它知道该怎么做。同样,如果它是一个属性,它知道该怎么确保内容不脱离边界。

      Apache Sling是一个功能强大的Web框架,可简化以内容为中心的应用程序的开发。它使用 OSGi 和 JCR 技术,以及其模块化架构,使其成为各种 Web 项目的灵活且适应性强的选择。

    踩0 评论0
  • 回答了问题 2023-11-21

    【藏经阁一起读(77)】读《Apache Dubbo3 云原生升级与企业最佳实践》,你有哪些心得?

    一、前置知识

    1.1、Dubbo是什么

      Dubbo3 是一款微服务架构,它帮助解决微服务开发中的通信问题。
      它不绑定编程语言。
      目标是为所有主流语言提供对等的微服务开发体验

    2023-11-20_200310.jpg

      Dubbo从架构图上分为数据面和控制面
      在数据面,使用Dubbo开发的微服务进程间基于RPC协议通信,由一系列可选的微服务治理组件构成,负责Dubbo集群的服务发现、流量管控策略、可视化检测等。
    2023-11-21_151803.jpg

    1.2、Dubbo具体提供了哪些核心能力?

      首先,Dubbo 作为服务开发框架解决了业务应用中微服务定义、暴露、通信与治理的问题,为业务应用开发定义了一套微服务编程范式。
      具体来说,Dubbo为业务应用开发提供了微服务开发API、RPC协议、服务治理三大核心能力,让开发者真正的专注业务逻辑开发,

    2023-11-21_152430.jpg

      Dubbo不是应用框架的替代者,它可以很好的工作在每种语言的主流编程框架之上,以Java为例,Dubbo可以很好的与Spring协作,并在此基础上提供服务定义、微服务编程、服务发现、负载均衡、流量管控等能力

    2023-11-21_153353.jpg

      在通信方面,Dubbo区别于其他RPC框架的是它不绑定特定协议,你可以选择HTTP/2、Dubbo2、REST、gRPC、REST、Hessian等任何通信协议,同时享受统一的API、以及对等的服务治理能力

    2023-11-21_154131.jpg

      Dubbo的另外一个优势在于其可扩展性设计,从流量管控、协议编码、诊断调优、再到服务治理,你都可以去扩展,满足企业级微服务开发与运维的所有诉求,

    2023-11-21_154713.jpg

      基于扩展能力Dubbo官方提供了丰富的生态适配,涵盖了所有主流的微服务开源组件

    图片1.jpg

      对于服务网格架构,Dubbo也可以很好的接入原生Istio体系,在数据面支持与Envoy部署的Proxy模式,也支持无Envoy的Proxyless模式,提供更灵活的数据面选择

    2023-11-21_155624.jpg

    1.3、Dubbo特点:

    • 快速上手,让开发者专注业务开发
    • 服务治理,实时监测、管控集群状态
    • 超高性能,面向百万实例集群设计
    • 企业级解决方案,多年企业生产环境检验

    二、书中案例

    书中有7篇文章,我留意了这篇:
      政采云基于 Dubbo 的混合云数据跨网实践
      作者:王晓彬,政采云资深开发工程师

      政采云的业务是为政府提供的购物网站,类似于淘宝。政府采购会在政采云上做企业采购、 政府采购的业务。
      云岛中的“云”是指我们的云平台,是公司内部,完全可控的局域网。技术上对应的是一套微服务框架。
      岛端它可能是局域网或者是私有网络,它可能是完全隔离的一个岛。他们的安全策略和开端口的东西都是他们自己定义的,这就是我们云岛的业务结构。比如安徽或者山西它们都有自己的局域网,如果我们在它们那里也部署一套这个服务框架,就叫“岛”。我们的云平台主要是给浙江省和其他相关的区划用的。
    我们的云和岛之间存在数据传输的问题,举个例子,比如我现在收到一个政府的公告,而这个公告可能是全国性的。那么我可能会在云平台的管理平台上去录公告,再把它推送出去,这个时候云和岛之间就存在了一些数据的同步。

    混合云岛网络的特点

    • 平台的一致性。
    • 网络连接与能力复用。
    • 统一的平台管理。
      2023-11-21_202416.jpg

    政企网络痛点
    政企网络有以下几个特点:

    • 网络复杂。
    • 安全要求高。
    • 业务驱动运维。
      2023-11-21_213201.jpg

    2.1、第一个方案,基于 Dubbo Filter 的单向方案。

    • 第一个特点,单向传输。
    • 第二个特点,在本地部署业务的 provider 过滤器是运维上的负担。当岛端需要把数据同步 给云端的时候,也就是从岛端的业务 Web 传输到云端的业务 provider。这个时候我必须 在岛端也部署一套业务的 provider 才可以。

    2023-11-20_222931.jpg

    2.2、第二个方案,网状点对点方案。

    2023-11-20_223541.jpg

      网状点对点方案。因为岛和岛之间需要网络互通,所以就会单独开通这个点 和你需要传输的点之间的端口。开通之后我们就可以调用了,调用的形式可以用 Dubbo, 也可以用其他。 这个方案有一个很明显的缺陷,线特别多,所以点和点之间开通的复杂度也很高,对后面 的扩展可能也非常不利。
    以上方案存在的问题包括:

    • 单向传输、
    • 白名单开通成本高、
    • 平台维护成本高、
    • 公共功能的缺失。

    2.3、第三个方案,高速公路

    基于以上的问题,我们做了一个新的方案,叫高速公路。

    2023-11-21_220055.jpg

    想要达到的效果是:

    • 只建一次,可复用。
    • 隧道机制。
    • 考虑传输性能。

    2.3.1、Dubbo 的客观接入方式

    Dubbo 的客观接入主要有以下三种方式:

    • 第一种,注解方式。
        使用@DubboReference 提供的通用 parameters 参数,设置路由目标,可以达到方法粒度的路由。路由信息写在中间parameters那里,parameters是Dubbo 给我们提供的通用参数的传递。
    • 第二种,配置中心指定。
        它完全可以把接入方式替换 掉,parameters 的信息在配置中心配置也可以,只要 SDK 可以支持就好。这种方式其实 代码是完全无侵入的,就是跟跨网之前和跨网之后没有任何区别。
    • 第三种,线程指定。
        当你在线程里指定了路由信息,下面再去调用的时候,这次调用就会 走你的路由。如果再调用一次,它就会调回本地。因为基于线程的形式,在 Dubbo 的扩展 里,它会在调用完成之后把线程信息清理掉。所以需要注意一下,如果你想多次调用,就 需要写多次。如果不想写多次,你可以用上面这种方式,你只要注入在当前的 bean 里, 都是路由到上海。

    2.3.2、高速公路的架构

    2023-11-20_225054.jpg
    2023-11-20_225246.jpg

    2.3.3、隧道的机制

      隧道技术是一种通过使用互联网络的基础设施在网络之间传递数据的方式。使用隧道传递的数据(或负载)可以是不同协议的数据帧或包。
      高速公路架构中,使用了隧道这个概念。两端(业务层)是 Dubbo 私有协议,跨网传输过程中,则使用了 http 协议,http 协议可以更好的被中间设备、网关识别转发。这个机制的最大便利在于对业务的低侵入性。对于业务集群的应用完全不需要修改。
      隧道机制的作用是屏蔽网络的复杂性,屏蔽中间的协议转换, 给用户一个统一透明的调用方式

    2023-11-21_000633.jpg
    2023-11-21_004831.jpg

      这个机制的好处是,基本上 Dubbo 的所有特性都能支持。但也有一些个例,比如 token 和网络相关的机制

    2.3.4、未来规划

    2023-11-21_001158.jpg

    三、读后思考

      这篇案例介绍了政采云基于 Dubbo 的跨网方案落地过程中面临的技术挑战、分析对比了几个方案的优缺点。
      对云岛业务结构的公司来说,云平台属于公司内部、完全可控的局域网,而岛端则是有自己安全网络策略的独立内部网络。需要云岛通信时,会基于需求,按客户要求走流程开通一些端口,这个过程需要一定的成本且不完全可控。业务上,如果这种跨网需求增多,则会逐渐变成痛点。如果可以搭建一个透明的跨网传输网络,配合良好的顶层设计,就可以在业务支撑、安全管控和运维成本中寻求较好的平衡。
      一个项目,我们通常能选择的跨网方案非常多,但最终我们会去选择一个能解决痛点的,而不是完美的方案。稳定、高效、可靠的基础设施是互联网企业应对业务高峰流量的底层基石。落地方案一般来说都比较保守,这很多时候跟政企业务特殊性有关。但我们对于架构的思考,一定是需要更超前的。随着方案的落地,后期需要从稳定性、功能增强、新技术探索三个方面去做深、做广。
      在政采云这种政企业务场景中的数据跨网,与业界公有云、自建私有云的公司相比,既有共性又有自己的特点,通过参考别人的案例,我们可以从中得到新的思路和启发。

    踩0 评论0
  • 回答了问题 2023-11-20

    如何看待阿里云发布的全球首个容器计算服务 ACS?

    以下是我的个人对本期话题看法:

    一、你如何看待容器计算服务 ACS 的发布?

    pawmkwdq37c7s_72d66e40ec2f4332ab51086b1e6fcfb4.png

      容器技术是当下IT行业最炙手可热的技术之一,大部分最终用户在生产中会使用到K8s和相关容器技术。随着容器化上云成为新常态,如何紧贴业务需求、避免资源浪费成为新的挑战。
      2023云栖大会阿里云发布全球首个容器计算服务 ACS,ACS是全球首款容器计算服务 (Alibaba Cloud Container Compute Service,简称 ACS)。
      ACS 是一种基于 Kubernetes 的容器服务,为用户提供了一个快速创建、轻松运维、高可用性的容器集群的平台,支持多种应用场景。ACS 通过调度技术,将计算资源自动化到容器内,提高了资源的利用率和应用程序的可伸缩性。
      ACS 以 K8s API为算力使用界面,采用Serverless 形态的算力交付模式,用户无需关注底层节点及集群的运维管理,并且同时支持资源预留及按需弹性的模式。算力资源除了支持用户的应用负载以外,更支持了用户灵活调配给阿里云云产品的负载使用。
      另外,ACS 还具备自动化伸缩、全面监控、快速部署等优势,可以大幅度降低企业 IT 人员的运维负担,提高其效率和竞争力。
      开发者通过 ACS 服务可以更灵活的支配算力,这种容器与资源一体化的方式可以说是大大降低了 Kubernetes 和用云门槛。
      容器计算服务 ACS 的发布是一个令人兴奋的消息,是一个重大的里程碑。它将容器和资源一体化,重新定义了容器算力,并升级了算力交付模式为 Serverless 形态。这意味着客户可以更灵活地支配算力,并且可以根据需求随时调整。这种全新的形态和打破常规的产品对于降低企业使用容器和 K8s 的成本具有潜力。它使得云计算和容器化技术更加普及和便捷。容器可以Serverless形态交付算力,随需随调。
      个人觉得,如果运营和后期技术跟得上,ACS 将进一步推动容器化技术的发展和普及,为用户提供更加高效和可靠的云计算服务,有助于推动企业的数字化转型。


    二、你认为 ACS 的产品设计能降低企业使用 K8s的成本吗?

      从ACS产品设计的角度来看,ACS 的发布有望降低企业使用 K8s 的成本。它将容器和资源一体化,重新定义了容器算力,并升级了算力交付模式为 Serverless 形态。这意味着客户可以更灵活地支配算力,并且可以根据需求随时调整。这种全新的形态和打破常规的产品对于降低企业使用容器和 K8s 的成本具有潜力。
    2023-11-20_105725.jpg
    ①、ACS 支撑的负载类型更加丰富,这意味着企业可以使用 ACS 来运行不同类型的应用程序,而不仅仅是传统的无状态应用。
    ②、ACS 将容器和资源一体化,使得资源的管理和调度更加高效,从而降低了成本。
    ③、ACS 的 Serverless 形态意味着用户只需支付实际使用的算力,而无需预先购买或配置资源,进一步降低了成本。
    ④、ACS 支持超灵活的 Pod 资源规格配置,0.25c/0.25GB 起步,提供了 1:1~1:8 的 CPU 与内存配比选择,有助于灵活匹配业务需求,
    ⑤、ACS支持秒级弹性和秒级计费,可实现随流量峰值波动实时计算费用。
    ⑥、ACS支持资源预留,可保障算力资源的确定性和业务稳定运行,同时可避免资源浪费。
    ⑦、ACS支持秒级弹性能力,可应对业务的快速扩容,业务资源占用贴近流量曲线,减少资源浪费。
    ⑧、ACS 支持节省计划,可享受产品折扣权益。
    ⑨、ACS 提供3 种实例类型(通用型实例、任务型实例、独享型实例),在这三种类型中,ACS 都实现了屏蔽机型和代际的功能,可以帮助客户在面对多种不同场景和负载,需要多种类型互相做组合和应用时,自动实现最优的性价比,可节省多达 20% 的资源成本。


    三、对于这款新产品,你有哪些好奇的问题?

    ①、ACS 如何保证稳定性?在将容器和资源一体化的过程中,是否会引入新的稳定性问题?
    ②、ACS 是否支持跨地域的部署和扩展?这对于需要在不同地区运行应用程序的企业来说非常重要。
    ③、ACS提供了监控和日志功能,这对于故障排除和性能优化至关重要,单这些是针对单租户还是多租户?假如某个用户租户租了几个容器资源,是否有一个全系统的监控入口(可以看到下面所有租的资源运行情况,而不是单独一个一个去查看)
    ④、ACS 是否与其他阿里云产品集成?是否可以与其他服务无缝结合?
    ⑤、因为是全球首个容器计算服务 ACS,ACS 的生态系统应该还是比较薄弱的,社区支持和开发者资源如何尽快完善?
    ⑥、ACS 本质上是把 Kubernetes 从一个模块型的服务变成了容器算力一体化的产品形态,是把 Kubernetes 这样一个单租户系统变成多租户,那么如果在在某些场景下,开发者可能需要直接调用 Kubernetes 的 API,ACS 还能不能满足这种需求?
    ⑦、ACS 能根据用户的需求定制主机规格吗?
    ⑧、对于新产品,一般都是采用观望态度,除非有令人信服的成功案例在先,才会决定采用。ACS如何打开局面?
    ⑨、ACS安全性、隔离性、稳定性如何?上云带来的是便捷的运维方式和较低成本,但也引入了一些风险,如何保证安全和风险避规?


    四、附录

    https://www.aliyun.com/product/acs?spm=a2c6h.13066369.question.4.42ab6ec8dxjVsU

    踩0 评论0
  • 回答了问题 2023-11-19

    1024特别话题|AIGC 是通向 AGI 的那条路吗?

    一、AIGC 是通向 AGI 的那条路吗?

      AIGC作为一种新型的利用人工智能技术生成内容的方法,提供了一个推动 AGI 研究的契机,但它本身并不是通向 AGI 的唯一路线。

      AGI 是 Artificial General Intelligence 的缩写,中文翻译为“通用人工智能”,通用人工智能(AGI)是指一种人工智能系统,能够像人类一样具有广泛的自主思考、学习和理解能力,可以适应多种任务和环境。

      实现AGI需要克服许多技术难题,涉及多个领域和多种方法的综合性工作,需要在算法研究、硬件设计、认知科学、哲学等方面做出大量的探索和创新,如感知、推理、学习、创造等方面。

      AIGC只是其中的一种尝试,它可能在生成内容领域取得一定成果,但距离实现AGI还有很长的路要走。为了推动 AGI 研究,需要整个人工智能领域的不断发展和协作。

    二、当前实现真正的 AGI 会存在哪些卡点?

      实现真正的AGI(通用人工智能)需要解决许多挑战和难题,以下是一些可能的卡点:
    1. 识别意图和情感:
      AGI需要具备类似于人类的意识和主观性,能够自我意识和主观体验。人类在与他人交流时能够准确识别并理解他人的意图和情感,这是实现真正AGI所必需的能力。但对计算机而言,理解语言中的意图和情感是一项非常困难的任务。我们用GPT、AIGC时,经常会发现和AI沟通,出现AI理解错我们意图和情感的笑话,这就是实现AGI需要解决的识别意图和情感难题。

    2. 自我学习和适应能力:
      AGI需要具备类似于人类的学习和适应能力,能够从环境中不断地获取信息,理解并适应环境。实现真正的AGI需要让计算机具备自我学习的能力,即能够自主地从经验中学习和改进自己的算法。目前,机器学习算法和人工神经网络的发展已经有了很大进展,但实现真正的自我学习还有很长的路要走。

    3. 抽象思维和推理:
      抽象思维和推理是人类智能的重要组成部分,但目前的计算机并不具备这种能力。实现真正的AGI需要让计算机能够进行高阶抽象思维和推理,用逻辑推理解决问题。

    4. 创造力和想象力:
      创造力和想象力是人类智能的独特特征,实现真正的AGI需要让计算机具备一定的创造力和想象力,能够在新问题和新场景下创造性地解决问题。

    5. 伦理和人类价值观:
      AGI需要能够理解和尊重人类的价值观和伦理标准,能够遵守道德规范。实现真正的AGI需要考虑到伦理和人类价值观的因素,保证其不会对人类社会造成危害。这需要让计算机具备对伦理和人类价值的理解和尊重。

    6. 数据隐私和安全:
      实现真正的AGI需要大量的数据,但这也带来了数据隐私和安全的问题。需要解决如何保护个人数据隐私和防止黑客攻击等问题。

    7.自然语言处理:
      能够自然地理解和产生语言,并能够进行自然语言的理解、生成、翻译、理解情感和推理等任务。

    8. 知识表示和推理:
      AGI需要能够掌握和组织大量的知识,能够进行复杂的推理和决策。

    9. 安全和控制:
      AGI具有很强的控制和权力,需要确保其安全性和可控性,避免其对人类带来威胁。

    10.算力:
      如何提升算力资源统筹供给能力

    11.数据:
      如何保证AGI所需高质量数据要素的供给。

    12.算法:
      如何构建具有精度、效率、可扩展性、鲁棒性、可解释性的恰当人工智能算法,系统构建大模型等通用人工智能技术体系。

    13.应用:
      如何推动通用人工智能技术创新场景的应用。

    14.监管:
      需要为AGI营造包容审慎的监管环境。

    踩0 评论0
  • 回答了问题 2023-11-15

    云栖畅聊|虚拟数字人会替代真人主播吗?

    话题:你看好数字人领域的发展吗?

    是的,我看好数字人领域的发展。数字人领域的发展主要由领域的目前现状(概念,现有的众所周知的虚拟数字人代表,数字人主要涉及的技术、虚拟数字人产业发展现状,数字人领域发展趋势等几个方面因素决定。

    原因有如下几点:

    (本文参考引用了网上资源,见附录参考文献)

    一、虚拟人、数字人、虚拟数字人基本概念

      虚拟人、数字人、虚拟数字人都是指通过计算机技术创建的人工智能实体,但它们有一些不同之处:

    1.1、虚拟人(Virtual Person)

    虚拟人(Virtual Person):

      虚拟人是一种通过计算机图形学和虚拟现实技术创建的人体模拟实体,通常指在虚拟世界中的人物形象,例如网络游戏中的角色、电影中的特效人物、动画和虚拟现实等领域。
    虚拟人的外貌、动作和行为可以像真人一样逼真,但它们通常缺乏智能和自主性。

    • 1)、人物的身份是虚构的,现实世界中不存在的。
    • 2)、虚拟人没有现实世界中的身体,它是通过计算机图形学技术和虚拟现实技术进行制作的,虚拟人的本体存在于各种计算设备中(例如电脑手机平板等),虚拟人需要通过显示设备来呈现,才能让人类的眼睛看见。
    • 3)、虚拟人具有人类身体的外观形体结构和行为模式,表现出来的行为模式是与人类相仿的,可以呈现出某种指定角色的人类的活动。

    1.2、 数字人(Digital Human)

    数字人(Digital Human):

      数字人是一种通过计算机技术创建的人类形态的虚拟实体,指通过数字化技术生成的人物形象,包括人的外貌、语言、行为等,其目的是模拟人类的外貌、内部结构和行为模式。数字人具有一定程度的智能和自主性,可以根据不同情境做出反应和决策。数字人通常用于医疗、教育、娱乐影视特效、广告、教育等领域。
      数字人称之为数字人,是强调了它存在于数字世界。而数字世界是人类设计运行于计算设备上的代码和数据,它是计算设备上运行的程序,数字世界是0和1这样的数据,相对于人类物理世界来说,物理世界是真实的,数字世界是虚拟的。数字人基本满足虚拟人的第二、三项特征,稍有区别的是,数字人的身份设定可以是按照现实世界中的人物进行设定,外观也可以完全一致,按照真人还原制作的数字人也可以称为数字孪生。

    2023-11-08_123608.jpg
    2D数字人:
      通常是指二维平面上的数字人物,是指二维的平面画像或者动画人物,通常只有二维的表现形式,无法在真实的三维空间中运动和交互。2D数字人是通过绘制或者制作2D动画软件来实现的,如卡通人物、二维游戏角色等。

    2023-11-08_125418.jpg
    3D数字人:
      则是指三维的立体模型,是指以三维空间建模为基础的数字人物,通过计算机图形学建模软件创建,可以在真实的三维空间中自由运动和交互。3D数字人具有更真实的外观和更高的可交互性。相比较而言,3D数字人在表现形式和逼真程度上更加接近真实人物,且可以进行更加自由的姿态、动作和表情的表达。可以更真实地呈现物体的大小、形状和深度感,可以与环境中的其他物体进行交互,如碰撞、移动等。3D数字人还可以使用更高级的动画技术,如骨骼动画、肌肉动画等,使其运动更加流畅和逼真。3D数字人更加适用于虚拟现实、增强现实等应用领域。

    1.3、虚拟数字人(Virtual Digital Human)

    虚拟数字人(Virtual Digital Human):

      是指通过计算机技术和人工智能算法构建的数字化人物,也被称为数字人或虚拟角色。虚拟数字人是一种结合了虚拟人和数字人的特点的人工智能实体。是在虚拟世界中通过数字化技术生成的具有独特人格、语言、行为等特征的人物形象,它们可以拥有人类相似的逼真的外貌、语言、行为和情感,并能够像真实的人一样进行互动,还具有一定的智能和自主性。
      虚拟数字人通常用于虚拟现实、人工智能、人机交互、游戏、智能机器人等领域,可以被用于电影、电视剧、游戏、虚拟现实等多种媒介中,以及人机交互、教育、医疗等。数字人的制作需要使用计算机生成技术,包括建模、动画、渲染、声音合成等。

    与具备实体的机器人不同,虚拟数字人依赖显示设备存在。
    虚拟数字人宜具备以下三方面特征:

    • 一是拥有人的外观,具有特定的相貌、性别和性格等人物特征;
    • 二是拥有人的行为,具有用语言、面部表情和肢体动作表达的能力;
    • 三是拥有人的思想,具有识别外界环境、并能与人交流互动的能力。

    1.4、侧重点区别

    2023-11-13_043810.jpg

      如果虚拟人定义没有虚拟身份设定的要求,只强调其存在于虚拟数字世界的性质,那么和数字人就没有区别。
      虚拟人强调的是虚拟世界中的人物形象,
      数字人强调的是数字化技术生成的人物形象,
      虚拟数字人则是二者的结合,更注重创造出具有独特人格的虚拟角色。
      在不要求必须具备思想和交流互动的能力前提下,虚拟人和虚拟数字人是等价的,虚拟数字人强调虚拟身份和数字化制作特性。
      数字人的范畴包含虚拟人,虚拟人的范畴包含虚拟数字人。
      在现在虚拟数字人发展趋势下,不细分,数字人、虚拟人、虚拟数字人这三者概念可以认为是等同的。

    二、细数那些众所周知的虚拟数字人(排名不分先后)

    1、初音未来

    Ch_logo_miku_pc.png

      2007年,日本克理普敦未来媒体推出了虚拟歌姬初音未来,推出后大受欢迎,其创作热度自推出后一直持续至今,可以说初音未来打开了虚拟人创作的大门。
      虚拟人“初音未来”的的角色设定是歌姬,有具体的人物资料,擅长流行歌曲,摇滚乐和舞蹈,网上传播的初音未来的图像视频主要是歌舞类型。
      初音未来(日语:初音(はつね) ミク,平文式罗马字:Hatsune Miku)是Crypton Future Media株式会社企划、开发、贩售的,使用YAMAHA的VOCALOID引擎和Crypton自主研发的NT歌声合成引擎的声音库软件及其拟人化形象。
      “初音”有“初次的声音”(日语:初めての音)的意思,而这里的“声音”指的是歌声[7]。同时,“初音”也象征着“出发点”,而“未来”象征着VOCALOID所代表的未来的音乐的可能性[6]。“初音未来”也可以理解为“从未来传来的最初之声”。
    800px-MikuNewType_main.png

    ​​

    2、数字人龚俊

    2023-11-07_234646.jpg
    真人龚俊

    2023-11-07_233334.jpg
    数字人龚俊

      数字人龚俊是数字人。
      龚俊拥有真人龚俊一样的俊美脸庞和同款声音,他能听懂你在问什么,并做出回答。在百度APP里,每个人都可以拥有龚俊数字人并24小时可以进行互动。
      2022年,龚俊数字人发布新歌《2021在说啥》刷屏全网,歌词中包含了2021年度十大网络热词,明朗的旋律也令网友们直呼洗脑。

    ​​

    3、虚拟人邓丽君

    “照片写实级”数字人
    2023-11-07_235629.jpg

      3D虚拟技术让邓丽君“重返”舞台,

      “邓丽君”的再现,意味着更多的数字虚拟人将走进现代人的生活。
      实时捕捉、实时渲染和实时驱动倾斜;运用单一消费级摄像头即可同步追踪细微的面部表情,以塑造逼真且具备情感表现力的全实时化数字角色,凭借这项顶尖虚拟人技术,与邓丽君天后级IP的创新结合。
      实时渲染是支撑虚拟人实时互动的核心技术。

    4、第一个超写实数字人AYAYI

      超写实数字人
    641 (2).jpg

      2021年5月20日,以“AYAYI”为代号的账号在各类社交平台开号发图。
      诞生于今年5月20日的AYAYI,是国内的第一个“Metahuman”(超写实数字人)。与虚拟偶像和虚拟主播不同,AYAYI在形象与外貌上更贴近真人,尽可能摆脱了“二次元”“卡通”这些词语的限制,而是从外观设计上看起来像个真实的“人”。
      “AYAYI的形象设计是在我们最初为她撰写的人物小传的基础上开始的。” AYAYI团队告诉21世纪经济报道记者,这份千字的人物小传包含了AYAYI的基本信息、个性特征、喜好兴趣等。
      领先的技术力量让AYAYI不仅五官与真人极为相似,在皮肤质感上也能做到对现实的高度还原。如果仔细观察她的每张照片,你还会发现,AYAYI所使用的数字引擎对于不同环境、不同光影条件具有很强的模拟和渲染能力,并在最终呈现时让每张照片更佳鲜活灵动。
      换句话说,她更像个活人了。

    5、全球首位数字航天员小诤

    小诤4.jpg
    小诤.jpg
      全球首位数字航天员小诤(超写实数字人)

      6全球首位数字航天员小诤“诞生”于腾讯游戏旗下NExT Studios(简称:NExT),由团队15名研发人员精心培育。其中包括虚拟数字人Siren(塞壬)制作团队的核心创始成员。

    6、高保真数字人siren(塞壬)(腾讯)

    Siren3.png
    高保真数字人

      在2017年启动的高保真数字人项目,取名于北欧神话中的女妖塞壬。
      据悉,当时这个项目的目标是Crossing the boundary:跨越影视和实时渲染边界,制作可实时交互的数字人物;在高保真角色基础上,进一步增加高精度的实时动作捕捉与渲染。

    7、Vivi子涵(京东)

    ViVi子涵.jpg

      ViVi子涵是北京齐乐无穷文化科技有限公司开发的一款真人复刻1:1建模的AI虚拟人,真人原型为当红齐天集团联合创始人马子涵,ViVi子涵具备真人实时表情、动作、AI语音驱动、AI动作驱动、AI绘画创作、智能问答等功能。
      通过齐乐无穷自主研发的实时渲染技术、0.1毫米级光学动作捕捉、深度摄像头的精确面部表情捕捉,多达172种的表情驱动、光学和惯性双重手势捕捉、自定义编解码方案等领先技术,ViVi子涵已经可以支持各类传统直播平台和VR直播。
      不同于市面上的CG虚拟人,通过XR实时虚拟直播技术能够实现实时互动,不仅可以高效低成本地生成视频、虚拟人更可以和消费者进行深度沟通和互动,与用户建立更加紧密的关系。

    8、虚拟偶像女团A-SOUL女团(乐华娱乐、字节跳动)

      组合A-SOUL是乐华娱乐年度最新企划中打造的虚拟偶像女团,共由五名成员(向晚Ava、贝拉Bella、珈乐Carol、嘉然Diana、乃琳Eileen)组成,于2020年11月23日首次公开;
    乃琳Eileen.jpg
    向晚Ava.jpg
    珈乐Carol.jpg
    嘉然Diana.jpg

    9、清华大学首位AI虚拟学生华智冰

    华智冰.jpeg

      2021年6月15日清华计算机系举行“华智冰”成果发布会,正式宣布“华智冰”入学清华计算机系
      9月28日,清华大学首位AI虚拟学生“华智冰”正面出镜唱歌,其歌声、人类特征均由人工智能技术完成。6月15日, “华智冰”入学清华计算机系,目前是一名大一学生。
      视频中的歌声、人类生物学特征以及人类面部形象均由人工智能技术完成。

    10、抖音虚拟美妆达人柳夜熙(创壹科技)

    柳夜熙1.jpg

      柳夜熙,女,抖音虚拟美妆达人,自称会捉妖。被称为2021年的“现象级”虚拟人。
      柳夜熙的形象与真人相差无几,清晰精致的五官。
      2021年10月31日,“柳夜熙”在其抖音账号发布了第一条视频,视频中不少真人围观虚拟人物化妆。在这个短短2分钟的视频中,融合了悬疑+美妆+剧情+后期特效技术。这个视频就收获了300多万赞,涨粉上百万。2021年11月1日,柳夜熙发布了第二条视频,点赞数同样近百万。
      2023年,柳夜熙与百家号合作短剧《今天也辛苦了》《如果人们看得见》。
      2022年,入选艾媒金榜(iiMedia Ranking)发布的《2022年中国超写实虚拟人10强榜单》排名第一

    11、百度公司度晓晓

    Video_20231107232156.gif

      度晓晓是百度公司推出的手机虚拟AI助手,是国内首个可交互虚拟偶像。
      2020年9月15日,在百度世界2020大会上,百度发布了一款搜索新产品 “度晓晓”。
      度晓晓拥有二次元形象,具备视觉识别能力,支持最自然的交流方式;能让搜索过程和结果都更加人格化,更接近人与人的沟通过程。还具备答疑解惑、娱乐互动、情感陪伴等能力,能全天24小时陪伴。
      度晓晓曾经主持节目、担任读书官、军事科普官、创作数字藏品、担任高考助理、挑战写高考作文、AIGC唱作歌曲、表演脱口秀、登上央视舞台、AI创作MV、担任制作人

    12、内地女虚拟歌手洛天依(Yamaha)

    洛天依2.jpg
    中国内地女虚拟歌手

      洛天依(Luo Tianyi),7月12日出生,是基于语音合成软件VOCALOID系列制作的女性虚拟歌手、虚拟偶像 ,形象由MOTH参与设计,声源是由山新、鹿乃担任 ,现隶属于上海禾念信息科技有限公司 。
      洛天依全名取自“华风夏韵,洛水天依”,承载着千年中国传统文化中人们对于美好和幸福的憧憬。
      洛天依对整个国产动漫行业来说是一个“风向标”,为国产动漫设计者们提供了丰富的灵感源泉,以她为范本打造出了一个较为完整的产业链,涵盖上游的动漫内容生产与制作,中游的动漫内容出版、传播与观看渠道,下游的动漫IP形象等一系列授权衍生商品,这也侧面印证了洛天依的号召力,为国漫发展带来黄金时代(北青网)
      洛天依作为首个中文虚拟歌手,为中国虚拟IP技术奠基了发展方向以及创作内容,作为中国第一位虚拟歌手,她有着可爱甜美的少女形象,加上治愈的声音和极具感染力的舞姿,颇受年轻人的喜爱,洛天依从第一场线上个人演唱会,再到央视春晚的首次亮相,完全打破次元壁垒,凭借她特有的表达方式,将中国经典文化与当代年轻人的潮流文化有机融合,赋予了更多国际化意义,成为中国虚拟数字人产业的“破冰者”(东方网评、光明网、央广网评综合评价)
      洛天依本身声音比较甜美,发音也字正腔圆,很适合调成戏腔(潘建评)奶声奶气,但举手投足中的一颦一笑却有模有样,全打破国内虚拟偶像次元壁,就和真人偶像一样(光明日报评)

    13、湖南卫视首位数字主持人小漾

    小漾1.jpg
    湖南卫视首位数字主持人

      “小漾”的取名源自英文单词“Young”,寓意着年轻与青春。
      年龄设定在20岁,整体形象甜美可爱,也不失酷帅飒爽,青春活泼、元气满满。
      “小漾”是虚拟数字主持人,于2021年10月2日首次亮相,并成为湖南卫视实习主持人。 [1] 小漾是由5G高新视频多场景应用国家广播电视总局重点实验室以及湖南芒果幻视科技有限公司共同打造, [3] 她是技术团队通过采集数百位女性的形象,然后由大量工程师参与打造的数字主持人。
      2021年10月2日,小漾首次亮相,并成为湖南卫视实习主持人。
      2022年1月1日,小漾作为实习主持人亮相《你好星期六》;11月19日,参加首届湖南旅游发展大会开幕式。 12月31日,参加《湖南卫视2022-2023跨年晚会》。
      2023年1月22日,参加的《“四海同春”2023全球华侨华人春节大联欢》播出。
      “小漾”不仅外形表情生动、形态逼真,还运用了人工智能技术、动作捕捉技术等来模拟完成主持人的工作,贴合了年轻观众对于数字化的青睐。(潇湘晨报评)

    14、OPPO虚拟助手 小布

    小布2.jpg

      在2021年10月oppo的开发者大会上,oppo推出首个虚拟助手数字人“小布”。“小布”虚拟人是业界首个基于虚拟人多模态交互的手机智能助手。
      手机智能助手小布虚拟人涵盖视觉、语音、自然语言处理等多模态融合算法,依托小布助手的综合 AI 能力,实现与用户在多个场景生态下的内容服务、实时交互。多元AI能力!千人千面,每位开发者都能专属定制!
      “小布”虚拟数字人首期上线的主要功能是新闻和天气播报。当你在和“小布”询问天气情况时,不再只是听到简单语音的回复,“小布”会以虚拟数字人的形象,与用户进行面对面交流。生动具象的拟人形象显然比机械的互动更具温情。

    15、香港雀巢咖啡虚拟代言人Zoe

    2023-11-08_025647.jpg

      香港雀巢咖啡推出了全新虚拟代言人“Zoe”,并发布一支名为《Re/Imagine》的品牌宣传片,Zoe也是香港首个品牌自创的虚拟代言人。

    三、虚拟数字人产业发展现状

    3.1、数字人产品结构特征

      社会学中人类身体研究分为两条主要路径:自然主义身体观和社会建构论身体观。自然主义身体观重点强调人类的躯体属性“肉身",而社会建构论身体观则重点强调人类的社会属性“社身”,从功能角度分析,两种身体观都关注了人类的工具属性“具身”。

      数字人产品以此为基础,“肉身”即为人物从设计到面向大众所囊括的技术(如建模、渲染等技术),“具身”即为数字人产品在人类社会的功能性(如陪伴、服务等功能),“社身”即为数字人产品在人类社会中的社会属性(如社会价值、宣传等)。
    20230112-c86f36e67029854d.png

    3.2、数字人产业链结构

      当前虚拟数字人理论和技术日益成熟,应用范围不断扩大,产业正在逐步形成、不断丰富,相应的商业模式也在持续演进和多元化。虚拟数字人的产业链从上到下可以分为相关软硬件支撑、数字人产品生产运营和下游应用场景。上游硬件领域主要包括显示设备、芯片、交互相关期间和算力承载设备等;中游主要为数字人产品生产运营,下游应用领域主要包括ToB、ToC、ToG等应用场景。

    图表2:中国数字人产业链结构
    20230112-faf17f80b07452a8.png

    3.3、数字人领域市场需求

      ——用户花费:用户对虚拟偶像花费相对一般

      用户在数字人领域花费主要集中在虚拟偶像领域,花费主要包括花费时间的情况和花费金钱的情况。根据iiMedia调研数据,2021年中国网民为虚拟偶像日均花费时间主要集中在3小时以内,在花费金额中,大多数网民为虚拟偶像的月均花费在1000元以内。
    20230112-58555c13bf77807a.png
    20230112-bac2d2321c83775f.png

    3.4、按商业和功能应用划分

    2023-11-13_053521.jpg

    四、数字人应用场景

    按面向人群分为三大类型:ToC端、ToB端、ToG端
    20230112-79c74a93e3f87c4f.png

      中国数字人在行业应用中面向toC端、toB端和toG端均推出了不同类型的行业产品,包括但不限于传媒、游戏、文旅、医疗、零售、金融等行业领域,产品业态主要有虚拟主播、虚拟主持人、虚拟助手的等等。

    以下是一些“脑洞大开”的数字人应用场景:

    1. 可爱的数字精灵宠物

      类似于Tamagotchi、宠物小精灵等虚拟宠物游戏,但是数字精灵宠物可以更加智能化人性化,能够与用户进行更加接近的互动,比如学习用户的喜好、情绪等。

    2.虚拟男女朋友

      虚拟男女朋友指的是在虚拟世界中模拟出来的男女朋友角色。通过一些软件或游戏,可以与虚拟男女朋友进行交流、互动甚至恋爱。虚拟男女朋友可以给人们带来一定的情感寄托和陪伴,但是也存在着虚拟与现实的分离,可能会对真实的人际关系产生影响,所以需要合理的使用和管理。

    3. AI情感助手

      AI情感助手是一种基于人工智能技术的应用,目的是通过分析用户的语音、文本及其他数据,了解用户的情感状态,并提供情感支持和建议。AI情感助手可以识别和分析人的情感,包括喜悦、压力、焦虑、疲劳、愤怒等等,通过对用户情感的了解,可以提供针对性的情感支持和建议,为用户提供更好的服务体验。数字人可以主动安慰用户、察觉用户的情绪变化、与用户进行心理治疗,可以帮助人们识别并处理情感,从而改善人们的情感健康。。该技术可以应用于许多领域,包括心理辅导、自我管理、健康管理、教育等。

    4. 数字人影子(替身)

      数字人影子,又称数字替身,是指在数字世界中存在的虚拟个体,也可以是代表真实身体的数字化版本。数字人影子可以是人工智能、虚拟角色或者是由用户自己创造的数字形象。
      数字人影子可以被用于各种用途,例如在虚拟世界中玩游戏、在社交媒体上和朋友互动、在线购物、医学诊断、工业设计等等。数字人影子还可以被用于代替真实身体进行某些危险或不可行的工作,例如进行空间探索、执行紧急任务等等。
      数字替身也会带来一些潜在的风险,例如虚拟身份被盗、被滥用信息、对隐私的威胁等等。因此,在使用数字人影子的过程中,需要注意保护自己的信息和隐私。

    5. 个性化数字艺术品

      数字人的形象可以根据用户的需求进行定制,打造出个性化、独一无二的数字艺术品。这些艺术品可以用于展览、个人收藏,还可以在虚拟现实场景下进行展示。
      数字艺术品是数字时代的一种艺术形式,随着科技技术的不断发展,数字艺术品已成为了大众艺术消费市场中的一种新型选择。个性化数字艺术品是根据个人需求和喜好所设计的数字艺术品,可以包括数字画作、数字雕塑、音乐、视频等多种形式。人们可以通过互联网平台订购或者通过艺术家进行定制。个性化数字艺术品的好处在于其独特性和专属性,可以根据个人特点进行设计和制作,从而展现出独一无二的风格和品味。同时,数字艺术品也具有高保值性和易传播性,可以作为一种长期的艺术投资。

    6. 超级智能数字人助手:

      数字人可以扮演一个超级智能助手的角色,变成一个人们生活中的贴心管家。可以模拟人类思考和交流,协助人们处理日常事务或解决一些棘手的问题,比如提供旅游建议,预约医生或理发等,或者解决各类难题,设计复杂的工程项目等。
      超级智能数字人助手可以通过语音或文本与人类进行交互,识别人类的语意和情绪,并做出相应的回应和建议。它可以为人类提供各种服务,如智能家居控制、语音助手、医疗咨询、金融服务等等。
      未来,超级智能数字人助手将发挥越来越重要的作用,成为人类与数字世界的桥梁和纽带。

    7. 数字模特:

      数字人可以成为时装品牌的模特,展示设计师的作品。数字人不仅可以展现服装的细节,同时也可以在虚拟现实环境中演绎各种场景。
      数字模特是指通过计算机生成的虚拟三维人物模型。它可以在数字领域中进行各种形式的表现和应用,比如游戏、电影、虚拟现实等。数字模特主要通过数字艺术家使用3D建模软件来创建,并且可以进行各种形式的灯光、纹理、动画等处理,以达到逼真的效果。数字模特在现代科技领域中有着广泛的应用,而且随着技术的发展,数字模特的逼真程度也不断提高,越来越多的行业开始使用数字模特来进行创意和设计。

    1. 智能健身教练 -
        数字人可以帮助用户完成健身训练,根据用户体型、身体状况以及健身目标,制定专属的训练计划,并在训练过程中提供实时反馈和调整。
        智能健身教练可以是一种基于人工智能技术的新型健身辅助帮手,它可以通过检测运动姿势和身体参数等信息,为用户提供更加个性化的健身方案和指导建议。采用人工智能技术的智能健身教练可以根据用户的身体状况、运动习惯,提供更加科学的训练计划和饮食建议。它也可以通过分析用户的训练记录、进度和成果,为用户提供反馈和调整建议,帮助用户更好地实现健身目标。智能健身教练可以通过手机应用、智能手表等多种方式呈现,为用户提供更加便捷和个性化的健身服务。

    9. 数字人主播 -

      数字人可以成为虚拟主播,负责进行直播和交流互动,为观众提供娱乐和知识,同时也可以根据观众反馈不断优化主播的形象和表现。
      数字人主播是指利用人工智能技术和3D建模技术创建出的虚拟人物,能够模拟人类的语音、肢体动作和表情,并且能够自主进行直播和互动。数字人主播已经在一些直播平台和游戏直播中得到了应用,其主要优势是可以在24小时内不间断工作,且不需要额外的休息和报酬。同时,数字人主播还能够吸引更多年轻用户群体。

    10 虚拟讲解员

      虚拟讲解员是一种基于人工智能技术的虚拟人形象,主要用于为观众提供讲解、引导、答疑等服务。它通过语音合成、图像识别等技术,能够与观众进行互动,解答问题,讲解知识,提供娱乐等服务。
      虚拟讲解员主要应用于博物馆、展览馆、旅游景点等场所,能够为观众带来全方位的参观体验。同时,它也可以应用于教育、医疗等领域,为人们提供更便捷、高效的服务。随着人工智能技术的不断发展,虚拟讲解员将有更广泛的应用前景。

    11. 数字人美容师

      数字人美容师是指使用数字技术,通过对人脸或身体进行数据分析和处理,进行美容和塑形的专业人士。他们可以利用虚拟现实、增强现实、计算机图形和模拟等技术,以及专业的美容知识,根据个人的需求和身体特征,进行个性化的美容设计和调整。例如根据用户肤质和需求制定护肤方案,为用户提供教学视频和美容建议。
      数字人美容师的工具包括3D扫描、人工智能分析、机器学习等技术,通过这些技术可以获取和分析客户的面部或身体数据,寻找出现在问题,并提出改进方案。数字人美容师可以提供各种美容方案,如整形手术前的模拟操作、美容项目前的预览效果、面部特征调整和瘦身等方面的服务。
      数字人美容师是数字化时代的专业人才,他们为了提高客户的个人形象和健康,创造更美好的生活,并为美容和健康产业注入新的态度和理念。

    12.数字人医生

      数字人医生是指一种通过人工智能和机器学习等技术,模拟医生的诊疗过程,为患者提供诊断和治疗建议的虚拟医疗服务。数字人医生能够收集患者的病史和症状信息,运用规则引擎、自然语言处理、图像识别等技术进行分析,并给出相应的诊断和治疗方案。数字人医生的出现,为解决医疗资源紧张、医生缺乏等问题提供了一种新的解决方案。

    13.虚拟家庭医生

      一种基于人工智能和大数据技术的智能医疗服务模式,为家庭用户提供24小时在线医疗咨询、健康管理、病情追踪等个性化医疗服务。虚拟家庭医生可以通过智能语音或文字交互方式,向患者提供医疗指导和建议,同时还可以实时监测患者的健康状况并提供相应的预警和提醒。虚拟家庭医生可以大大提高医疗服务的效率和准确性,为患者提供更加便捷、高效和个性化的医疗服务。

    14. 虚拟公务员

      虚拟公务员是指使用计算机技术和人工智能技术,通过模拟人类思维和行为,完成政府行政管理、公共服务和社会治理等职能的一种新型人工智能应用形态。虚拟公务员可以承担一些重复、繁琐、高危和高难度的工作,如政府数据分析、智能客服、自然语言处理、人工智能辅助决策等,从而提高工作效率和降低管理成本。虚拟公务员的普及将对政府机构的职能转变、公共服务的优化和人才培养等方面带来深远的影响。

    15. 虚拟偶像

      虚拟偶像是一种通过计算机技术和动画等手段创建的虚拟形象,通常可以通过网络平台进行直播、互动和娱乐活动。虚拟偶像的形象通常是由声优或者社交媒体明星配音和代言的,在粉丝圈中拥有相当的影响力和号召力。这种虚拟偶像已经成为了日本等亚洲国家的一种文化现象。

    16 虚拟理财顾问

      虚拟理财顾问是一种基于人工智能技术的智能投资建议系统,能够根据用户的风险偏好、投资目标、投资时间和资金规模等条件,为用户提供个性化的投资建议,帮助用户制定投资计划、优化投资组合、控制风险等。虚拟理财顾问通常通过分析历史数据、资产价格趋势、市场研究报告等大数据信息,结合机器学习和模型算法,进行投资分析和预测,从而提供投资策略和建议。虚拟理财顾问可以帮助用户降低投资风险、提高收益,并为用户节省时间和成本。

    17. 虚拟客服

      虚拟客服是一种基于机器学习和自然语言处理技术的客户服务解决方案,旨在提供自动化的、智能化的客户服务。虚拟客服使用机器人或虚拟助手来与客户进行互动并解决他们的问题,这能够大大减轻人工客服的负担并提高客户满意度。虚拟客服可以通过网站、应用程序或聊天应用程序等不同的渠道与客户进行交互,为各种公司和组织提供各种客户服务解决方案。

    18. 虚拟教师

      虚拟教师是指基于人工智能技术或者其他技术手段开发的、能够模拟真实教师行为的虚拟人物。虚拟教师可以根据学生的不同需求提供个性化的教学服务,比如自适应学习、知识推荐、智能辅导等。虚拟教师可以在不同的场景下发挥作用,如网上教学、远程教育等领域。虚拟教师能够为学生提供定制化的教学辅助服务,同时还能普及具有复杂性和特殊性的知识,提高教学效果,让教学工作更加精细化和个性化。

    19. 待续


    五、虚拟数字人技术实现方法

    2023-11-13_060933.jpg
    2023-11-13_055020.jpg
    2023-11-13_160250.jpg
    图片6.png
    d26b527c07d057375782bdb7473bcac6.jpeg

    基于大模型的虚拟数字人__虚拟主播实例-CSDN博客

    📖 技术实现过程
    【数据收集】:首先需要收集大量的数据,包括图像、语音、姿势、行为等各种类型的数据。这些数据可以来自各种来源,如公共数据集、社交媒体、游戏、虚拟现实等。

    【数据预处理】:对数据进行预处理,包括数据清洗、去噪、标注、对齐等。这些预处理步骤将有助于提高模型的精度和鲁棒性。

    【模型训练】:选择适当的神经网络结构,如生成对抗网络(GAN)、变分自编码器(VAE)等,并使用收集的数据进行模型训练。由于大模型所需的计算和存储资源较多,可以考虑使用分布式计算或云计算来加速训练和优化模型。

    【模型优化】:在训练模型的过程中,需要进行模型调优和超参优化,以提高模型的性能和准确性。这需要进行多次实验和测试,以找到最优的模型配置和超参数。

    【虚拟人物生成】:通过模型生成虚拟人物的图像、声音、行为等,可以使用混合现实技术、虚拟现实技术等来将生成的虚拟人物与现实世界进行交互和展示。

    【模型迭代和更新】:由于虚拟人物的需求和应用场景不断变化,在实际使用中,需要不断迭代和更新模型,以保持模型的准确性和实用性。

    六、数字人产业发展的趋势

    腾讯研究院、腾讯云智能《数字人产业发展趋势报告(2023)》
    640.png

    从数字人的价值定位、核心技术、行业应用、C端发展、产业聚集 等十个不同维度进行剖析,挖掘出产业发展的十大趋势。

    • 趋势1:数字人制造和运营服务的B端市场不断扩大,将面向更广大的C端用户提供服务,各类数字人价值定位和商业模式有差异。
    • 趋势2:技术集综合迭代驱动数字人形似人,制作效能将继续提升。
    • 趋势3:AI技术驱动数字人多模态交互更神似人,并逐步覆盖数字人全流程。
      2023-11-13_055244.jpg
    • 趋势4:数字人技术与SLAM、3D交互、体积视频、空间音频等技术深度融合,渲染将从本地到云端。
    • 趋势5:千行千面的数字人将成为人机交互新入口,但深度上仍需挖掘。
    • 趋势6:UGC数字人将加速出现,成为未来产业的增量空间。
    • 趋势7:数字人仍以2D显示设备为主,3D显示设备成为特定领域的新解法。
    • 趋势8:在场是数字人发展的高级阶段,将与应用场景深度耦合。
    • 趋势9:艺术和技术双轮驱动,北京有望成为产业新高地。
    • 趋势10.:数字人版权保护及行业合规体系需同步建设,推动实现可用、可靠、可知、可控。

    数字人行业总体还在快速发展阶段,发展和生存是企业的重点和方向,数字人著作权、外观设计专利、商标等知识产权保护体系亟待完善。

    七、总结

    综合上面分析,我看好数字人领域的发展。

    八、参考文献

    https://zhuanlan.zhihu.com/p/406259189
    https://baike.baidu.com/tashuo/browse/content?id=d44f45245ad671abe2205cc9&fromModule=tashuo-article_tashuo-tab-item
    https://baike.baidu.com/tashuo/browse/content?id=3bad0e0298854d4dcbee90c9&fromModule=tashuo-article_tashuo-tab-item
    https://baike.baidu.com/item/%E5%BA%A6%E6%99%93%E6%99%93/53703883
    https://new.qq.com/rain/a/20211205A0517800
    https://zhuanlan.zhihu.com/p/388039131
    https://zhuanlan.zhihu.com/p/549319483
    https://zhuanlan.zhihu.com/p/407989181
    https://www.sohu.com/picture/492718766
    https://new.qq.com/rain/a/20221201A05WVF00
    https://www.qianzhan.com/analyst/detail/220/230112-31757bad.html

    踩0 评论0
  • 回答了问题 2023-11-15

    你掉进过新技术的“大坑”吗?

    1.你掉进过新技术的“大坑”吗?

      作为一个开发者,很容易会掉进新技术的“大坑”。这是因为科技在不断地进步,新技术层出不穷,令人眼花缭乱。当一个新技术被推出时,它可能会看起来非常有吸引力,令人兴奋。但是,当你开始投入时间和精力去学习并尝试使用它时,你可能会发现它并不如你想象的那样好用或有效。此时,你可能已经沉迷其中,难以自拔,继续花费时间和精力去追逐这个“大坑”。

      因此,开发者在学习新技术前,先进行一些基础的调研和评估,确保该技术符合我们的需求和目标,并且值得我们花费时间和精力去学习和应用。同时,我们也应该时刻保持警惕,不要盲目跟风,要有选择的去学习和尝试新技术。

    2.在爬坑之旅中,最让你印象深刻的一次是什么?你怎么看待呢?

      我踩的其中一个坑是属于“不同软件版本需要不同的运行环境”。
      刚开始出tomcat 10版本的时候,我下载了安装,安装时没出现任何出错信息,
    tomcat 10.1-M14版本能够在java version “1.8.0_131”下用命令提示符安装成功,运行时却出现启动黑屏一闪而过的现象。
      查了很久都没有发现原因,网上找资料也找不到任何类似答案。因为当时安装tomcat 10的人很少。实在没办法只好停下来安装低版本的tomcat。
      过了一段时间,我再次查看tomcat官方网站资料,发现新出了一个安装提示:运行需要Java 11 或更高版本环境。原来这就是问题所在。

    踩0 评论0
  • 回答了问题 2023-11-15

    双11,你都购入了哪些开发者好物?一起分享吧!

    话题1.哪些东西你是会等到双11才买的?

    双11我会买笔记本电脑,希望能碰上优惠活动多点折扣。

    笔记本电脑我选的是带GPU的,独立显卡8G以上,我可以安装Ai绘图软件。可惜一般电脑配置都是500G硬盘,对于我来说真是不够用。

    我该选择更换大容量的机械硬盘?还是使用移动硬盘?还是使用云盘呢?还是。。。?

    踩0 评论0
  • 回答了问题 2023-11-13

    【藏经阁一起读(76)】读《“DNS+”发展白皮书》,你有哪些心得?

    一、基础知识

    1.1、DNS

      DNS是域名系统(Domain Name System)的简称,是一种将域名转换为IP地址的系统,它能将域名(例如example.com)与对应的IP地址(例如192.0.2.1)相映射,实现域名解析,用户可以通过域名访问网站,DNS负责将域名转换为相应的IP地址。
    2023-11-12_062743.jpg

      域名系统(DNS: Domain Name System)已提出整四十年,期间互联网的规模、技术和应用发生了巨变,DNS在万物互联融合服务方面的公共基础属性逐渐增强,以DNS为代表的各种网络标识服务的技术手段也不断发展,并趋于技术一体化、平台普惠化、治理的多样化。在此背景下,阿里云邀请技术、产品服务和治理领域专家讨论并提出了“DNS+”,即以DNS体系为主,包含多种网络标识服务的广义网络生态概念。

      从网络体系架构的视角看,DNS是一个网络通信协议,也是一个网络基础组件为网络连接提供域名和IP的查找功能,其特征是以网络连接为中心。当新型的移动互联网和云计算出现,为DNS提供的新应用场景和提出更高的要求,DNS不再只是服务于网络连接,而是围绕应用创建和部署为中心,其中应用即包括移动互联网应用,云计算产品,以及云原生应用等。在这个阶段,大型云计算平台为DNS服务提供了更高的弹性、高可用能力,DNS由网络基础功能演变为通过API可集成的PaaS/SaaS服务。
    2023-11-12_063518.jpg

    1.2、DNS+

      DNS+是一个扩展了DNS功能的新协议,是一种增强版的DNS服务,它在传统的DNS服务基础上增加了了更多的安全功能、性能优化和管理功能,它能够提供更多的安全性和可靠性。DNS+可以支持更多的加密和数字签名功能,因此可以更有效地防止DNS欺骗攻击和中间人攻击。此外,DNS+还可以提供更多的DNS记录类型,如TLSA记录,这些记录可以使Web应用程序更安全。

      总之,DNS+是一个安全和可靠的互联网基础设施,它能够保证互联网用户的隐私和安全。
    2023-11-12_064143.jpg

    • 在新技术方面,“DNS+"与云计算为代表的新型数字化技术融合创新。
    • 在新业态方面,“DNS+"融入和服务千行百业,助力数字化进程。
    • 在新治理方面,“DNS+"基础设施安全研究和治理,推进有序高质量发展。

    二、“DNS+"现状和发展

    (一)规模化和高质量发展

    移动互联网流量、终端网络规模持续增长,以及 IPv6 的规模部署对 DNS规模化提供更多动能。

    DNS安全功能扩展方面,DNSSEC支持度,加密DNS部署,DNS新技术推广都在持续提升。

    从数量到质量的转变,DNS 行业发展的前景可期。

    (二)平台化和安全保障

    DNS 域名解析服务呈现平台化和集中化趋势。
    2023-11-12_180347.jpg
    2023-11-12_180429.jpg

    随着企业IT基础设施进入多云+传统IDC阶段,云平台DNS也将与传统IDC也将与传统IDC融合。
    2023-11-12_183632.jpg

    平台型域名解析服务的安全性、稳定性经受更为严苛的考验。

    建立安全稳定的DNS系统是数字化发展的必要保障。

    (三)多业态融合和创新发展

    DNS直接或间接参与到新兴标识应用的构成、解析和资源存储,为互联网标识多业态融合和创新提供动能。

    随着第四词工业革命的到来,我国抓住互联网发展的战略机遇,建设了工业互联网标识解析体系。

    新型的互联网应用利用DNS做桥梁,让DNS数据和应用数据无缝连接。

    与直接使用DNS存储应用信息不同,还有一类是间接使用DNS,用DNS连接新型标识应用的服务和业务入口。

    (四)技术普惠和生态共建

    • 满足高质量发展,兼顾企业降本增效的具体述求。
    • 应建立行业统一标准,提高复用,增强社会服务效益。
    • 应建立统一应急策略,提高服务响应和治理通道。

    三、" DNS + ”产学研动态

    (一)我国“ DNS + “建设发展

    商用密码算法在已在我国域名系统部分环节得到初步推广应用。
    工业互联网标识解析体系建设飞速发展,形成覆盖全国的工业互联网标识解析基础设施。
    全国互联网演进过程中,从web2走向web3的发展已势不可挡,去中心化名字服务不断发展。

    (二)数字化转型实践

    1.【多云+传统IDC】的融合
    2023-11-12_191430.jpg

    • 阶段一、DNS+传统IDC
    • 阶段二、DNS+云计算
    • 阶段三、DNS+多云和传统IDC融合
      2023-11-12_192528.jpg

      企业域名解析安全的问题主要分为三类

    • 拒绝服务攻击:

        由于域名解析是客户端访问企业I应用服务的第一跳,负责企业IT应用域名解析的DNS系统经常被攻击者当成攻击目标。攻击的形式既有针对服务IP地址的4层网络攻击,也有针对特定域名后缀的随机域名查询攻击,同时也有针对DNS系统进行的各种协议渗透攻击(如缓存投毒、放大攻击、反射攻击等),目标是使得DNS系统不可用或者访问异常,从而达到企业应用不可用或者访问异常。

    • 域名动持:

        访问企业IT应用的客户端分散在全球各个地方,通过不同的网络服务商和DNS服务商实现DNS的解析访问。在客户端做域名解析的时候,为客户端提供域名解析的DNS系统经常会遇到DNS解析结果被修改的问题,从而将客户端的应用访问流量引流到一个不存在的IP地址或者其他非法IP地址上,从而达到客户端不能正常访问企业工应用目的。

    • 域名滥用:

        随着企业数字化转型的推进,企业的办公、测试和生产过程基本都会涉及到访问外部的第三方服务,而外部的第三方服务一般都是通过一个公开可解析的公网域名对外提供访问服务,这个时候就需要解析公网域名来获取服务IP地址。攻击者常常通过各种手段将企业办公机、测试机和生产机的域名解析到一个恶意的IP服务地址,这个地址提供的恶意应用服务有多种形态,包括病毒、木马、钓鱼、远程控制等,目标是引诱终端访问,从而实现非法访问企业网络和资源、破坏企业系统、对企业工作人员进行网络诈骗等,造成企业的系统损失和人员财产损失。

      因此需要提供一套针对拒绝服务攻击和域名蓝用的安全防护方案,主要提供以下三方面的能力

    • 拒绝服务攻击的防护能力
    • 流量型攻击:可以承载TB级别的DDoS流量攻击和单域名上亿次QPS的随机域名攻击
    • 协议型攻击:可以有效防御针对DNS的各种协议层攻击,包括DNS畸形包攻击、DNS随机域名查询攻击、缓存投毒、放大攻击、反射攻击等等

      或名动持发现和域名防动持的能力:提供企业域名在全球各个地域的各个网络环境里面的域名动持监控和报警并可以提供针对客户端的域名访问流程进行升级从而实现域名解析防动持的目的。

      恶意域名访问的发现和阻断能力:提供企业客户端在做三方公网域名解析时的恶意域名发现,并提供针对恶意域名的DNS解析侧的阻断能力,停止企业客户端对恶意三方公网域名的进行解析,从而实现企业客户端访问恶意应用.
    2023-11-12_210102.jpg
    2023-11-12_210127.jpg
    2023-11-12_210146.jpg
    2023-11-12_210250.jpg

    (三)安全研究成果

      域名缓存污染攻击(DNS Cache Poisoning Attack)是利用域名服务器缓存机制的漏洞,通过发送特制的恶意请求欺骗服务器,将错误信息存储在缓存中。当其他用户查询相同内容时,服务器返回被篡改的错误结果,将用户重定向到攻击者控制的恶意网站或服务器。

    • 重要发现一:基于操作系统底层实现引入的侧信道,可以实现高效的缓存污染攻击
    • 重要发现二:域名转发器成为解析链路的薄弱环节,相关安全风险不断涌现
    • 重要发现三:利用域名缓存污染攻击,寻求影响更上层的网络服务成为热点

    域名授权安全威胁

    • 重要发现一:域名授权记录的不一致现象可致使重要域名被攻击者隐蔽劫持
    • 重要发现二:域名软件对于授权记录的不当处理可导致恶意域名无法从撤销
    • 重要发现三:子域名劫持的安全风险屡见不鲜,安全影响已经间接影响至web应用

    四、读后思考

      当新型的移动互联网和云计算出现,为DNS提供的新应用场景和提出更高的要求,DNS不再只是服务于网络连接,而是围绕应用创建和部署为中心,其中应用即包括移动互联网应用,云计算产品,以及云原生应用等。在这个阶段,大型云计算平台为DNS服务提供了更高的弹性、高可用能力,DNS由网络基础功能演变为通过API可集成的PaaS/SaaS服务。但几乎所有的应用都要依赖于它的稳定与安全。

      以DNS体系为主的泛IP寻址解析体系将持续在新技术、新业态、新治理三个领域融合发展,与当今蓬勃的数字化深度结合,进入“DNS+”时代。

      它在传统的DNS服务基础上增加了了更多的安全功能、性能优化和管理功能,它能够提供更多的安全性和可靠性。

      我在读这篇文章时,正好是11.12日,下午5点多,阿里崩了,钉钉崩了,淘宝崩了。。。各种负面新闻炸了,虽然只是1小时多,工程师就马上修复好故障,但作为顶级技术和app的代表的作品,几个系列同时崩溃就说明不是偶然发生的零星故障。非偶然发生的大面积故障未能在故障发生前判断处理好就说明存在某种漏洞,或者是管理上的,或者是技术上的,或者是非我们少数几个人能处理的社会性事件。社会局势不同,技术要求也要相应跟上,而不是停留在传统观念和技术思维角度。技术维护人员应该更多的关注系统内部的工作原理与结构机制,而不仅仅是对外部表现的测试。具体技术实现会随着网络技术、安全稳定等需求一直变化演进。例如随着云计算和云服务的普及,大量的互联网流量通过云平台进行域名解析,云平台作为一个关键的中间层,承担着将用户请求路由到相应的服务实例的重要角色。针对云平台域名解析服务的网络攻击不断发生,而云平台的规模和复杂性也增加了域名解析安全的挑战,云平台多个分布式组件和服务构成,涉及多个域名解析点和网络层次,增加了攻击面和潜在的安全漏洞。

      一个安全的网络空间命运共同体,需要各国的政府、产业界和学术界的共同协作和努力。

    踩0 评论0
  • 回答了问题 2023-11-10

    1024特别话题|AI应用开发怎样才能更简单?

    一、AI 应用开发怎样才能更简单?

    • 1、使用易于使用的工具和框架:
      例如, TensorFlow、Keras和 PyTorch等框架提供了易于使用的API和文档,使得开发者可以更快速地开发AI应用。

    • 2、使用可视化编程工具:
      为了让开发人员更加容易地使用 AI 技术,可以采用可视化编程工具来帮助他们在不需要编写代码的情况下,快速构建 AI 应用。可视化编程工具可以帮助开发人员快速创建 AI 应用程序,而无需编写大量的代码。

    • 3、使用自动化工具:
      自动化工具可以大大简化开发过程,帮助开发人员在整个开发过程中减少繁琐的任务,例如使用自动化模型选择和超参数调整工具,数据处理、模型训练、测试和部署等。

    • 4、利用预训练的模型:
      预训练模型可以帮助开发人员减少模型训练时间和成本,同时提高模型性能和准确性。许多预训练的模型已经可以很好地解决许多问题,如图像分类和自然语言处理等。使用这些已经训练好的模型可以极大地减少开发者的工作量。

    • 5、选择成熟的 AI 平台和工具:
      许多成熟的 AI 平台和工具,提供了各种预训练模型和 API,能够帮助开发者轻松构建 AI 应用。

    • 6、使用可重用组件:
      可重用组件可以帮助开发人员快速构建 AI 应用程序,并提高代码的可重用性和可维护性。

    • 7. API/SDK:
      提供 API 或 SDK,可以让开发人员将 AI 功能集成到他们的应用程序中,从而更加容易地开发 AI 应用。

    • 8、推广低代码开发:
      低代码开发是一种通过可视化进行应用程序开发的方法,使具有不同经验水平的开发人员可以通过图形化的用户界面,使用拖拽组件和模型驱动的逻辑来创建网页和移动应用程序。低代码开发平台使非技术开发人员可不必编写代码,而是将传统IT架构抽象化来支持专业开发人员。业务部门和IT部门的开发人员可以共同创建、迭代和发布应用程序,花费的时间则比传统方式更少。

    • 9、提供文档和示例代码:
      提供文档和示例代码可以帮助开发人员更快地了解如何使用 AI 工具和技术,并加快开发速度和提高应用程序的质量。

    • 10、社区支持:
      有一个活跃的社区可以帮助开发人员解决问题和分享经验,从而使 AI 应用开发更加容易。

    • 11、保持持续学习:
      AI技术正在不断发展,开发AI应用需要的技术随着时间的发展而发展,开发者需要时刻关注AI和机器学习的最新进展,了解最新的技术和工具,并不断学习,并通过学习和实践来提高自己的开发技能。

    二、你觉得云上 AI 开发有哪些优势?

    • 1. 弹性和可扩展性:
      云计算平台提供了强大的计算和存储资源,支持大规模机器学习任务,使得 AI 开发人员可以根据需求动态分配资源,以适应不同的 AI 应用和需求,因此具有更大的弹性和可扩展性。

    • 2. AI 服务:
      云上 AI 开发平台提供了许多 AI 服务,例如语音识别、图像识别、自然语言处理等,使得 AI 开发人员可以更快地实现功能。

    • 3. 平台集成:
      许多云计算平台提供了开发工具和 API,使得 AI 开发人员可以轻松地将 AI 模型集成到其他应用程序中。

    • 4. 安全性:
      云计算平台提供了强大的安全性措施,在这个环境中,开发者可以使用安全的方法存储和处理数据,并保护他们的训练模型不被未经授权的访问和攻击。包括数据加密、网络安全等,保护 AI 开发人员的数据和模型。

    • 5. 更高的可靠性:
      在云平台上开发 AI 可以利用云平台稳定的硬件和网络基础设施,提供更高的可靠性。用户可以选择多个数据中心和可用区来确保应用程序的高可用性和容错性。

    • 6. 降低成本:
      云上 AI 开发的成本比传统的本地开发要低。云平台提供多种计费模式,例如按使用量付费,用户只需要支付自己所使用的资源,同时无需购买昂贵的硬件设备和软件许可证,从而降低了开发成本,避免了购买大型计算和存储设备的高昂成本。

    • 7.灵活性:
      云平台提供了强大的计算和存储能力,使得 AI 开发者可以根据需要快速建立和部署机器学习模型。

    • 8.资源共享:
      云平台可以让多个开发者共享计算和存储资源,从而节省开发成本和时间。

    • 9.易于管理和维护:
      云平台提供了易于使用的工具和界面来管理和维护机器学习模型,在模型部署和更新时也提供了更便捷的方式。

    • 10. 更快的部署:
      在云平台上开发 AI 可以更快地部署到生产环境中。云平台通常支持快速部署和自定义镜像,用户可以通过简单的点击几个按钮就能将 AI 模型部署到生产环境中。

    • 11. 更好的协作:
      在云平台上开发 AI 可以轻松地进行团队协作。云平台通常提供多种团队协作工具和服务,例如版本控制系统、协作编辑器和共享文档等,让团队成员可以更加高效地协作和管理 AI 项目。

    三、你有什么快速入门 AI 开发的小技巧和教程?

    • 1. 学习编程语言:
      首先,你需要掌握一种编程语言,例如学习 Python 编程语言,Python 是 AI 开发中最受欢迎的语言之一,学习 Python 将让您在 AI 开发的道路上更加轻松。

    • 2. 掌握数学和统计学基础知识:
      AI开发涉及到一些数学和统计学概念,如线性代数、概率论等,需要掌握一些基础数学知识,例如线性代数、微积分和概率论,了解这些基础概念将有助于你更好地理解和应用AI算法。

    • **3. 学习机器学习和深度学习的基础知识:掌握这些概念将有助于您更好地理解 AI 开发中的模型和算法。机器学习是AI的核心。学习常见的机器学习算法,如决策树、线性回归、逻辑回归等,并了解它们的优缺点和应用场景。

    • 4. 选择合适的开发平台:
      选择适合你的AI开发平台,如TensorFlow、PyTorch等。这些平台提供了丰富的工具和资源,可以帮助你更轻松地构建AI应用。

    • 5. 安装并使用流行的 AI 库和框架:
      例如 TensorFlow、Keras、PyTorch 和 Scikit-learn。

    • 6. 学习数据处理和分析:
      在AI开发中,数据处理和分析是非常重要的一步。学习如何从数据中提取特征、进行数据清洗和预处理,以及了解数据可视化的基本方法。

    • 7. 寻求帮助和资源:
      在学习的过程中,不要害怕提问和寻求帮助。你可以加入在线社区、论坛和社交网络,与其他开发者交流经验和解决问题,学习其他 AI 开发人员的经验和知识,还可以发现新的 AI 趋势和技术。同时,也可以利用在线课程、教程和文档等资源来学习和提高自己的技能。

    • 8. 实践和探索:
      通过参与实践项目来巩固所学知识。你可以找一些开源项目、数据集和竞赛来练习,也可以构建自己的 AI 项目和模型,并不断尝试新的技术和方法。通过实践来加深理解和知识。

    踩0 评论0
  • 回答了问题 2023-10-14

    算力是开发的源头之水吗?

    1、算力是否是开发/技术的源头之水?

      算力是开发和技术所需要的重要资源之一,但并不是源头之水。
      算力可以被视为一种技术资源,它可以用于支持和加速开发过程,是计算机计算能力的一个指标。通过提高硬件设备的算力,开发人员可以更快地处理更复杂的任务,从而实现更高效的应用程序和更快的系统响应时间。此外,算力的提高也推动了人工智能、机器学习、大数据分析、云计算、物联网等技术的发展,这些技术在今天的许多行业中都具有重要的应用。因此,算力可以被视为开发和技术的源头之一。
      开发和技术的源头之水应该是人的思考能力和创新能力,以及良好的教育背景和实践经验。
      算力可以帮助开发人员更快速地实现他们的想法,提高开发和运行效率,但真正推动技术进步的是人类智慧和创新精神。

    2、你最喜欢书里的哪个实验场景?

      《ECS生长万物:开源》这本书里的实验场景我都喜欢,因为是不同应用场景,可以观察到不同应用不同搭配的可能,可以比较优缺点。

    3、如果有空,请帮忙点击链接完成邀请任务,谢谢!

    邀请1名好友(无需新用户),好友登录后可看到助力弹窗,按指引参与讨论
    https://developer.aliyun.com/mission/activity/huati202310?taskCode=10530&recordId=73cc514f5538f1d751bef50f12fbaa43

    踩0 评论0
  • 回答了问题 2023-10-14

    【藏经阁一起读(72)】读《Hologres 一站式实时数仓客户案例集》,你有哪些心得?

    【藏经阁一起读】(72)__《Hologres 一站式实时数仓客户案例集》


      本案例集收录电商/教育/游戏等6个行业共计17家客户,通过Hologres分析服务一体化架构,替换各类OLAP分析引擎与KV数据库,实现海量半结构化/结构化数据的实时写入、实时更新、实时分析。

    一、实时数仓概念

      大多数企业面临数据源多、结构复杂的问题,为了更好的管理数据和赋能价值,常常会在集团、部门内进行数仓建设。其中一般初期的数仓开发流程大致如下:获取数据源,进行数据清洗、扩维、加工,最终输出业务指标根据不同业务,重复进行上述流程开发,即烟囱式开发。可想而知,随着业务需求的不断增多,这种烟囱式的开发模式会暴露很多问题:代码耦合度高重复开发资源成本高监控难

    数据源: 分为日志数据和业务数据两大类,包括结构化和非结构化数据。
    数仓类型:根据及时性分为离线数仓和实时数仓技术栈:
    采集(Sqoop、Flume、CDC)
    存储(Hive、Hbase、Mysql、Kafka、数据湖)
    加工(Hive、Spark、Flink)
    OLAP查询(Kylin、Clickhous、ES、Dorisdb、Hologres)等。

      3.0 时代的实时数仓,可以定义为一站式实时数仓。这个时候的实时数仓,不仅具有高吞吐写入与更新、端到端的全链路实时加工以及低延迟高并发在线服务能力,在保证数据一致的前提下,需要支持多种负载之间完备的隔离和弹性能力,以确保各个业务互不干扰,各自按需使用资源。
      同时,实时数仓的使用通常离不开离线数仓的组合关系,通过离线平台对历史数据的周期性汇聚、抽象和加工,并将结果数据导入实时数仓进行丰富和修正,需要更有效地打通实时与离线两套系统,实现元数据和数据的无缝交换,这也是实时数仓落地时需要具备的能力。这种一站式体现在存储状态的一致性,减少了不同负载之间的数据同步和存储开销,避免了数据服务层的数据孤岛难题。

      实时数仓既不是传统数据库的旧瓶装新酒,也不是湖仓一体的多产品组合,它和离线数仓的本质区别是,通过对易变数据结构(包括内存结构、文件存储)和计算资源的细粒度灵活管控,更好地支撑数据的实时写入、实时更新、实时查询。

    二、Hologres

      从物理学原理看,地球没有被黑洞吸进去,是因为有一个临界点,这个临界点所组成的面,被证明是一个球面,也叫世界面。与此同时,黑洞里所有信息在世界面上都有投影,即 3D 全息投影技术。Hologres 想做的事情是,通过产品化的能力对数据黑洞做全息展示。

      Hologres 支撑的业务的规模、复杂性和对效率的极致追求,实现了通过有些开源技术组合无法达成的数据价值目标。

      Hologres 的出现也就重新定义了实时数仓的形态。
      基于此,OLAP 查询和在线服务使用 Hologres,满足分析的灵活和效率,离线数仓使用MaxCompute,支撑规模性和 Serverless 扩展性,实时流式计算用 Flink,凸显端到端全实时加工,三者的结合让实时和离线计算,分析和服务都能达到一个非常好的平衡,满足业务的多种需求。

      为了简化数据存储和统一数据服务,阿里云提出了 HSAP 架构理论 (Hybrid Serving& Analytical Processing,后续简称 HSAP),而 Hologres 是实践 HSAP 目标的一个具体实现。
    Hologres 的目标是,做分析服务一体化的实时数仓,

    三、Hologres 一站式实时数仓客户案例集

    3.1、电商

    3.1.1、实时数仓 Hologres 首次走进阿里淘特双 11

    业务简介与面临的问题
      淘特(原淘宝特价版)定位为消费者带来低价且有质量的源头好货,目前仍然处于用户快速增长的阶段,其中三方线上广告投放具有规模效应大,行业成熟度高等特点,是平台用户引流的重要渠道。
      由于本次大促具有时间长与高爆发两个特点,在这个过程中,我们面临这这么几个问题:
    ∙ 流量低价获客:
    ∙ 极简营销玩法:
    ∙ 货商高效汰换

    解决方案
      围绕淘特双 10&双 11,基于上述在流量投放优化、营销玩法多维分析,品商实时排序等面临的业务问题下,我们构建了一套基于实时数仓 Hologres 的统一数据服务系统,从流量、玩法、货品全方面监控数据,支持业务在大促期间的精细化运营诉求.
    2023-10-12_173539.png

    挑战与优化:

      实时离线的数据存在一定 GAP,在多日的周期下,差异累积放大,导致影响业务的决策判断,另一方面大促期间人力开发资源紧张,如果用离线数据进行覆盖,成本额外增加一倍。在此背景下,引入了流批一体的技术方案,使用 Hologres 进行统一存储与计算,并且通过 Blink Batch 实现了实时离线共用同一套代码,计算逻辑统一,大幅度降低了重复开发与后续运维成本。

    2023-10-12_174022.png

      数据同学只需要加工最明细数据,便能通过 Hologres 构建灵活多维的查询应用,整体的研发效率提升在 40%以上(单场景平均 5 人日下降至 3 人日),同时部分原本需要由在线 Blink 作业的数据计算,转变为了查询时再计算的模式,整体计算资源预计有 20%左右的减少。

    3.1.2、淘菜菜 (一):基于 Flink 和 Hologres 的实时数仓架构升级之路

    发展历程:从数据库到高可用实时数仓
    为了支持淘菜菜丰富的业务需求,其背后的技术发展历经了最初的零售通原始数据库架构、零售通传统 lambda 架构、Hologres 实时数仓、Hologres 高可用实时数仓这 4 个阶段。
    阶段 1:16 年之前原始架构- jstorm 阶段
    阶段 2:16-20 年传统架构 -FlinkSQL 阶段
    阶段 3:20 年实时数仓 - Flink+Hologres 阶段
    阶段 4:21 年高可用实时数仓-Flink+Hologres 读写分离部署

    第一次架构升级:传统架构替换为 Flink+Hologres 实时数仓 1.0
    第二次架构升级:Flink+Hologres 高可用实时数仓 2
    2023-10-12_180239.png

    3.1.3、阿里 CCO:基于 Hologres 的亿级明细 BI 探索分析实践

    CCO 数据洞察产品基于 Hologres 在 BI 查询场景的最佳实
    阶段一:预计算聚合 Cube(MOLAP)+ADB 加速查
    阶段二:实体 ID 轻度汇总事实表+维度表关联
    阶段三:基于 Hologres明细宽表的即席查询

    三种方案对比:
    2023-10-12_190609.png
    2023-10-13_155839.png

    3.1.4、Flink+Hologres 实时数仓在 Lazada 的建设及应用

    Flink+Hologres 实时数仓在 Lazada 的建设及应用
    2023-10-13_160136.png

    LAB 平台实验的数据流加工过程
    2023-10-13_160909.png

    3.1.5、金蝶管易云 X Hologres:新一代全渠道电商 ERP 最佳实践

      金蝶管易云在拥有巨大用户量的同时,管易云 ERP 系统也面临海量的数据分析和极速探索需求,从而帮助企业实现更加高速的业务增长。而由于之前的技术方案限制,导致我们对外提供的技术解决方案无法有效响应业务需求,业务稳定性也备受调整,于是造成企业无法充分利用数据的价值提供更好的业务支持,反而 IaaS 成本支出成为了的主要开销。

      迫于这些痛点,在原先的基础上,将底层的数据库升级成了实时数仓技术 DataWorks
    +Hologres+Flink,助力企业数据查询秒级响应,业务需求变得更加敏捷,月 IaaS 费用节省了 50%
    2023-10-13_171949.png
    2023-10-13_172036.png

    3.1.6、Hologres RoaringBitmap 实践:千亿级画像数据秒级分析

    从技术方案角度看,一些可以实现的画像分析的方案和其缺点
    2023-10-13_154025.png

      Hologres 原生支持 RoaringBitmap 数据结构,特别适合大数据量级下的交并差运算,并且在画像分析的场景天然适合,因此我们最后选择了 RoaringBitmap 方案。虽然 RoaringBitmap 会带来额外的处理和优化步骤、索引构建过程,这可能会带来一定的初期成本上升。然而,如果场景中数据更新不是那么频繁,数据量级也在可控范围内,这一成本上升在可接受范围。而且使用 RoaringBitmap 带来的效率提升非常明显,最终还是选择使用这一方案进行标签和人群加速。

      基于 Bitmap 的画像分析,75%的的比例在 10 秒之内可以出结果,个别由于数量级过大(例如几十亿人群规模,以及一些复杂的标签) 会有一些长耗时的执行。

      统计运营常用的 10 个标签,可以看到 Bitmap 的平均耗时对比 maxCompute 耗时缩短了至少 2 倍的时间,最高能提升 20

      通过 Hologres RoaringBitmap 的功能,我们技术平台实现了从原来的分钟级画像计算,到千亿级人群画像秒级分析体验,帮助业务查询效率提升几十倍,也进一步节约了计算资源。

    3.2、游戏

    3.2.1、37 手游云平台基于 Flink+Hologres 大数据建设实践

    云平台整体设计方案

    2023-10-13_172940.png

    第一条链路是实时流,从 Kafka 过来,经过实时计算,实时计算之后会落到 Hologres。但是有一些场景需要扩展维度,实时计算时会用到配置表,是在 Hologres 基于行存来存储的配置表,通过点查的能力,把配置信息取出来做实时关联,最终落到 Hologres。
    第二条链路,可能也是大家常用的(传统的数据库还是要保留),我们会把传统的MySQL 数据库通过 DataWorks 数据集成同步到 Hologres。
    最后一条链路是离线的,Kafka 数据通过 DataWorks 写到 MaxCompute,写完之后会在 MaxCompute 每天定时跑任务来修整第一条线的实时数据,也就是做一个离线的修正。另外我们会把 MaxCompute 里画像数据推到另外两个组件。这里说明一下,这两个组件是为了考虑到双云部署,所以我们考虑到开源的组件,StarRocks 和HBase,这两块主要是用在画像上。
    最后一层是用到 Quick BI 做展示,包括用户画像也是基于 StarRocks 和 HBase 做一个查询。
    2023-10-13_173706.png

    • 上面是实时数仓,可以看到主要来源于两个地方,一个是 MySQL,一个是 Kafka。两块数据是通过 Flink 落到 Hologres,从 DWD 到 DWS 再到 ADS 逐层清洗,最终落到 Hologres。
    • 下面是离线数仓,通过 MySQL、Kafka 落到 MaxCompute,在 MaxCompute 逐步分层,最终落到 Hologres,离线这一层会修正实时的数据

    3.2.2、Hologres X TapTap:毫秒级实时在线推荐

    2023-10-13_174622.png

    1. 业务痛点:业务增长缓慢,急需大数据技术反哺
    2. 解决方案:大数据技术架构升级,促进业务实时化、数智化
    3. 高可用部署保障在线服务读写分离
    4. 业务价值:推荐业务成为 TapTap 游戏分发最大来

    3.2.3、乐元素 X Hologres:一站式高性能游戏运营分析平台

      乐元素面对多款 DAU 超千万的热门游戏产品,每天产生海量的游戏日志数据,如何通过数据运营获引起家对兴趣,提升游戏体验,降低用户流失成为决定游戏产品成败的关键。

      然而数据规模巨大、分析模式复杂,对游戏业务的运营分析数据产品形成了巨大的挑战。

      一方面手游产品迭代速度快、平均生命周期短,市场、运营需要快速的对玩家动态做出判断,这要求数据流转速度必须要快;另一方面,产品、用户、营销运营关注多数据面广,既需要通过宏观数据了解产品健康状况,有需要通过多种微观数据溯源问题原因,要求数据产品需要提供高灵活性的计算能力。

      基于此背景,乐元素数仓团队升级技术架构,通过阿里云 Hologres 替换开源 Hive+Presto 架构,支持运营分析更加高效、实时,显著提升运营效率,进一步辅助业务精细化运营
    2023-10-13_180753.png
    2023-10-13_181902.png

    3.3、物流

    3.3.1、递四方 X Hologres:双 11 实时物流订单最佳实践

    递四方会选择 Hologres 的原因是通过调研发现它有几个特点,比较适合实际情况。

    第一是 Hologres 的实时能力,满足目前递四方的实时数仓需求,支持百亿级表与亿级表之间的 JOIN,秒级查询响应,还支持实时写入、批量数据导入,拥有超高导入性能,且并发能力极强。
    第二是 Hologres 采用存储计算分离架构,数据存储在阿里云分布式文件系统 pangu中(类比开源 HDFS),方便按需单独扩展计算或者存储。对快速行业来说,大促和日常所需要资源不一样,能够快速扩缩容,满足业务的动态需求。同时 Hologres 支持异构 数 据 源 交 互 分 析 以 及 离 线 数 据 和 实 时 数 据 的 联 邦 查 询 , Hologres 已 经 和MaxCompute 无缝打通,能够直接在 Hologres 中加速查询 MaxCompute 离线表。
    第三是维护成本低、运行稳定,Hologres 作为实时数仓存储成本大约是 ADB 的 1/3。资源灵活性高,可以像 MaxCompute 一样灵活的升降配置,与阿里云大数据组件兼容性高,能降低运维成本和提高研发效能,不会对技术架构带来很大负担。
    Flink+Hologres 组合作为实时数仓
    2023-10-13_203946.png

    3.3.2、菜鸟裹裹万能查:小包裹数据的大革新

      菜鸟裹裹基于 Hologres 构建万能查产品的最佳实践。

      智能化履约过程及不断精益化的业务系统,菜鸟裹裹团队急需一套一体化的数据产品,能够智能化、专业化、高效化的解决日常遇到的数据问题与需求,并在日常的数据监控与效果分析的过程中,用数据影响业务决策。

    1) 业务日益增长的数据需要和不平衡不充分的数据服务发展之间的矛盾
    2) 在降本增效大背景下的人效匹配问题
    2023-10-14_005954.png

    万能查产品构想
      通过目前现有的数据支撑能力,依赖 Hologres 引擎,将裹裹寄件常用且稳定的维度和指标封装于万能查中。用户可根据自己的需求筛选字段,定制化自己的报表,快速自助完成运营数据分析。
    2023-10-14_010556.png
    2023-10-14_010939.png

    3.3.3、满帮多云环境下的实时计算实践和思考

    2023-10-14_012810.png
    2023-10-14_012055.png

      基于实时基础数据,为了做出实时的智能决策,应该如何去抽象整个公司实时数仓的建设?
    物流本身是一个强 LBS 位置关系的应用场景,它和电商不一样,物流更重车和货。所以在构建实时数仓的时候,满帮以位置维度为核心,在各个维度下面的数据,把位置信息给加上去,可以做更好的关联。必要的时候还会做成一张大宽表。

      在做实时数据的时候,更多的是去想如何快速的赋能业务,去做实时智能的决策,提高整个公司的决策效率和效果。车货匹配、决策定价,调度决策、供需监控,客服决策,这些都是需要实时赋能业务的。
      在实时数仓和实时智能决策平台这两层,很多公司都是靠数据解决方案的同学去赋能业务,但是满帮想用更高的人效来服务业务,所以在中间还抽象了一层叫做实时供需引擎。
      实时供需引擎的作为包括:

    本质抽象:把决策的本质,对于实时数据本质的诉求抽象出来。
    价值度量:推导实时数据对业务的价值是什么样的。
    价值挖掘:作为数仓和业务之间的一个联动方,在这里面去挖掘更多价值,比如基于实时行为的预测,基于风控的管理。满帮在实时数仓里面的建设,实际上是进行两层推导的。第一层从左到右是产出实时数仓,从右到左是产生实时的供需引擎。

    3.4、教育

    3.4.1、新东方基于 Hologres 实时离线一体化数仓建设实践

    2023-10-14_090840.png

      从以上的表格能看出,Tidb 和 Hologres 可以较好地解决新东方在大数据方面面临的问题。但是 Tidb 需要私有云部署并运维,而 MaxCompute 部署在公有云,两者在不同的云环境。

      Hologres 是阿里云提供的云原生服务,并与 MaxCompute 都部署在公有云,且在 Pangu 文件层紧密集成,数据交换效率远高于其他外部系统,两者都兼容 PostgreSQL,从离线数据仓库开发迁移到实时数据仓库开发难度降低。

      基于以上的分析,选择 Hologres 作为实时数仓。
    2023-10-14_013841.png

    3.4.2、替换 Kudu,Hologres 助力好未来网校实时数仓降本增效

    2023-10-14_015658.png

    Hologres 全面替换 Kudu 作为主 OLAP 引擎
      选择了 Hologres 作为实时数仓的主 OLAP 引擎之后,通过 Hologres 替换了 Kudu 的所有数据处理链路,同时也通过 Hologres 读写分离部署的方式,以只读从实例(简称从库)替换了原 PolarDB/MySQL 等查询引擎,以此构成了实时数仓 2.0。

      数据链路如下:

    数据分为离线和实时两部分。离线部分数据源数据通过集团采集工具 T-Collect 接入Hologres ODS 层,实时部分通过 Flink 实时接入 MySQL Binlog、埋点日志等数据入替换 Kudu,Hologres 仓。
    在 Hologres 中对数仓分为 ODS、DWD、DWS、ADS 等 4 层,每一层的数据通过集团T-Data 平台分钟级调度、清洗,并最后由 Hologres 从库提供线上服务出口。
    实时和离线数据统一由 Hologres 存储,并由从库作为查询引擎统一提供线上数据出口,支撑的业务场景包括实时看板、实时大屏、实时接口服务、实时推送等场景。
    2023-10-14_021128.png

    3.5、广告

    3.5.1、阿里妈妈 Dolphin 智能计算引擎基于 Flink+Hologres 实践

    选择 Flink+Hologres 这套架构主要来源于对底层引擎的强需求:
    1) 高性能
    广告场景对延迟有着很敏感的要求,如果底层引擎的性能不足,即使上层应用再做优化,也会导致计算性能大打折扣,从而导致广告投放等不精准。
    2) 可扩展
    底层引擎需要足够的可扩展,这样上层应用才能更加灵活的去承接新的业务、新的场景,应对业务高低峰期等情况
    2023-10-14_021931.png
    2023-10-14_022042.png

    3.5.2、小迈科技 X Hologres:高可用的百亿级广告实时数仓建设

    2023-10-14_023510.png

      通过 Hologres+Flink+MaxCompute 搭建的流批一体实时数仓平台,支撑了小迈多个应用场场景,包括监控大盘,DMP 人群等智能投放,财务分析等。

    显著的业务收益有:

    上层服务共享数据
      数据共享之后就由平台统一对外输出服务,各个业务线无需自行重复开发,就能快速得到平台提供的数据支撑,减少了数据孤岛。

    亿级复杂查询秒级响应
      通过 Hologres 自身的优秀查询性能,再配合建表和 SQL 的优化手段,大大提高了报表的响应速度,即使是用户画像、行为分析等亿级大表复杂关联查询也能很快出结果,得到了业务的认可。

    系统读写分离稳定性强
      通过 Hologres 共享存储实例部署的方式,让业务实现了读写分离,同时也只用了一份存储,既保证了系统的稳定性,同时也不会带来额外的成本压力。

    3.6、金融

    3.6.1、诺亚财富 X Hologres : 统一 OLAP 分析引擎,全面打造金融数字化分析平台

    根据业务需求评估了四个维度:

    2023-10-14_024119.png

    自建 CDH 迁移上云,Hologres 助力统一 OLAP 分析

    2023-10-14_024943.png

      整个数据中台依托于 DataWorks,离线部分在 MaxCompute 中进行,通过 DataWorks的数据同步模块把离线部分同步到 MaxCompute 和实时部分同步到 Hologres,然后利用 Flink 的把神策埋点的 Kafka 数据清洗同步到 Hologres 中,同时也通过 Hologres 的外表把 MaxCompute 的数据迁移到 Hologres 中,保证统一 OLAP 分析引擎。

    四、个人体会

      通过阅读这本《Hologres 一站式实时数仓客户案例集》,我对Hologres有了更深入的了解,每个行业都有其独特的需求和挑战,Hologres以其强大一站式实时数据仓库引擎,支持海量数据实时写入、实时更新、实时分析,与MaxCompute、Flink、DataWorks 深度融合,提供离在线一体化全栈数仓解决方案,广泛应用在实时数据中台建设、精细化分析、自助式分析、营销画像、人群圈选、实时风控等场景,为案例企业提供了个性化的解决方案,帮助它们在激烈的竞争中保持优势。

      随着 Hologres 云原生引擎的诞生,我们已经可以窥到湖仓一体可能的实现和使用方式,并以此支撑异构多元智能计算。

      未来有希望能够利用 Hologres 服务与分析一体化的能力,并结合 AI 处理,在一个平台、一个组件上快速完成数据加工,将业务价值通过技术平台高效释放。

    2023-10-12_190737.png

    案例企业选择了阿里云 Hologres 作为解决方案,一般都是有几个特点比较符合案例的业务需求:

    分布式系统:原生的分布式系统,自研存储引擎和计算引擎,可以实现数据的高性能写入、更新以及高并发的查询,且查询效率高。
    易扩展:天然的存储计算分离架构,可以根据业务需求动态增加存储和计算能力,满足电商业务的高低峰流量属性,也减少成本压力。
    高安全性:数据存储在 Pangu 分布式系统,天然具备 3 副本,同时 Hologres 本身也支持数据脱敏、IP 白名单等安全能力,提高了数据的访问性能和可用性。
    高度的隔离性:有共享存储的资源隔离方案,这样就能满足我们不同业务、不同场景的隔离需求,提升系统的稳定性
      利用 Hologres 的 OLAP 查询能力,能够在大促当天支持业务做实时分析,业务可以根据业务诉求,比如目标人群覆盖不够,GMV 达成不足时,就能在极短时间内进行快速查询与分析,然后做下一步的运营策略,如圈选优惠券发放的目标人群,同时也能实时检测流量、权益等数据,方便运营动态调整策略

      通过 Hologres+Flink+MaxCompute 搭建的流批一体实时数仓平台,可以支撑多个应用场场景,包括监控大盘,DMP 人群等智能投放,财务分析等。

      利用 Hologres RoaringBitmap 能力,实现更快更准的画像分析。

      Hologres 在不同行业中有着广泛应用和巨大潜力。

    踩0 评论0
  • 回答了问题 2023-10-12

    下一代Docker来了,会让部署更加丝滑吗?

    1、在开发者眼中,Docker有怎样通俗易懂的理解方式?

      Docker是一个开源工具,它让开发人员可以在容器中打包、运输和运行应用程序。容器是轻量级的、可移植的、自包含的独立环境,它可以在任何机器上运行,而不需要任何修改。
      假设你需要在你的电脑上运行一个应用程序,但你发现应用程序在不同的环境中会发生问题。比如,你在Windows电脑上开发了一个应用程序,但当你将它运行在Linux服务器上时,它不能正常工作。
      这时候,你可以使用Docker来打包你的应用程序和需要的环境,这样就可以确保你的应用程序在不同的机器上都能正常运行了。
      Docker基于镜像(Image)的概念,镜像就是一个文件,它包含了应用程序和所需的依赖环境。你可以将镜像上传到Docker仓库(Docker Hub)中,当需要在其他机器上运行应用程序时,只需要从Docker仓库中下载镜像,再通过容器(Container)运行即可。
      容器是从镜像中创建出来的,它是一个隔离的运行环境。每个容器都有自己的文件系统、网络等资源,不会影响到宿主机以及其他容器。你可以在一个宿主机上运行多个容器,每个容器之间互不干扰。
      Docker可以让开发人员更加轻松地管理应用程序和依赖环境,同时也能够提高应用程序的可移植性和可靠性。

    2、都在夸Docker的优点,那它有什么缺点吗?

    Docker的缺点:

    • 资源消耗:
        Docker容器运行时需要占用一定的CPU、内存和磁盘空间,虽然Docker容器比虚拟机更轻量,但是如果运行大量的容器,仍然会消耗大量的系统资源。
    • 安全问题:
        由于Docker容器之间共享同一内核,容器之间的安全性和隔离性可能存在一定的风险。
        Docker的隔离性并不完全,容器之间可能会存在一定的安全问题,如容器之间的互访、特权容器的漏洞等。
        Docker容器共享主机的操作系统,如果容器中的应用程序存在漏洞,那么可能会影响到主机系统的安全。虽有工具和最佳实践可以帮助提高Docker的安全性,但这仍然需要开发者和运维人员投入额外的时间和精力。
    • 复杂性:
        Docker的操作相对于传统的虚拟机来说更为复杂,需要掌握一定的Docker技术。Docker需要掌握一定的技术和知识才能进行操作,对于初学者来说可能较为困难。
    • 存储问题:
        Docker容器内的数据与容器本身分离,当容器被删除时,数据也会被删除,为了避免数据丢失,需要进行备份和恢复。
        Docker默认使用AUFS存储驱动,对于大量的IO操作会出现问题,需要使用其他存储驱动。
    • 容器数量限制:
        Docker默认设置了一个容器数量限制,单机上的容器数目有一定限制,需要手动进行设置。
    • 性能问题:
        Docker容器相比于直接运行应用程序性能会略有损失,需要适当调优。
    • 数据持久性:
        Docker容器的设计理念是无状态的,也就是说,当容器停止运行时,其中的数据会被清除。虽然可以通过数据卷(volume)和数据容器等方式来实现数据的持久化,但是这会增加配置和管理的复杂性。
    • 学习曲线:
        尽管Docker为软件开发和部署带来了许多便利,但是要熟练使用Docker,还需要投入一定的时间和精力来学习。
    • 兼容性问题:
        虽然Docker的目标是“Build once, run anywhere”,但是在实际使用中,由于各种原因(比如操作系统的差异,驱动程序的问题等),可能并不能100%实现这个目标。
    • 跨平台:
        Docker最初是为Linux设计的,虽然现在也支持Windows和Mac,但是在这些平台上,Docker需要运行在一个轻量级的虚拟机中,这可能会带来一些性能和兼容性问题。
    • 官方支持:
        由于Docker是一个开源的项目,官方支持有限,使用者需要通过社区、文档等手段获取相关的技术支持。

    3、Docker与AI结合,会让部署更加丝滑吗?

      是的,Docker与AI的结合可以让部署更加丝滑。

    • 1、Docker可以提供一个可移植的环境,使得AI应用程序可以在不同的操作系统和平台上运行,从而使部署更加方便和快速。
    • 2、Docker还可以提供一个容器化的环境,让AI应用程序可以轻松地在不同的主机之间迁移和扩展。
    • 3、Docker还可以提供一个标准化的部署流程,使得AI应用程序的部署更加可靠和一致。这可以帮助开发人员减少出错的可能性,并使得整个部署过程更加自动化和高效。
    • 4、Docker容器化技术可以让开发人员和数据科学家轻松地打包、分发和运行AI工作负载,以加速开发和部署AI应用程序。
    • 5、Docker 消除了重复、平凡的配置任务,并在整个开发生命周期中使用,以实现快速、轻松和可移植的应用程序开发。借助 Docker,AI/ML 开发人员在环境设置上花费的时间更少,而将更多的时间用于编码。
        因此,结合Docker与AI可以使得应用程序的部署更加丝滑,使得开发人员可以更加专注于开发AI算法和模型。可以让部署更加丝滑和高效,为企业和开发人员带来更大的价值。
    踩0 评论1
  • 回答了问题 2023-09-27

    【藏经阁一起读(71)】读《阿里云 ClickHouse 企业版技术白皮书》,你有哪些心得?

    【藏经阁一起读(71)】读《阿里云 ClickHouse 企业版技术白皮书》

    4odtsxaivtzng_6d95f7e93c7e4a95add88b975134e143.jpg

    作者: Tom Schreiber 凤豪 卫寻 魏庄
    本书由 ClickHouse 资深技术专家和产品联合撰写,全面介绍了ClickHouse企业版的云原生存算分离整体架构,详细介绍 SharedMergeTree表引擎的实现机制原理及基准测试结果,并介绍 Lightweight update 增强数据更新的实时性的实现原理,是学习 ClickHouse 云原生技术的宝贵资源。

    《阿里云 ClickHouse 企业版技术白皮书》不属于初级技术书籍,Clickhouse是什么,文中没有相关介绍,我自己先补习了一些相关知识:

    一、什么是clickhouse

    ClickHouse是一种OLAP类型的列式数据库管理系统,是一个全球流行的开源高性能、可扩展列式数据库技术,核心应用于在线分析处理(OLAP)业务,
    ClickHouse完美的实现了OLAP和列式数据库的优势,因此在大数据量的分析处理应用中Clickhouse表现很优秀。
    ClickHouse是一个用于联机分析(OLAP)的列式数据库管理系统(DBMS)。

    1.1、OLAP联机分析处理

    OLAP(OnLine Analysis Processing ,联机分析处理 ) 是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。在实际的商业分析中,OLAP联机分析更多的是指对数据分析的一种解决方案。

    OLAP联机分析首先是把数据预处理成数据立方(Cube),并把有可能的汇总都预先算出来(即预聚合处理),然后在用户选择多维度汇总时,在预先的计算出来的数据基础上很快地计算出用户想要的结果,从而可以更好更快地支持极大数据量的及时分析。

    OLAP联机分析最基本的工作就是对数据方(Cube)的操作
    OLAP联机分析是从多维信息、多层次信息的角度,针对特定问题进行数据的汇总分析。

    OLAP场景的关键特征

    • 绝大多数是读请求
    • 数据以相当大的批次(> 1000行)更新,而不是单行更新;或者根本没有更新。
    • 已添加到数据库的数据不能修改。
    • 对于读取,从数据库中提取相当多的行,但只提取列的一小部分。
    • 宽表,即每个表包含着大量的列
    • 查询相对较少(通常每台服务器每秒查询数百次或更少)
    • 对于简单查询,允许延迟大约50毫秒
    • 列中的数据相对较小:数字和短字符串(例如,每个URL 60个字节)
    • 处理单个查询时需要高吞吐量(每台服务器每秒可达数十亿行)
    • 事务不是必须的
    • 对数据一致性要求低
    • 每个查询有一个大表。除了他以外,其他的都很小。
    • 查询结果明显小于源数据。换句话说,数据经过过滤或聚合,因此结果适合于单个服务器的RAM中
      OLAP场景与其他通常业务场景有很大的不同, 因此想要使用OLTP或Key-Value数据库去高效的处理分析查询场景,并不是非常完美的适用方案。例如,使用OLAP数据库去处理分析请求通常要优于使用MongoDB或Redis去处理分析请求。

    1.2、行式数据库系统

    在传统的行式数据库系统中,数据按如下顺序存储:
    2023-09-27_102353.png
    row-oriented-d515facb5bffb48cbd09dc7d064c8816.gif

    处于同一行中的数据总是被物理的存储在一起。
    常见的行式数据库系统有:MySQL、Postgres和MS SQL Server。

    1.3、列式数据库系统

    在列式数据库系统中,数据按如下的顺序存储:
    2023-09-27_102521.png

    这些示例只显示了数据的排列顺序。来自不同列的值被单独存储,来自同一列的数据被存储在一起。
    常见的列式数据库有: Vertica、 Paraccel (Actian Matrix,Amazon Redshift)、 Sybase IQ、 Exasol、 Infobright、 InfiniDB、 MonetDB (VectorWise, Actian Vector)、 LucidDB、 SAP HANA、 Google Dremel、 Google PowerDrill、 Druid、 kdb+。

    列式数据库更适合于OLAP场景
    column-oriented-b992c529fa4085b63b57452fbbeb27ba.gif

    1.4、方式选择

    不同的数据存储方式适用不同的业务场景,数据访问的场景包括:进行了何种查询、多久查询一次以及各类查询的比例;每种类型的查询(行、列和字节)读取多少数据;读取数据和更新之间的关系;使用的数据集大小以及如何使用本地的数据集;是否使用事务,以及它们是如何进行隔离的;数据的复制机制与数据的完整性要求;每种类型的查询要求的延迟与吞吐量等等。
    系统负载越高,依据使用场景进行定制化就越重要,并且定制将会变的越精细。没有一个系统能够同时适用所有不同的业务场景。如果系统适用于广泛的场景,在负载高的情况下,要兼顾所有的场景,那么将不得不做出选择。是要平衡还是要效率?

    ClickHouse在DB—Engine 全球数据库流行度排榜排名前列,逐年关注度增长迅猛。ClickHouse 分析性能优异,典型分析场景下,支持数十亿级数据行规模,90%查询在1秒内完成。这使得 ClickHouse 成为企业处理大规模数据,构建实时数仓的理想选择。国内外大厂中,微软,腾讯、ebay,淘宝、Uber,京东、快手、小红书,携程都使用 ClickHouse 构建数据分析平台。

    1.5、MergeTree表引擎

    MergeTree(合并树)系列表引擎是ClickHouse提供的最具特色的存储引擎。MergeTree 引擎系列的基本理念如下。当你有巨量数据要插入到表中,你要高效地一批批写入数据片段,并希望这些数据片段在后台按照一定规则合并。相比在插入时不断修改(重写)数据进存储,这种策略会高效很多。MergeTree引擎支持数据按主键、数据分区、数据副本以及数据采样等特性。官方提供了包括MergeTree、ReplacingMergeTree、SummingMergeTree、AggregatingMergeTree、CollapsingMergeTree、VersionedCollapsingMergeTree、GraphiteMergeTree等7种不同类型的MergeTree引擎的实现,以及与其相对应的支持数据副本的MergeTree引擎(Replicated*)。
    MergeTree是该系列引擎中最核心的引擎,其他引擎均以MergeTree为基础,并在数据合并过程中实现了不同的特性,从而构成了MergeTree表引擎家族。

    二、ClickHouse 企业版云原生架构

    ClickHouse 企业版采用完全不同与开源社区版本的云原生新架构,针对云环境做了全面适配。新架构基于存储和计算分离的架构基础,采用对象存储数据实现 Share Storage 共享存储,所有ClickHouse Server 节点都可以访问相同的全局物理数据,单个Server 节点实际上是单个没有限制分片的Replica 节点,节点之间访问同一份数据副本。
    2023-09-27_105132.png

    三、ClickHouse企业版引擎升级

    MergeTree系列的表引擎是ClickHouse中的主要表引擎。它们负责存储插入的数据,在后台进行数据合并,根据特定的引擎进行数据转换等操作。企业版新推出SharedMergeTree引擎加入到MergeTree引擎大家庭,而企业版能够支持云原生架构箩也核心依赖sharedMergeTree引擎。sharedMergeTree引擎是商业化引擎,仅在企业版提供,在开源社区版不支持。
    3.1、开源ReplicatedMergeTree引擎
    大多数MergeTree家族中的表都支持自动的数据复制,并通过表引擎的复制机制实现
    3.2、云原生SharedMergeTree引擎ReplicatedMergeTree
    SharedMergeTree表引擎是ClickHouse内核ReplicatedMergeTree表引擎的更高效的替代品,专为云原生数据处理而设计和优化。
    深入了解这个表引擎,解释其优势,并通过基准测试展现其效率。
    3.3、对象存储上的数据可用性
    3.4、自动集群扩展

    四、ReplicatedMergeTree的挑战

    ReplicatedMergeTree表引擎并不适用于ClickHouse企业版的预期架构,因为其复制机制旨在在少量的节点上创建数据的物理副本。而ClickHouse企业版需要一个支持在对象存储之上运行本量计算服务节点的表引擎。

    • 显式的数据复制
      ReplicatedMergeTree表引擎的复制机制:使用ClickHouse Keeper(也称为“Keeper”)作为协调系统,通过复制日志方式进行数据复制。Keeper充当复制过程特定元数据和表结构的集中式存储,以及分布式操作的一致性协调系统。Keeper确保为Part顺序地分配连续的块编号,将merge和mutation操作分配给特定的replica。
      下图概述了一个具有3个replica节点的shared-nothing架构的 ClickHouse集群,并显示了ReplicatedMergeTree表引擎的数据复制机制:
      2023-09-27_175356.png
    • 依赖 sharding进行集群扩展

    五、SharedMergeTree 升级

    5.1、独立 SharedMergeTree 优点

    ClickHouse企业版实现了一个名为 SharedMergeTree的表引擎 - 专为在共享存储上工作而设计。SharedMergeTree 是云原生方式,具有如下优点
    (1) MergeTree 代码更加简单易维护,
    (2)支持垂直和水平自动扩展,
    (3)为我们的云用户提供未来的功能和改进,如更高的一致性保证,更好的耐用性,基于时间点数据恢复等。

    5.2、SharedMergeTree 引擎下的集群扩展原理

    在这里,我们简要介绍 SharedMergeTree 如何支持ClickHouse企业版自动进行集群扩展。提醒一下:ClickHouse企业版计算节点是具有访问共享存储的计算单元,其规格和数量可以更改。基于此机制,SharedMergeTree 完全将业务数据和元数据的存储与计算节点分离,并使用Keeper的接口去读取、写入和修改共享元数据。每个计算节点都有一个存储元数据的本地缓存,并通过订阅机制自动获取数据更改的通知。下图描述了如何使用 SharedMergeTree 将新服务器添加到集群中:
    当Server-3 添加到集群时,这个新Server ① 订阅 Keeper 中的元数据更改信息并将当前Parts的元数据获取到其本地缓存中。这不需要任何锁机制;
    ②新Server基本上只需说:“我在这里。请随时通知我所有数据更改”。
    ③新添加的Server-3 几乎可以立即参与数据处理,因为它通过从 Keeper 中只获取必要的元数据信息,找到有哪些数据以及在共享存储中的什么位置。

    5.3、SharedMergeTree 引擎下的数据一致性原理

    下图描述所有Server 节点如何知道新插入的数据,来保证查询数据一致性:
    ① Server-1 接收到插入查询
    ② Server-1将写入的数据以Part的形式写入共享存储。
    ③ Server-1 还将关于该部分的信息存储在其本地缓存和 Keeper 中(例如,哪些文件属于该Part,以及与文件对应的块位于共享存储中的位置)。
    ④ ClickHouse 向查询的发送者确认插入成功。其他节点(Server-2、Server-3)通过 Keeper 的订阅机制 ⑤ 自动得到存储层中存在新数据的通知,并将更新的元数据提取到其本地缓存中。
    请注意,在步骤 ④ 之后,插入的数据是持久的。即使Server-1或其他任何节点崩溃,Part都存储在高可用的存储中,元数据存储在 Keeper 中(Keeper 具有至少 3 个 Keeper节点的高可用设置)。
    从集群中移除节点也是一个简单且快速的操作。为了优雅地移除,相关节点只需从 Keeper 中注销,以便处理进行中的分布式查询时不会出现缺少服务器的警告。

    六、CIickHouse企业版收益

    • 无缝集群扩展
      ClickHouse企业版中,SharedMergeTree表引擎是RepIicatedMergeTree表引擎的更高效的替代品,为ClickHouse企业版用户带来以下好处。
    • 插入操作的效率收益
    • 更轻量级的强一致性Select查询
    • 集群吞吐和查询效率的线性提升

    七、SharedMergeTree引擎的兼容性

    SharedMergeTree 表引擎现在已经作为 ClickHouse企业版中默认的表引擎。ClickHouse企业版支持的 MergeTree 家族中的所有特殊表引擎,并都会自动基于 SharedMergeTree 进行更新。

    八、SharedMergeTree的实际应用对比

    SharedMergeTree 支持无缝的集群扩展。测试中,后台合并的吞吐量与节点数量呈线性关系。当我们将节点数量从 3 增至 10 时,吞吐量也将增加三倍左右。当我们将节点数量再次增加 2 倍至 20,然后增加 4 倍至 80 时,吞吐量也分别增加了约两倍和四倍。正如预期的那样,使用ReplicatedMergeTree 在随着副本节点数量的增加时无法很好地扩展(甚至在较大的集群大小下会减少写入性能),而SharedMergeTree 则随着副本节点数量的增加而获得更好的扩展。因为它的复制机制不适用于处理大量副本的情况。

    九、总结

    通过阅读《阿里云ClickHouse企业版技术白皮书 》,我了解了企业版的技术架构和实现原理,了解了ClickHouse 企业版 SharedMergeTree 表引擎的机制,丰富了云原生知识。

    十、附录

    阿里云
    网络
    ClickHouse官方
    https://zhuanlan.zhihu.com/p/621480049
    https://zhuanlan.zhihu.com/p/361622782

    踩0 评论0
  • 回答了问题 2023-09-15

    相比优秀的服装设计师,AIGC 可以如何突破设计灵感的界限?是纯粹的机械语言还是一点点的灵光乍现?

    一、AIGC 设计能替代真正的设计师吗?

    回答这个问题前我们先来看看同一古埃及主题下传统设计师和人工智能AIGC设计的设计效果对比。(图片来源于网络,地址见附录,无意侵权,仅作文章中举例用途)

    1.1、传统设计师设计

    2018年12月巴黎—纽约”高级手工坊系列发布会,老佛爷以神秘的古埃及文化为灵感,为我们展示了一波金光灿灿的CHANEL FASHION,把大秀玩进了博物馆。

    香奈儿永恒经典的风格元素结合古埃及错综复杂的象形文字以及象征太阳与动物的符号,闪耀着熔金般的炫目光芒。富有图形美感的针织造型与双丹宁叠穿的溜冰连衣裙相映成趣,条纹沙色女神晚宴裙则有着邦德女郎般闪耀金属光泽的华丽衣领与袖口。

    香奈儿全球彩妆创意与色彩设计总监露西娅·皮卡挥洒创意巧思,在Adesuwa、Kaia Gerber 以及一众模特的双眸上下用白色或海军蓝色描绘出仿若猫抓般的弧形眼线,在服饰珠宝的璀璨光辉中,展现超凡脱俗的动人之美。

    金灿灿的黄金色调,是最能突显古埃及风情的,它能充分的彰显高贵与华丽的高级感。在工艺上,Chanel家经典斜纹软呢外套依旧贯穿整场秀的始末,加上裁剪上的独特触觉,让每一件服饰看起来都是艺术品,十分震撼。

    而服饰肌理图案多选用埃及传统的多角形、菱形、波浪形等抽象几何纹样,颇具艺术特色。
    1.png

    2.png

    3.jpeg

    4.jpeg

    5.jpeg

    6.jpeg

    1.2、AIGC设计

    4月,纽约“AI时装周(AI Fashion Week)”上演。这是一场人工智能美学与人类美学的碰撞。

    不仅模特非常生动,就连造型设计也带着满满的异域风格,令人一眼惊艳。

    7.jpeg

    8.jpeg

    9.jpeg

    图片来源:https://www.163.com/dy/article/IC7KP9F60538P65G.html

    1.3、相关概念

    AIGC:
    AIGC(Artificial Intelligence Generated Content)作为一种新型的内容生成方式,正逐渐成为未来内容生成的主力之一。

    AIGC指的是由人工智能算法自动生成的内容,通常包括文字、图片、音频、视频等多种形式。与传统的人工创作方式相比,AIGC能够快速、准确地生成大量高质量的内容,大大提高了内容生成的效率和效果。

    目前,AIGC已经应用到了各个领域。在新闻领域,越来越多的媒体开始使用AIGC自动生成新闻稿件,提高新闻生产效率,缩短新闻报道的时间。在广告领域,AIGC能够根据用户的行为和偏好,自动生成定制化的广告内容,提高广告效果。在电商领域,AIGC能够根据用户的搜索历史和购买记录,自动生成个性化的商品推荐,提高用户的购物体验。

    AIGC的应用方式多种多样,主要包括以下几种:
    (1)、 自动化写作:AIGC可以生成各种类型的文章、博客、新闻报道等文本内容,从而实现自动化写作。
    (2)、机器翻译:AIGC可以将一种语言翻译成另一种语言,以提高翻译效率和翻译质量。
    (3)、语音合成:AIGC可以模拟人类语音,生成语音合成技术,实现文字转语音。
    (4)、图像生成:AIGC可以生成各种类型的图像,包括照片、插图、艺术作品等。
    (5)、视频生成:AIGC可以使用图像合成技术生成各种类型的视频,包括动画、广告、剧集等。
    (6)、智能客服:AIGC可以模拟人类语言交流,利用自然语言处理技术和机器学习算法,实现自动化客服。
    (7)、个性化推荐:AIGC可以分析用户数据、行为以及历史偏好,推荐个性化内容和产品,提高用户体验。
    (8)、数据分析:AIGC可以对大量数据进行深度学习和分析,发现数据隐藏的规律和趋势,支持商业决策和预测。
    (9)、智能导航:AIGC可以结合地图、交通数据和用户需求,提供智能导航和路线规划。
    (10)、安全监测:AIGC可以使用监控、传感器等技术,对场所、设备等进行安全监测和预警。

    1.4、观点分析

    AI时装周令人一眼惊艳的AIGC创作其实在目前整个AIGC环境中并不是非常普及,但它宣告了人工智能浪潮AIGC高端应用的无限可能性。给设计产业带来巨大灵感与创新,有希望提高行业的数字化水平与设计制造效率。

    (1)、审美角度

    设计师有独特的审美能力、思考创造能力。
    而AI本质上是一种算法,AI可以快速生成的结果,但是结果没办法预测。
    而相比于算法工具,设计能力和设计思维本身是更加重要的。
    AIGC创意设计和人类设计师创意设计对比图:

    ebeb0d8fc7a544aeab0f7050cf7ea017.png

    Midjourney的创始人David Holz曾在接受媒体专访时提到,AI正不断产生新的美学,几乎就像“审美加速主义”,“但它们不是人工智能美学,而是新的、有趣的人类美学,我认为它们会溢出到真实世界”

    根据麦肯锡分析,未来3到5年,“保守地说”,生成式AI可能会帮助服装、时尚及奢侈品行业的营业利润创造1500亿美元的增量,乐观估计可高达2750亿美元。

    相比于传统的软件学习,AI工具简单易用,容易上手。设计师想要不被AI淘汰,就要紧跟技术发展步伐,掌握并运用AI工具,将AI技术成为自己擅长的一部分。合理利用工具可以减少自己的工作难度、提高工作效率、避免重复工作,能更好发挥自己的创作能力。

    (2)、版权角度

    现阶段的AI工具,是通过模型训练,通过大量学习素材后,根据用户的需求进行创作。在这过程中难免会产生一些与原作相似的作品,并且遭受到一些原创作者的抵触。

    据悉,"全球知名视觉艺术网站ArtStation的上千名画师发起联合抵制,禁止用户将其画作投放AI绘画系统,ArtStation认为,任由系统学习模仿画作是在侵犯版权。

    在实际应用来看,目前对于AI绘画对其他画师的著作权构成侵权,认定依旧困难。为规避版权风险,Getty Images、Shutterstock等大型付费图库不再接收由Stable Diffusion、Midjourney等生成的AI画作。"

    设计作品版权归属可以分为几种情况:
    1:设计师私下设计的作品私下设计的作品,版权就属于设计师。
    2:设计师受委托创作的作品受委托创作的作品,无协议无约定的情况下版权属于受托方(也就是设计师),有协议的情况按协议处理。(所以如果接到委托创作的需求,可以商量好版权归属然后签订合同固定下来,这样能避免后续出现扯皮不认的情况)
    3:设计师为完成公司任务设计的作品通常有版权意识的公司可能会在劳动合同中对员工作品的版权归属进行约定,如果有约定就按约定。没有约定的情况下,属于职务作品或者是法人作品。

    伴随着技术的进步,AI已经对知识产权制度形成了新的挑战。AI创作都需要庞大的人类作品数据库来做训练样本,通过算法大量学习即有作品的创作风格、内容题材,来产生相应的ai作品。当AI创作了自己的绘画、文章、动画、歌曲等作品后,其版权又如何界定?

    AI创作的版权问题涉及两个方面,一是AI创作的内容涉及侵犯他人著作权的问题,二是AI创作的内容在受版权保护的情况下被他人侵权。

    根据著作权法规定,AI创作作品如果是用于个人学习研究之目的,是可以构成合理使用的,即不会构成侵权。

    这里涉及到可能存在侵权问题的AI作品的使用者归属,到底是AI本身,还是背后操作AI的行为主体在进行使用。对于AI创作物可能主张权利的主体,可能包括AI发明人、该AI所属的公司或公司投资人,或者AI的具体操作者等,他们都有可能是主张权利的人。对应的这些人的行为,是否符个人学习欣赏之目的,目前仍然存在分歧的。

    2019年5月国内首例AI创作版权引发的纠纷案,AI创作内容被判不具备著作权。

    (3)、情感共鸣和业务角度

    设计师情感共鸣是设计的本源和内核。设计师可以根据不同文化背景、情感、语言、实际和虚拟环境等,与用户产生更多的情感共鸣,产出专属的设计方案来满足用户的需求,或者根据特定的产品来优化方案满足用户的需求。

    AIGC创作作品可以在训练时输入一些指定的需求行为,虽然部分生成的作品效果一眼看起来视觉表现力尚可,但再先进的工具也无法取代专业技能,目前阶段,AIGC创作无法使自身从软件层面跳脱到思考层面,认真分析会发现 很多AIGC创作作品缺少了对使用场景、产品思考、视觉审美、用户群体、业务目标、商业思考、交互逻辑的思考,产出的方案未必符合实际场景。

    随着AI的升级,智能UI工具或许会越来越完善,但是想要真正运用到业务中,还是需要设计师的相关参与,才能确保方案符合业务目标以及用户的使用需求。 让设计师参与,从需求背景出发进行分析,提炼卖点和用户群体,规划好生成的方向,发挥独特的洞察力和审美能力,可以产出更多、更好、更优质的结果来满足客户。

    AIGC的发展,对设计师的工作会产生一定影响,但不可能完全取代设计师,更多的是辅助设计师的工作。

    三、您的T恤设计理念是什么?((同时附上您的作品图片),AIGC 是如何让您的设计图更出彩?

    作品图片:
    c4d49a7cd79f40beb42eb9aea49f2f63.png

    3.1、T恤设计理念

    宇宙漫游
    人类自古以来就对宇宙充满了好奇,宇宙漫游是指在太空中进行的旅行和探索。

    宇宙漫游的目的是为了更深入地了解宇宙、地球以及我们自身的起源和发展,寻找其他外星生命形式的迹象。

    这种探索可以包括人类前往其他星球、卫星和行星,以及探索外太空中的星系和星云等天体。

    每个星球都有自己独特的规律,那是我们未知的世界,充满了无限惊喜和神秘。例如时间,就是个非常有趣的变幻数。先不论时间维度,仅仅一维时间里,不同星球就有不同剂量数值。

    地球一圈的时间是24小时,而月球转一圈的时间是648个小时,从某个角度上来看,我们地球上过去一年,而在月球上仅仅是过去了12天,好玩吧。

    我的构思主题是:一个长着翅膀的天使,没有令人惊艳的容貌,平凡而普通,从宇宙漫游中走来,带给人温暖和鼓励,告诉我们宇宙的本真。

    3.2、AIGC 如何让设计图更出彩的一些方法

    作为一个 AI 图形计算工具,AIGC 可以帮助设计师更快速地创建和编辑图形和图像,同时提高图形的质量和视觉效果。以下是 AIGC 让设计图更出彩的一些方法:

    1. 自动化设计过程:AIGC 可以利用 AI 技术自动化一些常规和重复性任务,例如选择配色方案、排版、形状调整等,这样您可以更快地完成设计工作。
    2. 图形增强:AIGC 的图像处理算法可以增强图像的质量,例如调整亮度、对比度、色彩平衡等,从而使图像更具视觉吸引力。
    3. 创造性元素:AIGC 可以生成出不同的创意元素,例如花纹、线条和图形形状等,这些元素可以让您的设计更具个性和独特性。
    4. 视觉优化:AIGC 可以根据设计需要自动调整图像的清晰度、锐度、颜色和对比度等,以确保图像在不同的设备和屏幕上都有最佳的视觉效果。

    四、AIGC 有哪些优势,同时可以从哪方面更好的去优化?

    AIGC(AI生成内容)具有一些明显的优势和不足:

    AIGC优势:

    1. 自动化和效率:AIGC技术能够自动地生成大量的内容,从而提高生产效率。相对于传统的人工创作方式,AIGC可以在短时间内生成大量内容,节省了人力资源和时间成本。
    2. 创意扩展和多样性:AIGC可以为创作者提供新的创意扩展空间。通过学习和分析大量数据,AIGC能够产生与传统创作方式不同的、创新的内容,从而丰富了创作的多样性。
    3. 大规模个性化和定制化:AIGC技术可以根据用户的需求和偏好生成个性化的内容。通过分析用户数据和行为模式,AIGC能够提供定制化的体验,满足用户的特定需求。
    4. 可扩展性和灵活性:AIGC技术可以应用于各种媒体形式,如文字、图像、音频和视频等。它可以适应不同领域和应用场景的需求,具有较高的可扩展性和灵活性。

    AIGC不足:

    1. 缺乏独创性和创造力:尽管AIGC可以生成大量的内容,但其中可能缺乏真正的独创性和创造力。由于AIGC是通过学习已有数据和模式生成内容,它可能无法创造出完全新颖和独特的创意。
    2. 潜在的道德和伦理问题:AIGC的应用也引发了一些道德和伦理问题的关注。例如,AIGC可能被用于制造虚假信息、滥用版权或侵犯隐私等问题,需要谨慎使用和监管。
    3. 依赖于数据质量和训练样本:AIGC的质量和效果很大程度上依赖于用于训练的数据质量和训练样本的多样性。如果训练数据存在偏差或不足,AIGC生成的内容可能存在问题或质量欠佳。
    4. 人工参与和监督的需求:虽然AIGC具有自动化生成内容的能力,但人工参与和监督仍然是必要的。人类创作者在指导、编辑和审核生成的内容方面发挥着关键作用,确保内容的准确性、合法性和质量

    五、参考资料

    踩0 评论0
正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息