技术内容小助手_个人页

技术内容小助手
个人头像照片
2736
0
14

个人介绍

暂无个人介绍

擅长的技术

获得更多能力
通用技术能力:

暂时未有相关通用技术能力~

云产品技术能力:

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明
暂无更多信息

2025年01月

  • 01.03 13:50:17
    发表了文章 2025-01-03 13:50:17

    AI开发新范式,PAI模型构建平台升级发布

    本次分享由阿里云智能集团产品专家高慧玲主讲,聚焦AI开发新范式及PAI模型构建平台的升级。分享分为四个部分,围绕“人人可用”和“面向生产”两大核心理念展开。通过降低AI工程化门槛、提供一站式全链路服务,PAI平台致力于帮助企业和开发者更高效地实现AI应用。案例展示中,介绍了多模态模型微调在文旅场景的应用,展示了如何快速复现并利用AI解决实际问题。最终目标是让AI技术更普及,赋能各行业,推动社会进步。
  • 01.03 13:35:34
    发表了文章 2025-01-03 13:35:34

    PAI企业级能力升级:应用系统构建、高效资源管理、AI治理

    PAI平台针对企业用户在AI应用中的复杂需求,提供了全面的企业级能力。涵盖权限管理、资源分配、任务调度与资产管理等模块,确保高效利用AI资源。通过API和SDK支持定制化开发,满足不同企业的特殊需求。典型案例中,某顶尖高校基于PAI构建了融合AI与HPC的科研计算平台,实现了作业、运营及运维三大中心的高效管理,成功服务于校内外多个场景。
  • 01.03 13:34:07
    发表了文章 2025-01-03 13:34:07

    PAI年度发布:GenAI时代AI基础设施的演进

    本文介绍了AI平台在大语言模型时代的新能力和发展趋势。面对推理请求异构化、持续训练需求及安全可信挑战,平台推出了一系列优化措施,包括LLM智能路由、多模态内容生成服务、serverless部署模式等,以提高资源利用效率和降低使用门槛。同时,发布了训推一体调度引擎、竞价任务等功能,助力企业更灵活地进行训练与推理任务管理。此外,PAI开发平台提供了丰富的工具链和最佳实践,支持从数据处理到模型部署的全流程开发,确保企业和开发者能高效、安全地构建AI应用,享受AI带来的红利。
  • 01.03 11:40:23
    发表了文章 2025-01-03 11:40:23

    软硬结合助力倚天云原生算力再进化,加速大数据、视频转码上云步伐

    本文介绍了云原生算力的进化,重点讨论了倚天710 CPU在大数据和视频转码场景中的应用与优势。倚天710采用ARM架构,通过物理核设计和CIPU加速卡优化,显著提升了高负载下的性能稳定性,并在实际应用中帮助客户实现了20%-40%的性能提升和成本降低。此外,文章还探讨了操作系统、编译器等底层软件的优化,以及如何通过龙蜥社区和阿里云平台支持更多应用场景,助力企业实现高效迁移和性能优化。
  • 01.03 11:32:31
    发表了文章 2025-01-03 11:32:31

    千行百业,“义”不容辞:通义技术创新与商业实践

    千行百业,“义”不容辞:通义技术创新与商业实践。本次分享分为两部分,首先介绍大模型的快速迭代与普及,探讨通义千问在精度和复杂任务执行上的突破;其次聚焦企业级落地,解决安全性、部署路径及模型调优三大问题。通过多模态理解(视觉、语音)和更强的生成控制力,携手伙伴服务各行业,推动技术向生产力转化,并关注公益应用,助力社会进步。
  • 01.03 11:29:02
    发表了文章 2025-01-03 11:29:02

    通义智文:文档应用赋能千行百业

    通义智文是阿里巴巴推出的大规模文档处理技术体系,旨在提升生产力效率。最初作为阅读工具发布,现已发展为涵盖文档解析、理解、生成等多方面的技术平台。通义智文支持超长文档处理、多模态文本解析,并在法律、教育等领域提供专业服务。其创新算法如VGT版面分析和Layout-LM多模态模型,显著提升了文档处理精度。应用场景包括PPT创作、故事绘本生成及法律文书审查等,赋能千行百业。
  • 01.03 11:25:42
    发表了文章 2025-01-03 11:25:42

    通义万相:视觉生成大模型再进化

    通义万相是阿里云推出的视觉生成大模型,涵盖图像和视频生成。其2.0版本在文生图和文生视频方面进行了重大升级,采用Diffusion Transformer架构,提升了模型的灵活性和可控性。通过高质量美学标准和多语言支持,大幅增强了画面表现力。此外,视频生成方面引入高压缩比VAE、1080P长视频生成及多样化艺术风格支持,实现了更丰富的创意表达。未来,通义万相将继续探索视觉领域的规模化和泛化,打造更加通用的视觉生成大模型。
  • 01.02 15:59:34
    发表了文章 2025-01-02 15:59:34

    面向高效大模型推理的软硬协同加速技术 多元化 AI 硬件引入评测体系

    本文介绍了AI硬件评测体系的三大核心方面:统一评测标准、平台化与工具化、多维度数据消费链路。通过标准化评测流程,涵盖硬件性能、模型推理和训练性能,确保评测结果客观透明。平台化实现资源管理与任务调度,支持大规模周期性评测;工具化则应对紧急场景,快速适配并生成报告。最后,多维度数据消费链路将评测数据结构化保存,服务于综合通用、特定业务及专业性能分析等场景,帮助用户更好地理解和使用AI硬件。
  • 01.02 15:57:13
    发表了文章 2025-01-02 15:57:13

    阿里云百炼|析言GBI全新发布:联合云上数据库,助力企业轻松实现ChatBI

    析言GBI是阿里云推出的一款基于AI的智能数据分析产品,通过自然语言处理实现对话式数据分析。用户无需编写代码,即可轻松进行数据查询、分析和可视化。该产品支持多种数据库连接方式(如MySQL、PostgreSQL等),并提供多版本选择以适应不同业务需求。即将发布的动态规划BI分析功能将进一步提升复杂问题的拆解与综合分析能力。欢迎访问阿里云百炼应用广场体验析言GBI,并享受200次免费问题额度。
  • 01.02 15:39:43
    发表了文章 2025-01-02 15:39:43

    云上DevOps自动化的最佳实践

    本文介绍了云上DevOps自动化最佳实践,重点探讨了企业在上云过程中面临的成本管理、运维效率和弹性等问题。通过阿里云的产品和服务,企业可以实现自动化的资源管理、成本优化和高效运维。文章详细阐述了如何利用标签进行成本分析、选择合适的付费类型和实例规格、以及通过弹性伸缩降低成本。此外,还介绍了新功能发布,如统一的实例运维通道界面、AI辅助的运维工具等,帮助企业提升云上业务的管理和运营效率。
  • 01.02 15:31:29
    发表了文章 2025-01-02 15:31:29

    使用云存储构建云上推理平台

    本文介绍了大模型分布式推理的工作流、IO分析、存储需求及解决方案。通过分布式缓存和P2P能力,优化了大规模并发场景下的模型加载与分发效率,提升了推理性能。NAS文件存储和OSS加速器在高并发读取和小模型缓存中表现出色,支持秒级加载和高效数据处理。阿里云存储为开发者提供了稳定、高效的推理环境,助力AI应用快速落地。
  • 01.02 15:23:51
    发表了文章 2025-01-02 15:23:51

    构建AI数据管道:从数据到洞察的高效之旅最佳实践

    本文探讨了大模型从数据处理、模型训练到推理的全流程解决方案,特别强调数据、算法和算力三大要素。在数据处理方面,介绍了多模态数据的高效清洗与存储优化;模型训练中,重点解决了大规模数据集和CheckPoint的高效管理;推理部分则通过P2P分布式加载等技术提升效率。案例展示了如何在云平台上实现高性能、低成本的数据处理与模型训练,确保业务场景下的最优表现。
  • 01.02 15:11:11
    发表了文章 2025-01-02 15:11:11

    MaxCompute年度发布

    本次分享介绍了阿里云MaxCompute在过去一年中的企业级数仓新功能。MaxCompute自2009年诞生,现已服务阿里巴巴集团、蚂蚁集团及众多第三方客户,日处理千万级任务。新功能包括湖仓一体开放性、Data+AI结合、非结构化数据处理(如Object Table)、实时数据处理(如增量物化视图)、性能优化(如MCU2.0和智能调优)以及企业级安全合规能力(如同城容灾和数据脱敏)。这些改进提升了数据处理的效率、安全性和性价比。
  • 01.02 14:35:43
    发表了文章 2025-01-02 14:35:43

    阿里云Milvus产品发布:AI时代云原生专业向量检索引擎

    随着大模型和生成式AI的兴起,非结构化数据市场迅速增长,预计2027年占比将达到86.8%。Milvus作为开源向量检索引擎,具备极速检索、云原生弹性及社区支持等优势,成为全球最受欢迎的向量数据库之一。阿里云推出的全托管Milvus产品,优化性能3-10倍,提供企业级功能如Serverless服务、分钟级开通、高可用性和成本降低30%,助力企业在电商、广告推荐、自动驾驶等场景下加速AI应用构建,显著提升业务价值和稳定性。
  • 01.02 13:45:03
    发表了文章 2025-01-02 13:45:03

    深度解析CPFS 在 LLM 场景下的高性能存储技术

    本文深入探讨了CPFS在大语言模型(LLM)训练中的端到端性能优化策略,涵盖计算端缓存加速、智能网卡加速、数据并行访问及数据流优化等方面。重点分析了大模型对存储系统的挑战,包括计算规模扩大、算力多样性及数据集增长带来的压力。通过分布式P2P读缓存、IO加速、高性能存算通路技术以及智能数据管理等手段,显著提升了存储系统的吞吐量和响应速度,有效提高了GPU利用率,降低了延迟,从而加速了大模型的训练进程。总结了CPFS在AI训练场景中的创新与优化实践,为未来大模型发展提供了有力支持。
  • 01.02 11:35:17
    发表了文章 2025-01-02 11:35:17

    构建深度可观测、可集成的网络智能运维平台

    本文介绍了构建深度可观测、可集成的网络智能运维平台(简称NIS),旨在解决云上网络运维面临的复杂挑战。内容涵盖云网络运维的三大难题、打造云原生AIOps工具集的解决思路、可观测性对业务稳定的重要性,以及产品发布的亮点,包括流量分析NPM、网络架构巡检和自动化运维OpenAPI,助力客户实现自助运维与优化。
  • 01.02 11:27:59
    发表了文章 2025-01-02 11:27:59

    构建超大带宽、超高性能及稳定可观测的全球互联网络

    本次课程聚焦构建超大带宽、超高性能及稳定可观测的全球互联网络。首先介绍全球互联网络的功能与应用场景,涵盖云企业网、转发路由器等产品。接着探讨AI时代下全球互联网络面临的挑战,如大规模带宽需求、超低时延、极致稳定性和全面可观测性,并分享相应的解决方案,包括升级转发路由器、基于时延的流量调度和增强网络稳定性。最后宣布降价措施,降低数据与算力连接成本,助力企业全球化发展。
  • 01.02 11:23:34
    发表了文章 2025-01-02 11:23:34

    助力企业高效构建安全、可观测的云上数据中心

    本次课程聚焦于助力企业高效构建安全、可观测的云上数据中心,涵盖三大方面:1) 数据中心网络面临的挑战,包括VPC、NAT网关和私网连接等产品的功能与挑战;2) 数据中心网络产品重磅发布,涉及安全设计建议、容灾能力提升及深度可观测能力的增强;3) 用户体验升级,通过VPC IPAM实现高效的网络地址管理和简化的产品体验。整体旨在为企业提供更安全、稳定、高效的云上解决方案。
  • 01.02 11:20:16
    发表了文章 2025-01-02 11:20:16

    身份是安全的基石:深入理解阿里云身份体系

    企业云上身份管理面临诸多挑战,如账号泄露、权限未及时回收等,导致数据泄露和内部系统被篡改。阿里云提供了一套完善的身份管理体系,包括单账号和多账号场景下的解决方案。对于单账号,通过主账号保护、RAM用户和角色实现分权与审计;对于多账号,使用云SSO统一管理和配置跨账号权限,确保安全合规。该体系支持浏览器、API访问,并集成企业IDP,实现无密钥登录和自动化管理,有效降低风险并提高管理效率。
  • 01.02 11:05:14
    发表了文章 2025-01-02 11:05:14

    防止凭证泄露的十种方法:如何管理阿里云访问密钥

    本文介绍了防止凭证泄露的十种方法及阿里云访问密钥管理的最佳实践。首先,分析了凭证泄露的风险及其对企业造成的严重后果,强调凭证管理的重要性。接着,介绍了阿里云的凭证类型,包括主账号、子用户及程序凭证,并详细说明了如何通过使用临时凭证(STS Token)、多因素认证(MFA)、单点登录(SSO)等手段有效防止凭证泄露。此外,还提出了清理闲置用户和AccessKey、设置强密码策略、限制IP访问等具体措施。最后,展望了阿里云2024年即将推出的凭证安全升级策略,如默认启用MFA、清理闲置用户和AK等,帮助企业更好地提升凭证和资产的安全性。
  • 01.02 10:54:08
    发表了文章 2025-01-02 10:54:08

    众览全局,企业级云监控助力构建统一云产品可观测

    企业上云已成为共识,但在合理使用和管理云资源方面仍面临诸多挑战。富莱瑞调研显示79%的企业缺乏经验。阿里云2023年推出云监控2.0,通过统一接入、关联分析、数据探索等六大升级,帮助企业应对数据孤岛、关联分析困难、灵活性不足等问题。云监控2.0还引入了CloudLens和AI大模型技术,提供更深入的云产品可观测能力,提升运维效率。实际案例表明,通过建设统一可观测平台,企业的故障排查时间和运营成本显著降低。
  • 01.02 10:50:54
    发表了文章 2025-01-02 10:50:54

    基于LoongCollector构建全新可观测Pipeline

    LoongCollector是阿里云推出的下一代可观测数据管道,旨在融合多种采集技术,构建统一的可观测数据代理。它具备高性能、可靠性和灵活性,支持日志、指标和追踪等多类型数据采集。通过模块化设计和SPL处理引擎,LoongCollector实现了高效的数据处理与传输,并大幅简化了配置管理。此外,集成eBPF技术,提供无侵入、高性能的应用性能监控,适用于复杂异构环境。未来,LoongCollector将继续优化性能、探索AI赋能的智能化采集。
  • 01.02 10:47:47
    发表了文章 2025-01-02 10:47:47

    容器服务Kubernetes场景下可观测体系生产级最佳实践

    阿里云容器服务团队在2024年继续蝉联Gartner亚洲唯一全球领导者象限,其可观测体系是运维的核心能力之一。该体系涵盖重保运维、大规模集群稳定性、业务异常诊断等场景,特别是在AI和GPU场景下提供了全面的观测解决方案。通过Tracing、Metric和Log等技术,阿里云增强了对容器网络、存储及多集群架构的监控能力,帮助客户实现高效运维和成本优化。未来,结合AI助手,将进一步提升问题定位和解决效率,缩短MTTR,助力构建智能运维体系。
  • 01.02 10:43:34
    发表了文章 2025-01-02 10:43:34

    面向AI的服务器计算互连的创新探索

    面向AI的服务器计算互连创新探索主要涵盖三个方向:Scale UP互连、AI高性能网卡及CIPU技术。Scale UP互连通过ALink系统实现极致性能,支持大规模模型训练,满足智算集群需求。AI高性能网卡针对大规模GPU通信和存储挑战,自研EIC网卡提供400G带宽和RDMA卸载加速,优化网络传输。CIPU作为云基础设施核心,支持虚拟化、存储与网络资源池化,提升资源利用率和稳定性,未来将扩展至2*800G带宽,全面覆盖阿里云业务需求。这些技术共同推动了AI计算的高效互联与性能突破。
  • 01.02 10:18:17
    发表了文章 2025-01-02 10:18:17

    面向AI的服务器计算软硬件架构实践和创新

    阿里云在新一代通用计算服务器设计中,针对处理器核心数迅速增长(2024年超100核)、超多核心带来的业务和硬件挑战、网络IO与CPU性能增速不匹配、服务器物理机型复杂等问题,推出了磐久F系列通用计算服务器。该系列服务器采用单路设计减少爆炸半径,优化散热支持600瓦TDP,并实现CIPU节点比例灵活配比及部件模块化可插拔设计,提升运维效率和客户响应速度。此外,还介绍了面向AI的服务器架构挑战与软硬件结合创新,包括内存墙问题、板级工程能力挑战以及AI Infra 2.0服务器的开放架构特点。最后,探讨了大模型高效推理中的显存优化和量化压缩技术,旨在降低部署成本并提高系统效率。
  • 01.02 09:50:03
    发表了文章 2025-01-02 09:50:03

    云上普惠高性能计算平台,助力HPC行业创新

    EHPC(弹性高性能计算)产品架构分为三个层次:资源层、服务层和使用界面层。资源层按HPC行业需求编排ECS实例、存储和调度管理资源,形成支持VPC和RDMA网络的集群。服务层提供集群资源管理、应用管理和作业调度等功能,并支持基于负载的弹性伸缩。使用界面层包括控制台、HPC PORTAL和Open API,方便不同用户操作。今年新发布的功能包括基于英特尔八代处理器的HPC实例、RDMA网络支持IB Verbs接口、拓扑感知的弹性伸缩能力以及Instant计算环境,优化了性能和成本。EHPC通过这些设计帮助客户快速上云并高效利用资源。
  • 01.02 09:46:48
    发表了文章 2025-01-02 09:46:48

    ECS控制台,AI助手与极简管控体验

    本文介绍了ECS控制台的演进及最新AI工具功能。控制台作为运维平台,需兼顾用户体验、可靠性和安全性。针对不同用户(个人开发者、企业级用户、资源管理员和架构师),控制台提供了定制化AI助手,涵盖售前选型、售中购买、售后运维等全链路支持。AI助手可智能分析用户需求,推荐合适规格,并提供实例诊断、命令解释等功能,简化操作流程。此外,还推出了简洁版控制台,优化了小资源量用户的使用体验,减少复杂度,提升效率。未来,控制台将朝着更智能、个性化的chat ops方向发展。
  • 01.02 09:43:40
    发表了文章 2025-01-02 09:43:40

    无影云电脑,畅享极速渲染新体验

    本文介绍了渲染行业面临的挑战及无影云电脑带来的革新。传统渲染依赖高性能本地设备,面临重投入、性能固定、灵活性差和数据安全问题。无影云电脑通过云端算力,实现了灵活扩展、任意终端接入及按需付费,大幅提升了渲染效率与体验,尤其在游戏设计、工业制造等领域表现突出。其核心技术确保了色彩还原、流畅操作及外设兼容性,满足专业设计师的需求。未来,无影将助力渲染行业实现更高效、安全的云端工作模式。

2024年12月

  • 12.31 17:38:10
    发表了文章 2024-12-31 17:38:10

    云基础设施处理器CIPU 2.0技术解读

    本文深入解读阿里云的CIPU(Cloud Infrastructure Processing Unit)技术,探讨其在云计算中的定位与价值。面对当前XPU命名泛滥的问题,阿里云为何选择CIPU这一名称?CIPU旨在解决云计算中的弹性、安全、稳定、性能和成本五大核心需求。通过对比DPU和IPU,CIPU更专注于云环境下的基础设施处理,确保数据的安全性、传输的可靠性和存储的稳定性。此外,文章还回顾了神龙计算的历史发展,强调CIPU2.0在提升性能、优化资源调度和满足大客户需求方面的进展。最终,CIPU作为手段,其核心目标是为客户提供更高性价比和更稳定的云服务。
  • 12.31 17:35:47
    发表了文章 2024-12-31 17:35:47

    端到端的ECS可观测性方案,助力云上业务安全稳定

    本文介绍了云原生时代保障业务系统可靠性的方法和挑战,重点探讨了阿里云ECS在提升业务稳定性、性能监控及自动化恢复方面的能力。文章分为以下几个部分:首先,阐述了业务可靠性的三个阶段(事前预防、事中处理、事后跟进);其次,分析了云上业务系统面临的困难与挑战,并提出了通过更实时的监测和自动化工具有效规避风险;接着,详细描述了ECS实例稳定性和性能问题的解决方案;然后,介绍了即将发布的ECS Lens产品,它将全面提升云上业务的洞察能力和异常感知能力;最后,通过具体案例展示了如何利用OS自动重启和公网带宽自适应调节等功能确保业务连续性。总结部分强调了ECS致力于增强性能和稳定性的目标。
  • 12.31 17:33:34
    发表了文章 2024-12-31 17:33:34

    弹性计算第九代企业级ECS实例新品发布

    阿里云第九代企业级实例基于全新CIPU 2.0架构,搭载最新英特尔和AMD处理器,大幅提升性能、安全性和稳定性。G9i实例采用英特尔新一代处理器,内存带宽和L3缓存显著提升,标配AMX加速器;G9A实例则搭载AMD先进处理器,提供更高的性价比和端到端加密能力。九代产品在算力、IO能力和安全性上全面升级,尤其适用于搜推、大数据处理等场景,助力客户实现更高业务价值。
  • 12.31 17:31:18
    发表了文章 2024-12-31 17:31:18

    从集群到计算服务,如何基于云重塑“超级计算机”

    本文探讨了云计算概念的演变及其标准化进程。随着技术发展,云计算已从单纯的资源池演变为与AI、大数据等融合的服务模式,内涵和外延不断扩展。文章还介绍了云超算的发展及其国家标准制定的重要性,强调了其在工业制造、生命科学等领域的应用前景,并宣布了首批云超算测评能力的启动。
  • 12.31 17:30:01
    发表了文章 2024-12-31 17:30:01

    容器服务:智算时代云原生操作系统及月之暗面Kimi、深势科技实践分享

    容器技术已经发展成为云计算操作系统的关键组成部分,向下高效调度多样化异构算力,向上提供统一编程接口,支持多样化工作负载。阿里云容器服务在2024年巴黎奥运会中提供了稳定高效的云上支持,实现了子弹时间特效等创新应用。此外,容器技术还带来了弹性、普惠的计算能力升级,如每分钟创建1万Pod和秒级CPU资源热变配,以及针对大数据与AI应用的弹性临时盘和跨可用区云盘等高性能存储解决方案。智能运维方面,推出了即时弹性节点池、智能应用弹性策略和可信赖集群托管运维等功能,进一步简化了集群管理和优化了资源利用率。
  • 12.31 17:24:56
    发表了文章 2024-12-31 17:24:56

    阿里云弹性计算稳定性最佳实践

    本文介绍了ECS实例稳定性最佳实践的重要性及其具体实施方法。首先,阐述了ECS作为底层基础设施,其稳定性对业务连续性至关重要,并通过一系列工程化方法构建稳定的基础架构。其次,详细描述了用户如何通过合适规格选择、操作系统更新、事件响应机制等手段规避风险,提升业务稳定性。此外,还探讨了实例Panic风险消除、故障诊断及自动分析等技术细节,以及通过云助手插件实现自动化监控和故障处理的最佳实践。最后,分享了制造业客户的实际案例,展示了如何有效解决大规模Panic事件,确保业务的持续稳定运行。通过这些措施,用户可以充分利用ECS的稳定性优势,保障业务的高效与可靠。
  • 12.31 17:20:29
    发表了文章 2024-12-31 17:20:29

    推理降本与提升资源效率的实践

    本课程从业务角度探讨大模型推理部署及资源利用率提升。首先分析大模型与GPU发展趋势,包括模型开源、规模增长及多模态能力增强;其次介绍高效部署大模型推理业务的步骤,涵盖业务场景选择、架构优化及显存规划;接着讲解如何通过DeepCPU-LLM框架和DeepNCCL通讯库优化推理效率;最后探讨通过KuberGPU实现细粒度GPU资源管理,提升整体资源利用率,降低推理成本。
  • 12.31 16:50:04
    发表了文章 2024-12-31 16:50:04

    AI + 可观测最佳实践:让业务从“看见”到“洞察”

    本文介绍了AI Ops的概念及其在提升系统运维效率、洞察力和可观测性方面的作用。主要内容分为三个部分:一是监控、观测与洞察的区别及挑战,强调了数据整合和语义对齐的重要性;二是AI与计算如何重塑可观测性,通过UModel数字图谱和多模态存储分析架构实现数据联通;三是最佳实践与未来展望,展示了阿里云AI Stack可观测解决方案的应用案例,并总结了可观测性的四个发展阶段,最终愿景是借助AI力量让每个人成为多领域的专家。
  • 12.31 16:45:59
    发表了文章 2024-12-31 16:45:59

    灵骏智算实例异常预测技术

    本文介绍了灵骏智算实例异常预测技术,旨在提前预测GPU等设备的故障,确保大模型训练的稳定性。文章首先探讨了为何需要进行异常预测,指出大规模GPU集群在大模型训练中面临的稳定性挑战。接着阐述了预测的可行性和原理,通过分析复杂系统中的小异常逐步积累导致故障的现象,利用时序指标和关键指标分布模式进行预测。目前该技术可在1-250分钟内提前预测故障,准确率达95%以上,召回率超过20%。最后介绍了系统的集成与应用,强调了端侧部署预测模型的优势,包括降低网络开销、保护用户数据隐私等。
  • 12.31 16:43:22
    发表了文章 2024-12-31 16:43:22

    FastGPT 基于Higress 聚合 LLM 网关的最佳实践

    本文介绍了Fast GPT的产品形态和设计理念,重点讨论了大模型的幻觉问题及其对应用落地的影响。Fast GPT通过结合工作流的强逻辑性和AI的理解能力,提升系统的稳定性和可靠性。文章还详细描述了Fast GPT的工作流节点、知识库管理及AI网关的功能,并展示了几个实际应用场景,如私人助手、图文生成和文档处理等。最后,探讨了如何通过引入云函数和Copilot简化代码编写,实现无代码编排的工作流解决方案,提升用户体验。
  • 12.31 16:39:46
    发表了文章 2024-12-31 16:39:46

    天财商龙:云上卓越架构治理实践

    天财商龙成立于1998年,专注于为餐饮企业提供信息化解决方案,涵盖点餐、收银、供应链和会员系统等。自2013年起逐步实现业务上云,与阿里云合作至今已十年。通过采用阿里云的WA体系,公司在账号管理、安全保障、监控体系和成本管控等方面进行了全面优化,提升了业务稳定性与安全性,并实现了显著的成本节约。未来,公司将持续探索智能化和全球化发展,进一步提升餐饮行业的数字化水平。
  • 12.31 16:38:00
    发表了文章 2024-12-31 16:38:00

    云上IT“新”治理:体系化助力企业上好云、用好云、管好云

    随着云计算的普及,企业上云已不再是难题,如何用好和管好云成为新的挑战。阿里云通过Landing Zone和Well-Architected Framework(WAF)帮助企业搭建安全合规、可扩展的多账号环境,并提供涵盖安全、稳定性、效率、成本和性能五大支柱的最佳实践。其中,Landing Zone助企业构建隔离环境,内置财务管理、资源规划等模块;WAF则提供详细指导原则,确保企业在云上的应用环境安全、稳定、高效。此外,阿里云还推出了一系列工具和服务,如身份权限管理、配置审计、成本分析等,助力企业提升云治理成熟度。
  • 12.31 16:32:46
    发表了文章 2024-12-31 16:32:46

    化整为零:湖仓数据平台一站式迁移

    本文介绍了湖仓平台迁移的概况、痛点及解决方案。首先概述了数据湖和数据仓库迁移的现状与背景,强调其重要性及挑战。接着分析了迁移过程中的主要痛点,如数据量大、业务变更频繁等。最后提出了一种化整为零的新范式,通过精细化设计和自动化工具提升迁移效率,并展示了一站式湖仓迁移中心的关键阶段和产品大图,旨在加速迁移过程并减少人工成本。
  • 12.31 16:29:30
    发表了文章 2024-12-31 16:29:30

    CMH云迁移中心:企业一站式上云工具实践

    本文介绍了云迁移的趋势与挑战,以及阿里云推出的云迁移中心(CMH)工具。随着企业上云进程的推进,越来越多的企业积极拥抱云原生技术,但复杂业务处理、成本控制、技术架构升级和快速迁移等问题成为主要挑战。CMH通过评估、准备、迁移和割接四个阶段,提供自动化和智能化的解决方案,帮助企业简化上云流程,提升效率。案例显示,CMH成功助力某跨国企业平稳迁移,未来将继续优化用户体验并探索智能化迁移方案。
  • 12.31 16:18:34
    发表了文章 2024-12-31 16:18:34

    Landing Zone一站式上云框架场景和实践

    本文将介绍阿里云Landing Zone的方案、应用场景及新功能。Landing Zone是云上安全可控、可扩展的架构,涵盖资源规划、财务管理、身份权限、合规审计、网络规划、安全防护、运维管理和自动化模块八大方面,帮助企业敏捷创新并满足IT治理需求。具体应用包括零售行业的多品牌管理、生命科学的数据交换、自动驾驶的合规监管和金融行业的严格合规要求。新功能则聚焦于财年上线的统一管控产品,如配额管理、Prometheus监控和网络IPAM方案,以及降低跨账号安全门槛。
  • 12.31 16:15:44
    发表了文章 2024-12-31 16:15:44

    架构师工具箱:Well-Architected云治理提效实践

    本次分享基于阿里云Well-Architected Framework的最佳实践案例,涵盖企业从上云到优化的全过程。安畅作为国内领先的云管理服务提供商(Cloud MSP),拥有800多名员工,其中70%为技术工程师,为企业提供架构安全、数据智能等技术服务。内容包括Landing Zone与Well-Architected的关系、企业云治理现状及需求分析,重点探讨了安全合规、成本优化、资源稳定性和效率提升等方面的最佳实践,并通过具体客户案例展示了如何通过自动化工具和定制化解决方案帮助企业提升云上业务价值。
  • 12.31 16:11:12
    发表了文章 2024-12-31 16:11:12

    刚好够用的授权:如何在云上实施最小权限原则

    本章探讨如何在云上实施最小权限原则,确保企业安全与效率的平衡。通过阿里云RAM管理身份和权限,帮助企业识别和解决过度授权、闲置账户及高危权限问题。主要内容包括:最小权限原则的概述与挑战;云上最小权限的最佳实践路径,如初始规划、业务支撑及权限收敛;使用AccessAnalyzer识别过度授权和外部访问风险。通过这些工具和服务,企业可以有效提升安全性,减少潜在威胁。
  • 12.31 15:54:57
    发表了文章 2024-12-31 15:54:57

    打造安全云环境:深入理解阿里云权限体系

    本文将探讨阿里云上的权限管理,帮助理解其背后原理并掌握实践方法。主要内容分为三部分:一是访问控制基本原理,强调避免使用root身份,介绍权限策略语言和类型;二是五种典型的授权方式,包括服务级、操作级和资源级授权等;三是多账号环境下的集中化权限管理,重点介绍如何使用管控策略实现安全合规的集中管控。通过这些内容,用户可以更好地理解和应用阿里云的权限管理体系,确保云资源的安全与高效管理。
  • 12.31 15:10:38
    发表了文章 2024-12-31 15:10:38

    企业云资源端到端安全合规:最佳实践与工具应用

    本次课程围绕企业合规的重要性、云上合规框架、阿里云提供的工具及新能力展开。首先,讲解了企业面临的合规挑战,如配置错误导致的数据泄露风险。其次,介绍了合规框架的来源和主动合规的重要性。接着,详细说明了如何通过资源中心、操作审计、管控策略和配置审计等工具实现云资源端到端的合规管理。最后,发布了阿里云在合规方面的最新能力,帮助企业更好地应对合规需求。
  • 12.31 15:03:22
    发表了文章 2024-12-31 15:03:22

    卓越架构之FinOps最佳实践

    本文探讨了云成本管理的趋势和FinOps的最佳实践。随着云计算的普及,传统的IT管理模式已无法适应按需使用和按量付费的新模式,导致企业面临资源浪费和成本失控的风险。FinOps作为一种管理理念,强调运维、财务和技术团队的合作,通过数据驱动和业务价值驱动的方式优化云成本。文章介绍了FinOps的核心挑战、最佳实践及技术工具的应用,帮助企业有效管理和优化云成本,实现降本增效。
  • 12.31 14:55:04
    发表了文章 2024-12-31 14:55:04

    云财务管理产品更新:助力客户简化FinOps落地

    本次分享由阿里云财务管理产品公司负责人贾栋梁主讲,探讨企业上云后内部管理系统的变化及云上财务管理产品的边界。内容涵盖云财务管理产品如何支持FinOps实现业财一体化,以及账单、成本管理和组织管理等核心功能的优化。通过提升账单透明度、简化成本分析和增强企业级能力,帮助企业更好地进行云上财务管理。
  • 12.31 14:51:16
    发表了文章 2024-12-31 14:51:16

    实时计算UniFlow:Flink+Paimon构建流批一体实时湖仓

    实时计算架构中,传统湖仓架构在数据流量管控和应用场景支持上表现良好,但在实际运营中常忽略细节,导致新问题。为解决这些问题,提出了流批一体的实时计算湖仓架构——UniFlow。该架构通过统一的流批计算引擎、存储格式(如Paimon)和Flink CDC工具,简化开发流程,降低成本,并确保数据一致性和实时性。UniFlow还引入了Flink Materialized Table,实现了声明式ETL,优化了调度和执行模式,使用户能灵活调整新鲜度与成本。最终,UniFlow不仅提高了开发和运维效率,还提供了更实时的数据支持,满足业务决策需求。
  • 发表了文章 2025-03-04

    课时20:集合的运算

  • 发表了文章 2025-03-04

    课时19:集合的介绍

  • 发表了文章 2025-03-04

    课时17:字典的使用_2

  • 发表了文章 2025-03-04

    字典的遍历

  • 发表了文章 2025-03-04

    课时16:字典的使用_1

  • 发表了文章 2025-03-04

    课时15:字典的介绍

  • 发表了文章 2025-03-04

    课时13:可变对象

  • 发表了文章 2025-03-04

    课时14:==和is

  • 发表了文章 2025-03-04

    课时12:元组

  • 发表了文章 2025-03-04

    课时10:EMS项目练习_删除员工

  • 发表了文章 2025-03-04

    课时11:range

  • 发表了文章 2025-03-04

    课时9:EMS项目练习_添加员工

  • 发表了文章 2025-03-04

    课时8:EMS项目练习_添加员工

  • 发表了文章 2025-03-04

    课时7:遍历列表

  • 发表了文章 2025-03-04

    课时6:列表的方法

  • 发表了文章 2025-03-04

    课时3:通用操作

  • 发表了文章 2025-03-04

    课时4:序列

  • 发表了文章 2025-03-04

    课时5:修改列表

  • 发表了文章 2025-03-04

    课时2:切片

  • 发表了文章 2025-03-04

    课时1:列表的简介

正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息
正在加载, 请稍后...
滑动查看更多