阿里AI芯片含光800已大规模应用,服务城市大脑、拍立淘

简介: 2019杭州云栖大会首日,阿里巴巴平头哥发布首颗芯片含光800,该芯片性能和能效比均为全球第一,目前已大规模应用阿里巴巴集团内部城市大脑、拍立淘等业务,与此同时,基于含光800的AI云服务也正式上线,相比传统GPU算力,性价比提升100%。

在2019杭州云栖大会首日,阿里巴巴平头哥发布首颗芯片含光800,该芯片性能和能效比均为全球第一,目前已大规模应用阿里巴巴集团内部城市大脑、拍立淘等业务,与此同时,基于含光800的AI云服务也正式上线,相比传统GPU算力,性价比提升100%。

image.png

城市大脑是阿里云首创的产业AI应用,杭州、海口、北京、上海、拉萨、澳门、吉隆坡等境内外23个城市已先后引入城市大脑。目前,含光800已应用于杭州城市大脑,并且大幅提升计算效率,1颗含光800的算力相当于10颗GPU,例如实时处理杭州主城区交通视频,需要40颗传统GPU,延时为300ms,使用含光800仅需4颗,延时降至150ms。

image.png

拍立淘商品库每天新增10亿商品图片,涉及类目复杂,涵盖数码产品、服装、食品等,识别这些图片需要图像识别、搜索、分析等技术,而基于含光800的高性能可以加速整个过程,整体效率可提升12倍,识别10亿张图片的时间从传统通用GPU的1小时缩减至5分钟。

image.png

据介绍,含光800采用了平头哥自研架构和达摩院算法,在业界标准的ResNet-50测试中,其推理性能达到78563 IPS,比目前业界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍。 阿里巴巴达摩院院长张建锋说:“在全球芯片领域,阿里巴巴是一个新人,玄铁和含光800是平头哥的万里长征第一步,我们还有很长的路要走。”

相关实践学习
在云上部署ChatGLM2-6B大模型(GPU版)
ChatGLM2-6B是由智谱AI及清华KEG实验室于2023年6月发布的中英双语对话开源大模型。通过本实验,可以学习如何配置AIGC开发环境,如何部署ChatGLM2-6B大模型。
相关文章
|
人工智能 缓存 NoSQL
【深度】企业 AI 落地实践(四):如何构建端到端的 AI 应用观测体系
本文探讨了AI应用在实际落地过程中面临的三大核心问题:如何高效使用AI模型、控制成本以及保障输出质量。文章详细分析了AI应用的典型架构,并提出通过全栈可观测体系实现从用户端到模型推理层的端到端监控与诊断。结合阿里云的实践经验,介绍了基于OpenTelemetry的Trace全链路追踪、关键性能指标(如TTFT、TPOT)采集、模型质量评估与MCP工具调用观测等技术手段,帮助企业在生产环境中实现AI应用的稳定、高效运行。同时,针对Dify等低代码平台的应用部署与优化提供了具体建议,助力企业构建可扩展、可观测的AI应用体系。
|
17天前
|
人工智能 开发者
OpenVINO™ DevCon中国系列工作坊:AI模型优化与端侧应用落地
解锁AI高效部署新路径,共赴智能创新璀璨未来
56 1
|
23天前
|
存储 人工智能 机器人
别再只做聊天机器人:AI 应用商业闭环的工程落地指南,免费体验中
本文介绍了如何通过阿里云百炼平台创建一个星座运势分析AI智能体,并集成支付宝MCP服务实现支付闭环。解决AI产品无法直接变现的问题,完成“服务-支付-交易”全流程闭环,帮助开发者快速实现商业化。
|
30天前
|
人工智能 分布式计算 大数据
ODPS重磅升级!全面支撑AI应用爆发
阿里云全面升级自研大数据平台ODPS架构,旗下MaxCompute、Hologres和DataWorks等核心产品全面融合AI技术,提升数据处理能力与多模态计算支持,推动企业智能化转型。
94 0
ODPS重磅升级!全面支撑AI应用爆发
|
1月前
|
存储 人工智能 Serverless
AI Agent 运行时相比传统应用有什么不同:百家企业 AI 实践观察(二)
本文深入探讨了AI Agent运行时的核心挑战及解决方案,分析了AI Agent从理论走向实践过程中所面临的动态推理、资源成本与安全风险等问题,并详细介绍了阿里云函数计算FC如何作为AI Agent运行时及沙箱环境(Sandbox),有效应对脉冲式计算需求、突发性负载、数据隔离与会话亲和性等挑战。同时,文章结合典型场景,展示了函数计算FC在编码式与流程式AI Agent构建中的优势,涵盖Chat AI Agent、营销素材组装、仿真训练等应用,为AI Agent的高效、安全运行提供了完整的技术路径。
179 2
|
22天前
|
存储 人工智能 运维
|
22天前
|
存储 人工智能 分布式计算
从数据工程师到AI工程师,我的阿里云ODPS应用实践
阿里云DataWorks提供完善的智能计算与多模态数据处理能力,通过Object Table与MaxFrame实现非结构化数据高效治理,结合OSS与AI模型,助力电商、媒体等行业实现数据驱动的智能化升级。
|
24天前
|
人工智能 前端开发 数据库
波动跃迁:基于 Knative 加速 AI Agent 应用落地
Knative 提供了基于请求自动弹性、缩容到 0 以及多版本管理的 Serverless 能力,看如何助力 AI Agent 初创企业快速产品落地。
|
30天前
|
人工智能 自然语言处理 分布式计算
AI 驱动传统 Java 应用集成的关键技术与实战应用指南
本文探讨了如何将AI技术与传统Java应用集成,助力企业实现数字化转型。内容涵盖DJL、Deeplearning4j等主流AI框架选择,技术融合方案,模型部署策略,以及智能客服、财务审核、设备诊断等实战应用案例,全面解析Java系统如何通过AI实现智能化升级与效率提升。
141 0

热门文章

最新文章