《2023云原生实战案例集》——04 互联网——任意门 基于云原生AI套件打造人工智能的社交网络平台

本文涉及的产品
服务治理 MSE Sentinel/OpenSergo,Agent数量 不受限
可观测可视化 Grafana 版,10个用户账号 1个月
简介: 《2023云原生实战案例集》——04 互联网——任意门 基于云原生AI套件打造人工智能的社交网络平台

image.png 

客户简介

Soul是任意门旗下基于兴趣图谱和游戏化玩法的社交APP,属于新一代年轻人的虚拟社 交网络。基于用户的社交画像和兴趣图谱,通过机器学习来推荐用户可能会产生的高质 量的新关系,有丰富的AI业务场景,包括语音匹配、聊天机器人、文本OCR识别、图 像识别、多模态等。

客户痛点

AI机器学习是公司核心业务,但在传统的虚拟机构建部署方式下,缺乏一个统一的管控 平台,导致业务工作流不流畅,开发迭代效率低下,运维管理复杂且资源利用率低下, 具体表现为:

•  业务迭代慢:研发工程师需要花费大量时间在底层基础设施资源准备、业务集成部署、 日志监控等AI工程化上,无法专注于业务开发,难以快速响应业务研发需求。

•  运维工作重复:日常重复处理安装Nvidia GPU驱动、CUDA版本、OSS数据源等环境 问题,人力投入大,运维效率低。

•  资源性价比低:CPU机器处理慢,大量堆积机器,导致资源闲置浪费。GPU机器效率 高,但现有技术无法提升利用率,资源空置。

方案売点

任意门在阿里云上,通过容器服务ACK云原生AI套件,构建了符合开源标准、自主掌控 的Al PaaS平台,实现了以下特点:

•  全生命周期管理的一站式平台提升迭代效率,包括数据管理、AI任务发布和模型评测 等,开发迭代效率提升2~5倍。

•  统一的异构资源管理和运维平台降低运维成本,自动化管理GPU节点、算法代码与标 准镜像解耦以及自动弹性推理,节省1倍运维成本。

•  效率及资源利用率提升,提供专业的GPU共享及Fluid数据加速能力,在提升业务效 能同时成本节约50% 。

image.png

建设成果

任意门Sou[通过先进的算法驱动和数据分析技术,打造出"平行宇宙”中独立的、沉浸 式社区。作为下一代基于人工智能的移动社交网络平台,任意门Sou[是中国社交4.0时 代的领军者。其Al PaaS平台管理了从初期的数十张GPU卡到近千张的超大规模,日承 载AI业务发布数百次,很好地支撑了业务的高速发展。是下一代基于人工智能的移动社 交网络平台,也是中国社交4.0时代的领军者。其Al PaaS平台管理了从初期的数十张 GPU卡到近千张的超大规模,日承载AI业务发布数百次,很好地支撑起业务高速发展。

相关产品

容器服务ACK

相关实践学习
基于阿里云DeepGPU实例,用AI画唯美国风少女
本实验基于阿里云DeepGPU实例,使用aiacctorch加速stable-diffusion-webui,用AI画唯美国风少女,可提升性能至高至原性能的2.6倍。
相关文章
|
21小时前
|
机器学习/深度学习 人工智能 自然语言处理
探索Spring AI:将人工智能与软件开发无缝融合
这是一个简单的Spring AI入门示例,演示了如何使用Spring Boot和Spring AI来构建一个简单的机器学习应用程序。通过这个示例,你可以了解到如何利用Spring AI轻松地集成机器学习功能到你的应用程序中。
8 0
|
1天前
|
机器学习/深度学习 人工智能 分布式计算
人工智能平台PAI 操作报错合集之在PAI-DSW(平台上的AI数据科学工作站)上尝试修改实例名时,收到"实例不存在"的错误信息如何解决
阿里云人工智能平台PAI (Platform for Artificial Intelligence) 是阿里云推出的一套全面、易用的机器学习和深度学习平台,旨在帮助企业、开发者和数据科学家快速构建、训练、部署和管理人工智能模型。在使用阿里云人工智能平台PAI进行操作时,可能会遇到各种类型的错误。以下列举了一些常见的报错情况及其可能的原因和解决方法。
|
5天前
|
人工智能 搜索推荐 大数据
【视频】如何用人工智能AI、大数据打动消费者洞察PPT|报告分享
【视频】如何用人工智能AI、大数据打动消费者洞察PPT|报告分享
|
5天前
|
存储 人工智能 测试技术
【AI智能体】SuperAGI-开源AI Agent 管理平台
【4月更文挑战第9天】智能体管理平台SuperAGI简介及实践
|
5天前
|
机器学习/深度学习 数据采集 人工智能
构建未来:AI驱动的自适应网络安全防御机制
【4月更文挑战第25天】随着网络攻击的不断进化,传统的安全防御策略已显得力不从心。本文提出了一种基于人工智能技术的自适应网络安全防御框架,旨在通过实时分析与学习,动态调整安全措施以对抗日益复杂的网络威胁。该框架结合了深度学习、行为分析和预测模型,不仅能够识别已知的攻击模式,还能预测并防御未知的威胁。文章详细探讨了该框架的设计原理、关键技术和实现方法,并通过实验验证了其有效性和优越性。
|
6天前
|
人工智能 决策智能 C++
【AI Agent教程】【MetaGPT】案例拆解:使用MetaGPT实现“狼人杀“游戏(1)- 整体框架解析
【AI Agent教程】【MetaGPT】案例拆解:使用MetaGPT实现“狼人杀“游戏(1)- 整体框架解析
94 1
|
6天前
|
人工智能 API
【AI大模型应用开发】【LangChain系列】实战案例6:利用大模型进行文本总结的方法探索,文本Token超限怎么办?
【AI大模型应用开发】【LangChain系列】实战案例6:利用大模型进行文本总结的方法探索,文本Token超限怎么办?
13 0
|
6天前
|
人工智能
【AI大模型应用开发】【LangChain系列】实战案例5:用LangChain实现灵活的Agents+RAG,该查时查,不该查时就别查
【AI大模型应用开发】【LangChain系列】实战案例5:用LangChain实现灵活的Agents+RAG,该查时查,不该查时就别查
21 0
|
6天前
|
数据采集 存储 人工智能
【AI大模型应用开发】【LangChain系列】实战案例4:再战RAG问答,提取在线网页数据,并返回生成答案的来源
【AI大模型应用开发】【LangChain系列】实战案例4:再战RAG问答,提取在线网页数据,并返回生成答案的来源
33 0
|
6天前
|
存储 人工智能 API
【AI大模型应用开发】【LangChain系列】实战案例3:深入LangChain源码,你不知道的WebResearchRetriever与RAG联合之力
【AI大模型应用开发】【LangChain系列】实战案例3:深入LangChain源码,你不知道的WebResearchRetriever与RAG联合之力
10 0