客户简介
Soul 是任意门旗下基于兴趣图谱和游戏化玩法的社交 APP, 属于新一代年轻人的虚拟社交网络。基于用户的社交画像和兴趣图谱, 通过机器学习来推荐用户可能会产生的高质量的新关系, 有丰富的AI 业务场景,包括语音匹配、聊天机器人、文本 OCR 识别、图像识别、多模态等。
客户痛点
AI 机器学习是公司核心业务, 但在传统的虚拟机构建部署方式下, 缺乏一个统一的管控平台, 导致业务工作流不流畅,开发迭代效率低下,运维管理复杂且资源利用率低下,具体表现为 :
业务迭代速度慢 : 研发工程师需要花费大量时间在底层基础设施资源准备、业务集成部署、日志监控等 AI 工程化上,无法专注于业务开发,难以快速响应业务研发需求。
运维工作重复 : 日常需要处理安装 Nvidia GPU 驱动、CUDA 版本、OSS 数据源等环境问题,人力投入大,运维效率低。
资源性价比低:CPU 机器处理速度慢,大量堆积机器,导致资源闲置浪费。GPU 机器虽效率高,但现有技术无法提升利用率,资源空置。
方案亮点
任意门在阿里云上,通过容器服务 ACK 云原生 AI 套件,构建了符合开源标准、自主掌控的 AI PaaS 平台,实现了以下特点 :
全生命周期管理的一站式平台提升迭代效率 : 提升迭代效率, 包括数据管理、 AI 任务发布和模型评测等,开发迭代效率提升 2~5 倍。
统一的异构资源管理和运维平台降低运维成本 : 降低运维成本,自动化管理 GPU 节点、算法代码与标准镜像解耦以及自动弹性推理,节省 1 倍运维成本。
效率及资源利用率提升 : 提供专业的 GPU 共享及 Fluid 数据加速能力,同时提升业务效能,成本节约 50%。
建设成果
任意门 Soul 通过先进的算法驱动和数据分析技术, 打造了“平行宇宙”中独立的、 沉浸式社区。作为下一代基于人工智能的移动社交网络平台, 任意门 Soul 是中国社交 4.0 时代的领军者。其 AI PaaS 平台管理了从初期的数十张 GPU 卡到近千张的超大规模, 日承载 AI 业务发布数百次, 很好地支撑了业务的高速发展。
相关产品
容器服务 ACK