异构计算的搜索结果_第5页-阿里云开发者社区

八进智

|

13天前

|

博文

|

来自：通义大模型

TensorRT-LLM 推理服务实战指南

`trtllm-serve` 是 TensorRT-LLM 官方推理服务工具，支持一键部署兼容 OpenAI API 的生产级服务，提供模型查询、文本与对话补全等接口，并兼容多模态及分布式部署，助力高效推理。

# 大模型服务平台百炼 # 缓存 # PyTorch # API # 算法框架/工具 # 异构计算

八进智

|

13天前

|

博文

|

来自：通义大模型

TensorRT LLM 中的并行策略

TensorRT LLM提供多种GPU并行策略，支持大模型在显存与性能受限时的高效部署。涵盖张量、流水线、数据、专家及上下文并行，并推出宽专家并行（Wide-EP）应对大规模MoE模型的负载不均与通信挑战，结合智能负载均衡与优化通信核心，提升推理效率与可扩展性。

# 大模型服务平台百炼 # 存储 # 缓存 # 负载均衡 # 测试技术 # 异构计算

八进智

|

13天前

|

博文

|

来自：通义大模型

Qwen3 Next 在 TensorRT LLM 上的部署指南

本指南介绍如何在TensorRT LLM框架上部署Qwen3-Next-80B-A3B-Thinking模型，基于默认配置实现快速部署。涵盖环境准备、Docker容器启动、服务器配置与性能测试，支持BF16精度及MoE模型优化，适用于NVIDIA Hopper/Blackwell架构GPU。

# 大模型服务平台百炼 # 并行计算 # 测试技术 # 异构计算 # Docker # 容器

技术员阿伟

|

13天前

|

博文

《Unity渲染工具协同进阶：跳出单一工具的局限》

本文聚焦Unity渲染开发的工具链协同核心，打破“单工具依赖”误区，阐述内置工具、第三方插件与调试套件的全流程协同逻辑。从Lightmapping分区烘焙与光照探针的适配，到Shader Graph与URP管线的参数联动，再到Enlighten、Amplify Shader Editor等插件与原生工具的互补，结合Profiler、Frame Debugger、RenderDoc的闭环调试，构建“效果-效率-性能”三重优化体系。同时分享工具链自动化实践，通过Editor Script实现烘焙、纹理处理、多设备测试的流程简化，避免重复劳动。

# 编解码 # 监控 # 图形学 # 开发者 # 异构计算

技术员阿伟

|

13天前

|

博文

《风格锚点+动态适配：Unity跨设备渲染的核心逻辑》

本文聚焦Unity跨设备渲染适配的核心痛点，提出“同源异构”的进阶方案，打破“一刀切”或“极端妥协”的传统误区。文章核心在于建立“风格锚点”与“精准分级”双体系：先提炼游戏核心视觉元素并量化为参数标准，确保不同设备的风格一致性；再结合硬件特性与游戏需求，将设备划分为高性能、均衡、基础三级，制定差异化渲染策略。通过“一套资源、多套配置”的动态适配技术，配合跨设备校验闭环，实现高端机极致细节、中端机流畅稳定、低端机风格保真的目标。

# 编解码 # API # 图形学 # 开发者 # 异构计算

阿里云云原生

|

13天前

|

博文

|

来自：云原生

为什么别人用 DevPod 秒启 DeepSeek-OCR，你还在装环境？

DevPod 60秒极速启动，一键运行DeepSeek OCR大模型。告别环境配置难题，云端开箱即用，支持GPU加速、VSCode/Jupyter交互开发，重塑AI原生高效工作流。

# 函数计算 # 人工智能 # 文字识别 # 并行计算 # 开发者 # 异构计算

modelscope

|

13天前

|

博文

|

来自： ModelScope模型即服务

Thinking Machines Lab最新研究结果如何复现？On-Policy Distillation让训练成本直降10倍

Thinking Machines Lab提出On-Policy Distillation技术，让小模型高效继承大模型能力。相比传统强化学习，训练成本降低90%，效率提升十倍，支持本地部署、降低成本与延迟。结合vLLM加速与独立DeepSpeed配置，MS-SWIFT框架实现开箱即用的高效蒸馏训练，助力轻量模型具备“会思考、能纠错、可进化”的智能。

# 机器学习/深度学习 # 人工智能 # 搜索推荐 # Swift # 异构计算

游客xbol7peeob6b2

|

13天前

|

博文

解锁强大算力：GPU云服务器入门与实践指南

在数据驱动的时代，我们常常会遇到对计算能力要求极高的任务，例如复杂的科学计算、精美的图形渲染或前沿的人工智能模型训练。这时，传统的计算资源往往会显得力不从心。而GPU计算的引入，正是为了打破这一瓶颈。

# GPU云服务器 # 机器学习/深度学习 # 人工智能 # 监控 # 安全 # 异构计算

maoyutinga1

|

14天前

|

博文

|

来自：通义大模型

国产AI封神！炒股狂赚40%碾压对手教你微调Qwen3打造专属金融分析师

国产AI在实盘炒股中大放异彩，DeepSeek与Qwen3收益率最高超60%，碾压国际大模型。本文教你用LLaMA Factory平台微调Qwen3-VL-30B，打造专属多模态金融分析师，实现趋势研判、财报分析等专业能力，赋能投资决策。

# 大模型服务平台百炼 # 数据采集 # 人工智能 # 物联网 # 数据安全/隐私保护 # 异构计算

技术员阿伟

|

14天前

|

博文

《URP管线主导的角色材质、阴影与显存动态适配优化方案》

本文聚焦手游URP管线角色渲染优化，针对多光源叠加材质失效、大规模同屏角色卡顿、显存过载闪退等核心问题，从Shader变体管理、动态光照阴影适配、粒子分层渲染、显存动态调度四大维度展开实战优化。通过构建“场景-功能”双维度变体筛选、“主次结合”混合光照架构、“核心-装饰-氛围”粒子体系及“纹理-材质-模型”显存优化体系，实现全链路协同适配。优化后，中端机型帧率稳定60帧，材质失效与闪退率大幅下降，角色渲染质感显著提升。

# 编解码 # 算法 # 调度 # Android开发 # 异构计算

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

异构计算