异构计算

首页 标签 异构计算
# 异构计算 #
关注
19114内容
波动跃迁:基于 Knative 加速 AI Agent 应用落地
Knative 提供了基于请求自动弹性、缩容到 0 以及多版本管理的 Serverless 能力,看如何助力 AI Agent 初创企业快速产品落地。
|
19天前
|
《从原理到实践:ASTC与ETC2的WebGL压缩技术深度解析》
本文深入解析前端领域WebGL技术中ASTC与ETC2两种主流纹理压缩格式。从技术特性看,ETC2以固定块压缩适配广泛设备,优化透明通道处理;ASTC凭借自适应块大小设计,灵活平衡压缩率与画质,尤其擅长处理复杂纹理。文章对比两者在兼容性、应用场景等方面的差异,探讨开发者的选择逻辑,还展望了纹理压缩技术与硬件、AI结合的未来趋势,揭示它们对WebGL视觉体验的重要支撑作用。
|
19天前
|
《WebGL纹理加载指南:10个颠覆认知的优化技巧》
本文围绕前端WebGL的纹理加载与管理,分享10个实用技巧。涵盖纹理预加载的分层策略、尺寸选择的隐藏规则、压缩格式的动态适配,以及纹理复用、加载时机控制、内存释放等方面。强调结合场景需求与设备特性,通过精细化调度、智能适配和动态管理,平衡纹理视觉效果与性能,突破加载瓶颈,为WebGL 3D应用打造流畅体验,展现了从技术实现到场景适配的深层优化逻辑。
|
20天前
| |
JAX快速上手:从NumPy到GPU加速的Python高性能计算库入门教程
JAX是Google开发的高性能数值计算库,旨在解决NumPy在现代计算需求下的局限性。它不仅兼容NumPy的API,还引入了自动微分、GPU/TPU加速和即时编译(JIT)等关键功能,显著提升了计算效率。JAX适用于机器学习、科学模拟等需要大规模计算和梯度优化的场景,为Python在高性能计算领域开辟了新路径。
|
22天前
|
现在浏览器的渲染原理及流程
这篇文章介绍了浏览器渲染原理及流程,包括HTML解析、样式计算、布局、分层、绘制、分块、光栅化和画等阶段,以及各个阶段的输入输出和任务执行过程。文章还解释了浏览器如何处理外部CSS和JS文件的下载和解析,以及这些文件如何影响渲染流程。
大模型性能测试实战指南:从原理到落地的全链路解析
本文系统解析大模型性能测试的核心方法,涵盖流式响应原理、五大关键指标(首Token延迟、吐字率等)及测试策略,提供基于Locust的压测实战方案,并深入性能瓶颈分析与优化技巧。针对多模态新挑战,探讨混合输入测试与资源优化
OpenAI 重返开源!gpt-oss系列社区推理、微调实战教程到!
时隔N年,OpenAI开放模型权重啦!欢迎使用gpt-oss 系列,专为强大的推理、代理任务和多用途开发场景设计。
【限时福利】计算巢平台热门AI服务免费试用,零门槛体验AI创新力量!
计算巢平台推出热门AI服务免费试用活动,集成大模型、图像生成、自然语言处理等多种AI技术,提供免费GPU算力与存储资源,助力开发者零门槛体验前沿技术,加速创新落地。
|
25天前
| |
来自: 云原生
不增加 GPU,首 Token 延迟下降50%|LLM 服务负载均衡的新实践
针对LLM服务的特点,Higress AI网关以插件形式提供了面向LLM服务的负载均衡算法,包括全局最小请求数负载均衡、前缀匹配负载均衡以及GPU感知负载均衡,能够在不增加硬件成本的前提下,提升系统的吞吐能力、降低响应延迟,并实现更公平、高效的任务调度。
免费试用