异构计算

首页 标签 异构计算
# 异构计算 #
关注
20127内容
|
1月前
|
Serverless AI部署实践:低成本构建AI应用的工程化路径
阿里云Serverless GPU方案破解AI落地难题:冷热资源分离、ComfyUI节点化封装、按量计费(单图低至0.002元),助力中小团队低成本试错。已支撑毛绒生图、语音克隆等场景,GPU利用率提升显著。(239字)
|
1月前
|
【大模型】《大模型部署与优化——三大核心模块》(模型量化(PTQ/QAT/AWQ)、推理优化(vLLM、TensorRT)、PagedAttention、服务化部署)
本知识库系统梳理大模型部署与优化全链路:直击显存墙、访存瓶颈等底层挑战;详解PTQ/QAT/AWQ量化技术;深度解析PagedAttention与vLLM/TensorRT-LLM推理引擎;覆盖服务化部署、云原生架构及选型实践,助力高效、稳定、低成本落地。
|
1月前
|
GAViD: A Large-Scale Multimodal Dataset for Context-Aware Group Affect Recognition from Videos
本研究构建了当前规模最大、标注最完备的**多模态上下文感知群体情感视频数据集GAViD**,并提出CAGNet模型实现视觉、音频、上下文信息的有效融合,在效价分类与离散情感识别任务上取得领先性能,填补了领域内数据与模型的双重缺口,为自然场景下群体情感计算研究提供了关键支撑。
|
1月前
| |
来自: 视觉智能
量子坍缩视觉引擎:85%噪声下SSIM=0.39,中值直接跪!工业视觉的救命稻草
CEH-QCV量子坍缩算法,专为极端噪声(如85%彩色噪声、辐射/深海/电磁干扰场景)设计,不依赖训练与GPU,纯C++实现,320×240实时处理仅22ms。锁定率100%,SSIM达0.394,是传统方法失效时唯一稳定输出结构的方案。
|
1月前
|
基于FPGA的频率计与串口通信系统设计与实现
基于FPGA(Field-Programmable Gate Array) 实现数字频率计与UART串口通信功能,核心通过测频法测量外部输入信号的频率,并将结果以ASCII字符串形式通过串口发送至PC端(如串口助手)。系统采用模块化设计,包含时钟分频、信号整形、计数控制、UART发送四大核心模块,支持1Hz~10MHz频率测量(可扩展),精度达±1Hz(1秒闸门时间)
|
1月前
| |
来自: 视觉智能
CEH特征引擎:重新定义实时视觉的“速度-精度”边界
CEH是首个在普通CPU上实现“高密度特征+高帧间匹配+亚像素精度”的全能特征引擎,速度超BRISK、效率领先SIFT一个数量级,零GPU依赖、零专利风险,纯C++开源,完美适配嵌入式与边缘设备。
|
1月前
| |
大模型应用:轻量化视觉语言模型(VLM):基于Qwen2-VL多模态模型实践.87
超紧凑视觉语言模型(如Qwen2-VL-2B)以仅20亿参数、约4GB体积,实现本地化图文理解与生成,支持CPU/入门GPU实时推理,兼顾精度与轻量部署,推动多模态AI走向终端、离线与普惠应用。
阿里云AI产品特惠:Qwen3.6全模型通享4.5折,至高享7000万免费tokens,加速Al应用落地
阿里云推出AI产品特惠活动,以Qwen3.6-Plus升级为核心,带来智能体编程、Vibe Coding及多模态识别等能力的跃升。活动涵盖全模型通享低至4.5折的优惠,支持百万词元上下文窗口及主流Agent框架优化。用户可体验电商营销、广告创作、短剧漫剧、AI Coding、智能客服、AI办公六大场景应用,并享受弹性GPU算力部署服务。此外,阿里云提供超30款AI产品及7000万大模型tokens免费试用,助力企业快速构建高性价比的AI解决方案。
阿里云Qwen3.6全新开源,三步完成专有版部署!
Qwen3.6是阿里云全新MoE架构大模型系列,稀疏激活显著降低推理成本,兼顾顶尖性能与高性价比;支持多规格、FP8量化、原生Agent及100+语言,开箱即用。
免费试用