异构计算

首页 标签 异构计算
# 异构计算 #
关注
20155内容
人工智能|YOLOv8实战
本内容为安全帽检测实战项目,基于YOLOv8模型,涵盖Kaggle数据获取、自定义yaml配置、模型训练(yolo_train.py)与测试(yolo_test.py),并提供服务器(FastAPI+Docker)、边缘(Jetson+TensorRT)及国产嵌入式(RK3588+RKNN)三类部署方案,支持工业场景实时智能识别。(239字)
|
4天前
|
阿里云服务器租用费用价格解析:轻量、ECS和GPU实例规格族一年、1个月和1小时收费标准
阿里云2026年最新服务器租用价格解析:轻量应用服务器低至9.9元/月、38元/年(2核2G+200M峰值带宽);ECS经济型e实例99元/年(2核2G+3M固定带宽);通用算力u1实例199元/年(2核4G+5M+80G ESSD);香港轻量25元/月起。支持1小时按量付费,覆盖ECS全系列及GPU服务器。阿里云官方活动:https://t.aliyun.com/U/FzmsXA
|
7天前
| |
来自: 云原生
传统远程桌面协议的技术特征与性能瓶颈
传统远程桌面协议源于2D时代,侧重带宽节省,难以应对高负载图形场景。主要瓶颈包括:交互延迟高(80-150ms以上)、画质编码效率低(易模糊、块效应)、算力调度僵化(GPU资源分配粗放),无法满足云游戏、VR等实时交互需求。
|
7天前
| |
在 AMD ROCm DSW 上部署 Qwen3.6-27B-FP8:vLLM、MTP 解码加速与小并发压测
本文记录一次在 ModelScope DSW AMD GPU 实例上完成的 Qwen3.6-27B-FP8 推理实践。实验重点不是单纯证明模型可以启动,而是围绕 vLLM ROCm 服务、Qwen MTP 投机解码、near-8K 长上下文正确性验证、FP8 KV cache 和小并发 serving 压测,整理一套可复现、可复查、可继续扩展的 AMD GPU 大模型推理 baseline。
|
8天前
| |
在 AMD ROCm DSW 上跑通 DeepSeek-V4-Flash:vLLM 兼容部署、长上下文验证与 8K 性能扫参
本文记录一次在 ModelScope DSW AMD GPU/ROCm 环境中部署 DeepSeek-V4-Flash 的工程实践:通过 vLLM、ROCm/AITER/PyTorch fallback 与兼容补丁建立可复现 baseline,并用短问答、2K/8K/32K needle retrieval 和 8K top-k 扫参验证正确性与性能边界。
|
8天前
|
基于C#实现的高性能实时MP4录屏方案
基于C#实现的高性能实时MP4录屏方案
|
9天前
| |
多语言文本嵌入模型解析:paraphrase-multilingual-MiniLM 与 all-MiniLM深度对比.123
本文深度对比all-MiniLM-L6-v2与paraphrase-multilingual-MiniLM-L12-v2:前者轻快高效,专精英文;后者12层多语言支持,中英文语义区分更优。实践表明,意图识别等任务中,多语言模型显著提升准确率,虽稍慢但泛化更强。
|
9天前
| |
来自: 弹性计算
AIWCLOUD:高防CDN、过移动屏蔽、大陆节点免备架构下的分布式流量工程
本文深度解析高防CDN技术演进:从BGP/Anycast流量牵引、FPGA硬件加速、JA3指纹识别,到eBPF内核监控与AI异常检测,展现其如何融合网络、芯片、算法构建多维防御体系,保障关键业务安全。(239字)
|
9天前
| |
来自: 弹性计算
AIWCLOUD:高防CDN、过移动屏蔽、不限内容,在边缘安全新范式下
本文深度解析高防CDN技术体系:以Anycast近源清洗、FPGA/SmartNIC硬件加速、JA3指纹识别、eBPF内核监控及AI异常检测为核心,构建覆盖网络层至应用层的智能防御闭环,助力关键行业应对常态化DDoS威胁。(239字)
免费试用