并行计算的搜索结果_热门_第7页-阿里云开发者社区

ShowMeAI

|

博文

图解机器学习 | XGBoost模型详解

XGBoost一个非常强大的Boosting算法工具包，本文讲解XGBoost的算法原理和工程实现，包括监督学习、回归树、集成、Gradient Boosting详细步骤，以及XGBoost的并行列块涉及、缓存访问等工程优化知识。

# 人工智能平台 PAI # 机器学习/深度学习 # 缓存 # 人工智能 # 并行计算 # 算法 # 数据挖掘 # 索引 # Python # 自然语言处理 # 计算机视觉

路人与大师

|

博文

|

来自：通义大模型

深入剖析 Qwen2.5 - 32B 模型在 VLLM 上的单机三卡部署与运行

本文深入探讨了Qwen2.5 - 32B模型在VLLM框架上的部署过程，从模型下载、启动命令、资源占用分析到GPU资源分配及CUDA图应用，详述了大模型运行的挑战与优化策略，强调了硬件资源规划与技术调优的重要性。

# GPU云服务器 # 日志服务 # 人工智能 # 并行计算 # 监控 # 异构计算

derek武汉

|

博文

|

来自：大数据与机器学习

cp-sat求解器介绍及使用案例

cp-sat求解器介绍及使用案例更多文章欢迎关注我的微信公众号：Python学习杂记

# 自然语言处理 # 并行计算 # 算法 # Python # 容器

泡沫o0

|

博文

CPU组成元素：运算器+控制器（一）

CPU组成元素：运算器+控制器

# 存储 # 缓存 # 并行计算 # 调度 # vr&ar

欲揽西江月

|

博文

探索深度学习中的Transformer模型：原理、优势与应用

# 自然语言处理 # 智能语音交互 # 智能语音交互 # 机器学习/深度学习 # 自然语言处理 # 并行计算 # 语音技术 # 计算机视觉

ZOMI酱

|

博文

【AI系统】Tensor Core 基本原理

本文深入介绍了英伟达GPU中的Tensor Core，一种专为加速深度学习设计的硬件单元。文章从发展历程、卷积计算、混合精度训练及基本原理等方面，详细解析了Tensor Core的工作机制及其在深度学习中的应用，旨在帮助读者全面理解Tensor Core技术。通过具体代码示例，展示了如何在CUDA编程中利用Tensor Core实现高效的矩阵运算，从而加速模型训练和推理过程。

# GPU云服务器 # 机器学习/深度学习 # 人工智能 # 并行计算 # API # 异构计算

喜欢猪猪

|

5月前

|

博文

|

来自：通义大模型

# Qwen3-8B 的 TTFT 性能分析：16K 与 32K 输入 Prompt 的推算公式与底层原理详解

Qwen3-8B 是通义实验室推出的 80 亿参数大模型，支持最长 32,768 token 上下文，适用于长文本处理场景。通过 FP8 量化、CUDA Kernel 优化及 RoPE 位置编码技术，提升推理效率与稳定性。模型在 16K 输入下 TTFT 约 150-200ms，32K 输入下约 250-300ms，适用于文档摘要与长对话交互。

# 大模型服务平台百炼 # 存储 # 缓存 # 资源调度 # 并行计算 # 异构计算

delacroix_xu-15509

|

博文

|

来自：弹性计算

AVX2指令集简介和代码示例

这篇文章介绍了AVX2指令集，它是Intel在2013年为提高处理器并行计算能力引入的SIMD技术。AVX2增强了整数运算，包括256位操作和位操作，还提供了FMA指令及更多广播和转换功能。与AVX相比，AVX2在图像处理和媒体编码等领域有显著优势。文章通过一个C代码示例展示了如何使用AVX2进行向量加法，并提醒编译时需确保支持AVX2指令集。

# 机器学习/深度学习 # 并行计算 # 编译器 # 数据处理 # C语言

我是暴发户

|

博文

阿里云服务器多少钱一年？整理2024年最新爆款服务器配置排行榜，共7台！

阿里云2024年服务器最新价格出炉，涵盖ECS云服务器与轻量应用服务器多款配置，如2核2G 79元/年起、2核4G配置199元一年、4核8G 955元/年等，满足不同需求。详情及购买链接见正文。

# 云服务器 ECS # 轻量应用服务器 # 弹性计算 # 并行计算 # 数据库

周周的奇妙编程

|

博文

全网首发！真·从0到1！万字长文带你入门Qwen2.5-Coder——介绍、体验、本地部署及简单微调

2024年11月12日，阿里云通义大模型团队正式开源通义千问代码模型全系列，包括6款Qwen2.5-Coder模型，每个规模包含Base和Instruct两个版本。其中32B尺寸的旗舰代码模型在多项基准评测中取得开源最佳成绩，成为全球最强开源代码模型，多项关键能力超越GPT-4o。Qwen2.5-Coder具备强大、多样和实用等优点，通过持续训练，结合源代码、文本代码混合数据及合成数据，显著提升了代码生成、推理和修复等核心任务的性能。此外，该模型还支持多种编程语言，并在人类偏好对齐方面表现出色。本文为周周的奇妙编程原创，阿里云社区首发，未经同意不得转载。

# 并行计算 # 前端开发 # 物联网 # PyTorch # 算法框架/工具

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

并行计算