并行计算的搜索结果_热门_第17页-阿里云开发者社区

一枚后端工程狮

|

1月前

|

博文

自注意力机制是Transformer的核心，让序列中每个元素直接关联所有其他元素，实现全局信息交互。相比RNN的顺序处理和CNN的局部感知，它能并行计算、捕捉长距离依赖，并提供可解释的权重分布，彻底改变了序列建模方式，成为大模型崛起的关键基石。（239字）

# 机器学习/深度学习 # 人工智能 # 并行计算 # 算法 # C++

一枚后端工程狮

|

1月前

|

博文

Transformer参数规模深度解析：从模型聪明说到实际影响

Transformer参数规模显著影响模型能力，参数越多，知识容量与模式识别能力越强，但存在边际效应和过拟合风险。现代大模型通过混合专家、量化压缩等技术提升参数效率，未来趋势是优化参数使用而非盲目扩大规模，实现性能与效率的平衡。（238字）

# 存储 # 机器学习/深度学习 # 自然语言处理 # 并行计算 # 异构计算

配电网和matlab

|

博文

基于蚁群算法的旅行商问题(TSP)求解

蚁群算法(ant colony algorithm,ACA)是由意大利学者M.Dorigo等人于20世纪90年代初提出的一种新的模拟进化算法，其真实地模拟了自然界蚂蚁群体的觅食行为。M.Dorigo等人将其用于解决旅行商问题(traveling salesman problem,TSP),并取得了较好的实验结果。

# 存储 # 分布式计算 # 并行计算 # 算法 # Serverless # 调度 # 决策智能 # Windows

A等天晴

|

博文

机器学习算法原理：详细介绍各种机器学习算法的原理、优缺点和适用场景

# 机器学习/深度学习 # 并行计算 # 算法 # 数据挖掘 # 大数据

刘悦的技术博客

|

博文

中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽

君不言语音识别技术则已，言则必称Whisper，没错，OpenAi开源的Whisper确实是世界主流语音识别技术的魁首，但在中文领域，有一个足以和Whisper相颉顽的项目，那就是阿里达摩院自研的FunAsr。 FunAsr主要依托达摩院发布的Paraformer非自回归端到端语音识别模型，它具有高精度、高效率、便捷部署的优点，支持快速构建语音识别服务，最重要的是，FunASR支持标点符号识别、低语音识别、音频-视觉语音识别等功能，也就是说，它不仅可以实现语音转写，还能在转写后进行标注，一石二鸟。

# 智能语音交互 # 智能语音交互 # 人工智能 # 达摩院 # 并行计算 # 语音技术 # C++

JOYCE_Leo16

|

博文

一文搞懂Transformer架构的三种注意力机制

# 自然语言处理 # 机器学习/深度学习 # 自然语言处理 # 并行计算 # 数据可视化 # 计算机视觉

Deephub

|

8月前

|

博文

|

来自：大数据与机器学习

Triton入门教程：安装与编写和运行简单Triton内核

Triton是一款开源GPU编程语言与编译器，专为AI和深度学习领域设计，提供高性能GPU代码开发的高效途径。它支持通过Python编写自定义GPU内核，性能接近专家级CUDA代码，但无需掌握底层CUDA知识。本文全面介绍了Triton的核心功能、安装方法、基础应用、高级优化策略，以及与CUDA和PyTorch的技术对比。此外，还探讨了其在实际项目中的应用场景，如加速Transformer模型训练和实现高效的量化计算内核。Triton简化了GPU编程流程，降低了开发门槛，同时保持高性能表现，成为连接高级框架与底层硬件的重要工具。

# 并行计算 # PyTorch # 算法框架/工具 # 开发者 # 异构计算

zstar_

|

博文

【NLP】Transformer理论解读

Transformer 是 Google 的团队在 2017 年提出的一种 NLP 经典模型，目前已经在目标检测、自然语言处理、时序预测等多个深度学习领域获得了应用，成为了新的研究热点。

# 自然语言处理 # 机器学习/深度学习 # 自然语言处理 # 并行计算 # 计算机视觉 # 异构计算

Deephub

|

博文

|

来自： ModelScope模型即服务

机器学习模型的超参数优化（二）

# 机器学习/深度学习 # C++ # 算法 # 并行计算

白水你要努力啊

|

博文

CUDA C/C++ 教程一：加速应用程序(上）

# GPU云服务器 # 机器学习/深度学习 # 并行计算 # 数据可视化 # C++ # 异构计算 # 索引 # Python

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

并行计算