算法框架/工具的搜索结果_文章_第13页-阿里云开发者社区

Deephub

|

6月前

|

博文

|

深度学习训练中，GPU内存不足（OOM）是常见难题。PyTorch虽提供内存分析工具，但其官方可视化方案存在严重性能瓶颈，尤其在处理大型模型快照时表现极差。为解决这一问题，SnapViewer项目应运而生。该项目通过将内存快照解析为三角形网格结构并借助成熟渲染库，充分发挥GPU并行计算优势，大幅提升大型快照处理效率。此外，SnapViewer优化了数据处理流水线，采用Rust和Python结合的方式，实现高效压缩与解析。项目不仅解决了现有工具的性能缺陷，还为开发者提供了更流畅的内存分析体验，对类似性能优化项目具有重要参考价值。

# 机器学习/深度学习 # 数据可视化 # PyTorch # 算法框架/工具 # 异构计算

技术员阿伟

|

6月前

|

博文

《深度探秘：Java构建Spark MLlib与TensorFlow Serving混合推理流水线》

本文探讨了如何结合Apache Spark MLlib、TensorFlow Serving和Java构建混合推理流水线。Spark MLlib利用分布式计算高效处理大规模数据，完成模型训练；TensorFlow Serving专注于模型部署，提供稳定高效的推理服务；Java则以其稳健性协调两者，实现高性能与扩展性。文章分析了环境搭建、模型训练与集成、输入输出处理及性能优化等关键环节，并讨论了兼容性与性能瓶颈等挑战。这一架构在医疗、金融等领域具有广阔应用前景，展现了强大的技术潜力。

# 分布式计算 # Java # TensorFlow # 算法框架/工具 # Spark

技术员阿伟

|

6月前

|

博文

《深度剖析：Java利用ONNX Runtime部署ViT模型的关键路径》

ViT将Transformer引入视觉领域，通过自注意力机制捕捉图像长距离依赖，超越传统CNN局限，在图像分类等任务中表现卓越。PyTorch以其动态图机制和简洁API助力ViT开发，而ONNX Runtime作为跨平台推理引擎，实现从PyTorch到部署的无缝衔接。在Java环境中，借助ONNX Runtime加载ViT模型，优化性能并解决兼容性问题，为智能安防、自动驾驶等领域带来全新可能。这场技术融合之旅充满挑战与机遇，推动计算机视觉迈向新高度。

# 机器学习/深度学习 # Java # PyTorch # 算法框架/工具 # 计算机视觉

阿里云开发者

|

6月前

|

博文

200行python代码实现从Bigram模型到LLM

本文从零基础出发，逐步实现了一个类似GPT的Transformer模型。首先通过Bigram模型生成诗词，接着加入Positional Encoding实现位置信息编码，再引入Single Head Self-Attention机制计算token间的关系，并扩展到Multi-Head Self-Attention以增强表现力。随后添加FeedForward、Block结构、残差连接(Residual Connection)、投影(Projection)、层归一化(Layer Normalization)及Dropout等组件，最终调整超参数完成一个6层、6头、384维度的“0.0155B”模型

# 机器学习/深度学习 # 人工智能 # PyTorch # 算法框架/工具 # Python

阿里云开发者

|

6月前

|

博文

从零开始200行python代码实现LLM

本文从零开始用Python实现了一个极简但完整的大语言模型，帮助读者理解LLM的工作原理。首先通过传统方法构建了一个诗词生成器，利用字符间的概率关系递归生成文本。接着引入PyTorch框架，逐步重构代码，实现了一个真正的Bigram模型。文中详细解释了词汇表（tokenizer）、张量（Tensor）、反向传播、梯度下降等关键概念，并展示了如何用Embedding层和线性层搭建模型。最终实现了babyGPT_v1.py，一个能生成类似诗词的简单语言模型。下一篇文章将在此基础上实现自注意力机制和完整的GPT模型。

# 机器学习/深度学习 # 算法 # PyTorch # 算法框架/工具 # Python

Deephub

|

6月前

|

博文

|

来自：大数据与机器学习

提升模型泛化能力：PyTorch的L1、L2、ElasticNet正则化技术深度解析与代码实现

本文将深入探讨L1、L2和ElasticNet正则化技术，重点关注其在PyTorch框架中的具体实现。关于这些技术的理论基础，建议读者参考相关理论文献以获得更深入的理解。

# 云解析DNS # 机器学习/深度学习 # PyTorch # 算法框架/工具

Deephub

|

6月前

|

博文

|

来自：大数据与机器学习

BayesFlow：基于神经网络的摊销贝叶斯推断框架

BayesFlow 是一个基于 Python 的开源框架，利用摊销神经网络加速贝叶斯推断，解决传统方法计算复杂度高的问题。它通过训练神经网络学习从数据到参数的映射，实现毫秒级实时推断。核心组件包括摘要网络、后验网络和似然网络，支持摊销后验估计、模型比较及错误检测等功能。适用于流行病学、神经科学、地震学等领域，为仿真驱动的科研与工程提供高效解决方案。其模块化设计兼顾易用性与灵活性，推动贝叶斯推断从理论走向实践。

# 机器学习/深度学习 # API # TensorFlow # 数据处理 # 算法框架/工具

技术员阿伟

|

7月前

|

博文

《 PyTorch 2.3革新：torch.compile自动生成CUDA优化内核全解》

torch.compile是PyTorch 2.3推出的革命性功能，通过即时编译（JIT）技术优化模型运行速度。它借助TorchDynamo提取计算图，并通过TorchInductor生成高度优化的CUDA内核，充分发挥GPU并行计算能力。支持默认、reduce-overhead和max-autotune三种模式，分别适用于不同性能需求场景。尽管在复杂模型或动态计算图中可能面临挑战，但通过调整参数或结合其他优化技术，仍可显著提升性能。这一工具极大简化了CUDA代码优化流程，为深度学习开发提供了强大支持。

# 并行计算 # PyTorch # 算法框架/工具 # 开发者 # 异构计算

JustDoIT技术吧

|

7月前

|

博文

|

来自：大数据与机器学习

AI界的"翻译官"：ONNX如何让各框架模型和谐共处

还在为不同框架间的模型转换头疼？ONNX让你在PyTorch训练的模型可以无缝在TensorFlow部署，甚至能让模型在手机上飞速运行。本文带你了解这个AI领域的'瑞士军刀'，轻松实现跨平台高性能模型部署。

# 人工智能 # PyTorch # TensorFlow # 算法框架/工具 # 异构计算

技术员阿伟

|

7月前

|

博文

《视频秒变艺术大片：Python+AI风格迁移的神级操作》

Python在AI艺术风格迁移视频制作中至关重要，其丰富的库资源和强大的生态系统为深度学习提供了支持。核心原理基于卷积神经网络（CNN），通过提取内容图像与风格图像的特征并融合，生成新风格图像。视频制作需对每帧进行处理，涉及复杂计算，Python的高效工具如TensorFlow和PyTorch助力模型构建与训练。使用预训练模型（如VGG19）提取特征，通过Gram矩阵捕捉风格信息。优化策略包括多线程处理、分块处理以提升效率，同时确保视频连贯性。这一技术实现艺术与技术的深度融合，赋予视频全新视觉体验。

# 机器学习/深度学习 # 人工智能 # PyTorch # 算法框架/工具 # Python

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

算法框架/工具