并行计算的搜索结果_文章_第18页-阿里云开发者社区

scvonalwkd4hw

|

6月前

|

博文

MyEMS开源能源管理系统支持建筑、工厂等场景的电、水、气数据采集与分析，提供光伏、储能等可选功能。本期解读虚拟表计算方法：通过数据库操作获取虚拟表信息，使用多进程并行处理能耗计算任务，结合SymPy解析公式，实现高效能耗数据分析。代码涵盖数据库连接、数学表达式解析及时间处理等关键技术，助力精准能源管理与优化。

# 数据采集 # 人工智能 # 并行计算 # 数据库连接 # 数据库

游客jnstwksgqnrgi

|

6月前

|

博文

|

来自：大数据与机器学习

OpenFold2.0 基于NPU的推理适配与测试

本教程详细介绍了 OpenFold 的环境搭建、代码部署、依赖安装、数据集准备及推理测试全流程。首先通过 Anaconda 创建 Python3.9 环境并配置相关库，接着克隆 OpenFold 代码仓库并安装必要依赖（如 PyTorch、dllogger、hhsuite 等）。随后准备 PDB 数据集与模型参数，调整脚本路径以适配运行环境。最后执行推理脚本完成测试，并针对常见报错提供了解决方案，例如更新 NumPy、SciPy 或调整 GPU 配置等，确保流程顺利运行。

# 并行计算 # PyTorch # 算法框架/工具 # AI芯片 # Python

探索云世界

|

6月前

|

博文

|

来自：通义大模型

ParScale：一种全新的大模型Scaling Law

ParScale是一种新的模型扩展路线，通过并行计算增强模型能力，无需增加参数量。它引入多个并行流处理输入，动态聚合输出，显著提升性能，尤其在数学和编程任务中表现突出。相比传统方法，ParScale仅增加1/22的内存和1/6的延迟，适合边缘设备。研究还提出两阶段训练策略，降低训练成本。未来将探索更多模型架构和大数据场景下的应用潜力。

# 自然语言处理 # 并行计算 # 机器人 # 大数据

Deephub

|

6月前

|

博文

|

来自：大数据与机器学习

提升长序列建模效率：Mamba+交叉注意力架构完整指南

本文探讨了Mamba架构中交叉注意力机制的集成方法，Mamba是一种基于选择性状态空间模型的新型序列建模架构，擅长处理长序列。通过引入交叉注意力，Mamba增强了多模态信息融合和条件生成能力。文章从理论基础、技术实现、性能分析及应用场景等方面，详细阐述了该混合架构的特点与前景，同时分析了其在计算效率、训练稳定性等方面的挑战，并展望了未来优化方向，如动态路由机制和多模态扩展，为高效序列建模提供了新思路。

# 机器学习/深度学习 # 自然语言处理 # 并行计算 # 网络架构 # 异构计算

技术员阿伟

|

6月前

|

博文

《解锁JNA与CUDA内核密码，定制专属AI算子》

JNA（Java Native Access）让Java程序轻松调用本地代码，无需复杂JNI操作，动态加载本地库并自动映射Java与C/C++语言。结合CUDA（NVIDIA并行计算平台），可高效开发自定义AI算子。CUDA内核通过分解任务充分利用GPU多核优势，满足AI算法中矩阵运算和数据处理需求。两者结合虽面临性能优化与跨平台兼容性挑战，但能充分发挥Java便捷性与CUDA高性能，为AI领域提供强大支持。

# 人工智能 # 并行计算 # 算法 # Java # 异构计算

modelscope

|

6月前

|

博文

|

来自： ModelScope模型即服务

魔搭社区模型速递（6.2-6.7）

魔搭ModelScope本期社区进展：1910个模型,183个数据集,47个创新应用,5 篇内容

# 机器学习/深度学习 # 数据采集 # 自然语言处理 # 并行计算 # 测试技术

modelscope

|

6月前

|

博文

|

来自： ModelScope模型即服务

面壁小钢炮MiniCPM 4.0开源，端侧推理常规提速5倍！

面壁智能重磅推出MiniCPM 4.0 ——一个极致高效的端侧大模型，通过其 CPM.cu 自研推理框架，可实现220倍极致的速度提升，5 倍常规提速。

# 机器学习/深度学习 # 数据采集 # 并行计算 # 算法

你的小帮手

|

6月前

|

博文

阿里云服务器包年包月、按量付费和抢占式实例有什么区别？如何选择？

阿里云服务器ECS提供三种付费类型：包年包月、按量付费和抢占式实例。包年包月适合长期稳定使用，价格优惠；按量付费灵活方便，按小时结算，适用于短期或突发需求；抢占式实例价格最低（可省90%），但可能被系统释放，适合无状态应用如大数据分析、科学计算等。选择时根据业务场景决定：稳定需求选包年包月，动态需求选按量付费，低成本无状态应用选抢占式实例。

# 云服务器 ECS # 数据采集 # 弹性计算 # 供应链 # 并行计算 # 数据库

简简单单做算法

|

6月前

|

博文

基于WOA鲸鱼优化的TCN时间卷积神经网络时间序列预测算法matlab仿真

本内容介绍了一种基于TCN（Temporal Convolutional Network）与WOA（Whale Optimization Algorithm）的时间序列预测算法。TCN通过扩张卷积捕捉时间序列长距离依赖关系，结合批归一化和激活函数提取特征；WOA用于优化TCN网络参数，提高预测精度。算法流程包括数据归一化、种群初始化、适应度计算及参数更新等步骤。程序基于Matlab2022a/2024b开发，完整版含详细中文注释与操作视频，运行效果无水印展示。适用于函数优化、机器学习调参及工程设计等领域复杂任务。

# 机器学习/深度学习 # 数据采集 # 并行计算 # 算法 # 数据安全/隐私保护

技术员阿伟

|

6月前

|

博文

《当AutoScheduler遇见边缘端：Apache TVM如何重塑模型算子的极限》

边缘设备硬件资源差异显著，运行深度学习模型时算子优化面临诸多挑战。传统手动优化耗时费力且易出错，难以适应日益复杂的模型需求。Apache TVM作为开源深度学习编译器栈，通过中间表示（IR）层实现框架与硬件的高效对接，并提供稳定优化平台。其核心组件AutoScheduler引入智能化自动优化流程，能根据硬件特性生成搜索空间、构建成本模型，快速找到最优策略，大幅提高计算效率并降低能耗。实际应用中，AutoScheduler在智能家居和工业物联网等领域表现出色，未来有望支持更复杂硬件及模型，推动边缘计算技术发展。

# 机器学习/深度学习 # 缓存 # 边缘计算 # 并行计算 # Apache

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

并行计算