开发者社区人工智能文章正文

ai 作业

2024-08-13 144

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 此次事件强调了设备运输与理赔的关键性，促使我们在未来运输过程中更加谨慎，以保障设备的安全运输及合理理赔。

这次事件让我们认识到在设备运输和理赔方面的重要性，也促使公司在未来的运输过程中更加谨慎。

文章标签：

人工智能

安全

游客mhvll2lkmsno6

ZOMI酱

28天前

存储人工智能算法

【AI系统】计算与调度

本文探讨了计算与调度的概念，特别是在神经网络和图像处理中的应用。通过分离算法定义和计算组织，Halide 等工具能够显著提升图像处理程序的性能，同时保持代码的简洁性和可维护性。文章详细介绍了计算与调度的基本概念、调度树的构建与约束，以及如何通过调度变换优化计算性能。此外，还讨论了自动调优方法在大规模调度空间中的应用，展示了如何通过探索和预测找到最优的调度方案。

ZOMI酱

41 0 0

游客jq5b4w62vc5k6

21天前

机器学习/深度学习人工智能并行计算

转载：【AI系统】AI轻量化与并行策略

本文探讨了AI计算模式对AI芯片设计的重要性，重点分析了轻量化网络模型和大模型分布式并行两大主题。轻量化网络模型通过减少模型参数量和计算量，实现在资源受限设备上的高效部署；大模型分布式并行则通过数据并行和模型并行技术，解决大模型训练中的算力和内存瓶颈，推动AI技术的进一步发展。

游客jq5b4w62vc5k6

48 6 6

ZOMI酱

25天前

机器学习/深度学习人工智能 PyTorch

【AI系统】数据并行

数据并行是一种在分布式AI系统中广泛应用的技术，通过将数据集划分成多个子集并在不同计算节点上并行处理，以提高计算效率和速度。在大规模机器学习和深度学习训练中，数据并行可以显著加快模型训练速度，减少训练时间，提升模型性能。每个计算节点接收完整的模型副本，但处理不同的数据子集，从而分摊计算任务，提高处理速度和效率。数据并行按同步方式可分为同步数据并行和异步数据并行，按实现方式包括数据并行、分布式数据并行、完全分片的数据并行等。其中，分布式数据并行（DDP）是当前应用最广泛的并行算法之一，通过高效的梯度聚合和参数同步机制，确保模型一致性，适用于大型NPU集群和AI系统。

ZOMI酱

96 7 7

ZOMI酱

26天前

机器学习/深度学习存储人工智能

【AI系统】离线图优化技术

本文回顾了计算图优化的各个方面，包括基础优化、扩展优化和布局与内存优化，旨在提高计算效率。基础优化涵盖常量折叠、冗余节点消除、算子融合、算子替换和算子前移等技术。这些技术通过减少不必要的计算和内存访问，提高模型的执行效率。文章还探讨了AI框架和推理引擎在图优化中的应用差异，为深度学习模型的优化提供了全面的指导。

ZOMI酱

44 5 5

ZOMI酱

26天前

存储编解码人工智能

【AI系统】FBNet 系列

本文介绍了FBNet系列的三种版本，从FBNetV1基于NAS的轻量级网络设计，到FBNetV2通过DMaskingNAS增加搜索空间，再到FBNetV3联合搜索网络结构与训练参数，展示了如何利用NAS技术优化网络结构和提升模型性能。文章详细解释了各版本的技术特点和实现方法，为读者提供了深入了解和应用NAS技术的宝贵资料。

ZOMI酱

61 10 10

ZOMI酱

26天前

人工智能编解码算法

【AI系统】EfficientFormer 系列

本文介绍了一种名为 EfficientFormer 的轻量化 Transformer 模型，旨在优化移动设备上的推理速度。通过重新设计 ViT 及其变体，特别是针对移动设备的延迟优化，EfficientFormer 引入了维度一致的 Transformer Block，并通过网络模型搜索获得了多个系列的模型。EfficientFormer V2 进一步改进了模型设计，引入细粒度联合搜索策略，优化了延迟和参数量，实现了更高的性能和效率。

ZOMI酱

48 8 9

ZOMI酱

26天前

机器学习/深度学习人工智能编解码

【AI系统】MobileFormer

本文介绍了MobileFormer，一种创新的网络结构，通过双线桥将MobileNet的局部特征与Transformer的全局特征相结合，实现了高效且低计算成本的模型设计。MobileFormer使用少量tokens来学习全局先验，从而在保持高性能的同时，显著降低了计算量。通过本文，读者可以深入了解如何有效结合CNN和Transformer的优势，实现模型的轻量化。

ZOMI酱

44 7 8

ZOMI酱

2月前

机器学习/深度学习人工智能并行计算

【AI系统】AI轻量化与并行策略

本文探讨了AI计算模式对芯片设计的重要性，重点介绍了轻量化网络模型和大模型分布式并行两大主题。轻量化模型旨在减少参数量和计算量，适合资源受限的设备；大模型分布式并行则针对高性能计算需求，通过数据并行、模型并行等技术提高训练效率。文中详细解析了轻量化设计的方法及分布式并行的实现机制，为AI芯片设计提供了理论依据和技术指导。

ZOMI酱

47 2 2

ZOMI酱

2月前

机器学习/深度学习存储人工智能

【AI系统】为什么 GPU 适用于 AI

本文探讨了GPU在AI计算中的应用，从卷积计算的基本原理入手，解析了GPU线程分级与AI计算模式的关系，以及矩阵乘法如何通过GPU编程提升算力利用率。文章还介绍了计算强度的概念，分析了不同数据结构对计算强度的影响，以及GPU中Tensor Core的作用，强调了在不同存储位置下，找到计算强度与矩阵大小的最佳平衡点对AI计算系统优化的重要性。

ZOMI酱

81 2 2

ZOMI酱

27天前

人工智能 PyTorch 算法框架/工具

【AI系统】昇腾推理引擎 MindIE

本文详细介绍华为昇腾推理引擎 MindIE，涵盖其基本介绍、关键功能特性及三大组件：MindIE-Service、MindIE-Torch 和 MindIE-RT。文章深入探讨了各组件在服务化部署、大模型推理和推理运行时方面的功能和应用场景，旨在帮助读者全面了解 MindIE 如何支持 AI 业务的高效运行和模型的快速部署。

ZOMI酱

44 0 0

ai 作业

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

ai 作业

热门文章

最新文章

相关课程

相关电子书

相关实验场景