Hinton等谈深度学习十年;PyTorch落地Linux基金会的影响;机器学习界的“GitHub”|AI系统前沿动态

简介: Hinton等谈深度学习十年;PyTorch落地Linux基金会的影响;机器学习界的“GitHub”|AI系统前沿动态

1.png

  1. 重磅!PyTorch落地Linux基金会

扎克伯格亲自宣布,PyTorch基金会已新鲜成立,并归入Linux基金会旗下,管理委员会成员,包括Meta、AMD、AWS、谷歌云、微软和英伟达。Meta表示,PyTorch成功背后的驱动力,是开源社区充满活力的持续增长。成立基金会将确保社区成员以透明和公开的方式作出决定。
链接:
mp.weixin.qq.com/s/832JBlOlJ…
www.reddit.com/r/MachineLe…

  1. 深度学习十年后撞墙了?Hinton、LeCun、李飞飞不这么认为

10 年后,如今已经成为图灵奖得主的 Geoffrey Hinton、Yann LeCun,ImageNet 挑战赛的主要发起人与推动者李飞飞如何看待过去十年的 AI 技术突破?又对接下来十年的技术发展有什么判断?近日,海外媒体 VentureBeat 的一篇专访文章,让 AI 社区开始讨论起这些问题。
链接:
mp.weixin.qq.com/s/ijsyATtxD…

  1. TensorFlow 2.10上线:Windows上扩展GPU支持,TF-DF 1.0发布

新版本的亮点包括:Keras 中新的用户友好特性、Windows 中扩展 GPU 支持等等。此版本还标志着 TensorFlow 决策森林 (TF-DF) 1.0 版本的到来!
链接:
mp.weixin.qq.com/s/UYg3-lTK9…

  1. 提速还能不掉点!深度解析MegEngine 4 bits量化开源实现

量化模型被广泛使用在推理侧,量化也成为了一个重要且非常活跃的研究领域。近期,MegEngine开源了4 bits的量化的相关内容,通过MegEngine 4 bits量化实现的ResNet-50模型在 ImageNet 数据集上的精度表现与 8 bits 量化模型相差无几,并且速度是TensorRT-v7 8 bits ResNet-50模型的推理速度的1.3倍。
链接:
zhuanlan.zhihu.com/p/565121111

  1. 视频教程|OneFlow源码解析(1):分布式易用性

本视频介绍 OneFlow 如何通过发明的 SBP 及 placment 概念,简化分布式训练流程。从 SBP 的角度,可以更接近本质地理解数据并行、模型并行策略。
链接:
www.bilibili.com/video/BV1va…

  1. Groq:从头设计一个张量流式处理器架构

不同于传统的CPU和GPU架构,Groq从头设计了一个张量流处理器 (TSP) 架构, 以加速人工智能、机器学习和高性能计算中的复杂工作负载。这个架构不是开发小型可编程内核并对其进行数百次复制,而是容纳一个具有数百个功能单元的单个处理器。
链接:
mp.weixin.qq.com/s/bmhFLsdga…

  1. SIMT、SIMD和DSA(1)

选DSA还是SIMT目前也是AI芯片最重要的架构选择问题,但选哪个都是一大堆具体概念和设计的集合。我们还是需要深入进去剖析两者好到底好在哪里。
链接: zhuanlan.zhihu.com/p/562135333

  1. GPU内存(显存)的理解与基本的使用

GPU显存的组成与CPU的内存架构类似,但为了满足并行化运算GPU的显存做了特殊设计,与之相关的概念很多如host memory、device memory、L1/L2 cache、register、texture、constant、shared memory、global memory等,还会涉及一些硬件概念DRAM、On/Off chip memory,还涉及到一些操作如pin memory,zero copy等。本文试图帮助了解这些显存相关的概念,包括一些特殊存储作用是什么,性能如何以及在CUDA中怎么用。
链接:
zhuanlan.zhihu.com/p/462191421

  1. CUDA SGEMM矩阵乘法优化笔记:从入门到cublas

最近开始入门CUDA,初步了解GPU的工作原理后,选择了单精度矩阵乘法作为练习的kernel,尝试从最简单的SGEMM kernal开始,逐步优化到cublas的性能水平。
链接:
zhuanlan.zhihu.com/p/518857175

  1. 如何利用TVM快速实现超越Numpy的GEMM

本文主要讲述如何利用TVM实现超越Numpy GEMM,有人在看了《How to optimize GEMM on CPU》以后说TVM还是没有超越Numpy的性能,是不是无法做到,于是作者写这篇文章来阐述我们如何在这个基础上做到超越。
链接:
zhuanlan.zhihu.com/p/75203171;
tvm.apache.org/docs/how_to…

  1. 一个tvm(te)实现的cutlass efficient gemm

这里记录的是从tvm的tensor expression出发,参考cutlass efficient gemm的思路,一步一步优化一下GEMM的一些思考,目的是为了理解cutlass优化gemm的思路。
链接:
zhuanlan.zhihu.com/p/560729749

  1. 视频教程|TVM 学习指南介绍(前端部分)

链接:
mp.weixin.qq.com/s/rB8qYp_5W…

  1. 扩散模型爆火,这是首篇综述与Github论文分类汇总

本综述(Diffusion Models: A Comprehensive Survey of Methods and Applications)首次对现有的扩散生成模型(diffusion model)进行了全面的总结分析,从 diffusion model 算法细化分类、和其他五大生成模型的关联以及在七大领域中的应用等方面展开,最后提出了 diffusion model 的现有 limitation 和未来的发展方向。
链接:mp.weixin.qq.com/s/GcL4_zgbW…

  1. Hugging Face:成为机器学习界的“Github”

五年前,AI领域的知名研究者Andrej Karpathy发文称,传统人工编程属于“软件1.0”,“软件2.0”时代将以神经网络来编程,在这个过渡过程中,将涌现像GitHub这样的重量级平台。AI届网红公司“抱抱脸(Hugging Face)”有志于成为“软件2.0”时代的GitHub。在Hugging Face上,用户可以托管机器学习模型和数据集等,对它们进行共享、协作和评价,最后将它们投入生产应用,这种模式有点像Github上的托管和协作模式。
链接:
mp.weixin.qq.com/s/_2DVu1_zZ…

相关实践学习
在云上部署ChatGLM2-6B大模型(GPU版)
ChatGLM2-6B是由智谱AI及清华KEG实验室于2023年6月发布的中英双语对话开源大模型。通过本实验,可以学习如何配置AIGC开发环境,如何部署ChatGLM2-6B大模型。
相关文章
|
9月前
|
Ubuntu Linux Anolis
Linux系统禁用swap
本文介绍了在新版本Linux系统(如Ubuntu 20.04+、CentOS Stream、openEuler等)中禁用swap的两种方法。传统通过注释/etc/fstab中swap行的方式已失效,现需使用systemd管理swap.target服务或在/etc/fstab中添加noauto参数实现禁用。方法1通过屏蔽swap.target适用于新版系统,方法2通过修改fstab挂载选项更通用,兼容所有系统。
831 3
Linux系统禁用swap
|
9月前
|
Linux
Linux系统修改网卡名为eth0、eth1
在Linux系统中,可通过修改GRUB配置和创建Udev规则或使用systemd链接文件,将网卡名改为`eth0`、`eth1`等传统命名方式,适用于多种发行版并支持多网卡配置。
1407 3
|
Ubuntu Linux 网络安全
Linux系统初始化脚本
一款支持Rocky、CentOS、Ubuntu、Debian、openEuler等主流Linux发行版的系统初始化Shell脚本,涵盖网络配置、主机名设置、镜像源更换、安全加固等多项功能,适配单/双网卡环境,支持UEFI引导,提供多版本下载与持续更新。
899 3
Linux系统初始化脚本
|
10月前
|
运维 Linux 开发者
Linux系统中使用Python的ping3库进行网络连通性测试
以上步骤展示了如何利用 Python 的 `ping3` 库来检测网络连通性,并且提供了基本错误处理方法以确保程序能够优雅地处理各种意外情形。通过简洁明快、易读易懂、实操性强等特点使得该方法非常适合开发者或系统管理员快速集成至自动化工具链之内进行日常运维任务之需求满足。
665 18
|
9月前
|
安全 Linux Shell
Linux系统提权方式全面总结:从基础到高级攻防技术
本文全面总结Linux系统提权技术,涵盖权限体系、配置错误、漏洞利用、密码攻击等方法,帮助安全研究人员掌握攻防技术,提升系统防护能力。
1052 1
|
9月前
|
监控 安全 Linux
Linux系统提权之计划任务(Cron Jobs)提权
在Linux系统中,计划任务(Cron Jobs)常用于定时执行脚本或命令。若配置不当,攻击者可利用其提权至root权限。常见漏洞包括可写的Cron脚本、目录、通配符注入及PATH变量劫持。攻击者通过修改脚本、创建恶意任务或注入命令实现提权。系统管理员应遵循最小权限原则、使用绝对路径、避免通配符、设置安全PATH并定期审计,以防范此类攻击。
1354 1
|
10月前
|
缓存 监控 Linux
Linux系统清理缓存(buff/cache)的有效方法。
总结而言,在大多数情形下你不必担心Linux中buffer与cache占用过多内存在影响到其他程序运行;因为当程序请求更多内存在没有足够可用资源时,Linux会自行调整其占有量。只有当你明确知道当前环境与需求并希望立即回收这部分资源给即将运行重负载任务之前才考虑上述方法去主动干预。
2521 10
|
10月前
|
安全 Linux 数据安全/隐私保护
为Linux系统的普通账户授予sudo访问权限的过程
完成上述步骤后,你提升的用户就能够使用 `sudo`命令来执行管理员级别的操作,而无需切换到root用户。这是一种更加安全和便捷的权限管理方式,因为它能够留下完整的权限使用记录,并以最小权限的方式工作。需要注意的是,随意授予sudo权限可能会使系统暴露在风险之中,尤其是在用户不了解其所执行命令可能带来的后果的情况下。所以在配置sudo权限时,必须谨慎行事。
1754 0
|
10月前
|
Ubuntu Linux 开发者
国产 Linux 发行版再添新成员,CutefishOS 系统简单体验
当然,系统生态构建过程并不简单,不过为了帮助国产操作系统优化生态圈,部分企业也开始用国产操作系统替代 Windows,我们相信肯定会有越来越多的精品软件登录 Linux 平台。
816 0
|
10月前
|
Ubuntu 安全 Linux
Linux系统入门指南:从零开始学习Linux
Shell脚本是一种强大的自动化工具,可以帮助您简化重复的任务或创建复杂的脚本程序。了解Shell脚本的基本语法和常用命令,以及编写和运行Shell脚本的步骤,将使您更高效地处理日常任务。
732 0

热门文章

最新文章