AI算子开发需要什么技能

简介: AI算子开发需要什么技能?

大家好啊,我是董董灿。

如果说深度学习是人工智能的灵魂,那算法绝对是深度学习的灵魂。

在越来越火的AI大模型GPT4屡创新高的过程中,算法工程师绝对发挥了中流砥柱的作用。

而在国内,算法工程师,早就是深度学习中的卷王职位了。

很早之前网上就流传着一些算法工程师的传奇:毕业去大厂做算法,白菜价30-40w起步!

image.png

这让工作了很多年的老工程师们都愤愤不平,纷纷大呼薪资被倒挂。

虽然这几年市场冷静了一些,但不可否认的是,算法工程师,依然是香饽饽,而且依旧很卷。而在与算法相关的岗位中,有一个独特的存在,不少同学却不清楚这个岗位是做什么的,更别提这个岗位需要什么技能了。

那就是AI 算子开发工程师。

今天,就来聊一聊这个职位。

image.png

AI算子开发是做什么的?

算子——Operator,这里指的是神经网络中完成特定功能的一些算法的节点。比如在CNN网络中,一个卷积节点就属于一个卷积算子。

往大了讲,甚至一个CNN网络也可以称作一个大算子,只不过这个大算子比较复杂。

AI算子开发的岗位主要集中在与AI芯片相关的公司的招聘需求中。

那这个职位具体是做什么的呢?

做过深度学习或者使用框架搭过神经网络的同学都知道,一个神经网络就是由一层层的算子构成的。
但在使用框架搭网络的过程,基本上是搭积木似的调用算子接口。

比如在 tensorflow 中调用一个卷积,一行代码就可以搞定:

tf.nn.conv2d(input, filter, strides, padding, use_cudnn_on_gpu=None, data_format=None, name=None)

看似很简单,但在这个过程中,你根本看不到这个卷积算法是如何实现的。

你唯一知道的是,给定了一个输入,这一行代码做了卷积运算。

而卷积运算的实际执行过程,恰恰就是算子开发工程师需要做的事:把卷积的运算,在更底层实现出来。

如果在x86的架构下实现,可能就是直接用循环嵌套的方式来实现了,比如:

#include <stdio.h>
#define N 4 // 输入数组大小
#define K 3 // 卷积核大小
void conv2d(float input[N][N],
            float kernel[K][K],
            float output[N-K+1][N-K+1]) {
  int i, j, m, n;    
  float sum;    
  // 遍历输出数组    
  for (i = 0; i < N-K+1; i++) {        
    for (j = 0; j < N-K+1; j++) {            
      sum = 0;            
      // 遍历卷积核            
      for (m = 0; m < K; m++) {                
        for (n = 0; n < K; n++) {                    
          // 对应元素相乘并累加                    
          sum += input[i+m][j+n] * kernel[m][n];                
        }            
      }            
      output[i][j] = sum; // 存储卷积结果        
    }    
  }
}

这是因为x86的架构和指令集并没有针对卷积这一算法做特殊的指令设计,因此我们要想实现这个功能,基本上也只能根据卷积的运算逻辑,来一层层的循环遍历完成。

而AI芯片作为一种专用AI加速部件,会为卷积这一运算单独设计硬件来完成计算,相对应的,也会设计单独的卷积指令。

因此,在AI芯片上,一个卷积的运算实现,可能就用一条指令,就可以完成很多个数据的乘累加操作,不需要再像上面的代码一样,写那么多循环来遍历卷积核。

当然实现出来只是第一步,更重要的是要优化。利用硬件架构的特性来完成算子的性能优化,从而实现计算加速。

算子开发需要什么技能?

了解了算子开发是干什么的,那大概就知道需要什么技能了。

首先,一定要对算法本身很熟悉,甚至是了熟于心才行。因为算子开发是要真正实现这个算法,而不是在框架侧简单的进行一行python代码的调用。

要在芯片上实现一个算法,需要知道算法的每一个细节,只有这样,才能完成一个算法的功能交付。

其次,还需要对AI芯片的架构特别了解。需要知道芯片上有哪些硬件模块可以实现这个算法,这些硬件模块之间有什么依赖关系,如何并行、如何同步、如何做优化等,做到了这一点,才能完成一个算法的性能交付。

可以说,算子开发,是一个软硬兼具的岗位。

除此之外,C++/python语言也是不可少的。

因此,算子开发需要的技能,可以大概有3方面:扎实的算法基础、扎实的硬件知识(计算机体系结构相关)以及扎实的编程技能。

算子开发的岗位待遇如何?

我从boss直聘上找了一个比较有代表性的职位描述和薪资。

image.png

这是北京某公司招聘的5年经验算子岗位的职位和薪资描述。感兴趣的同学可以去Boss直聘上搜一搜看看。

我个人感觉,算子开发岗的薪资与纯算法岗位其实差不多,但是对算法的要求应该是没有纯算法岗位高的。

因为AI算子开发需要的能力不单单是算法能力,还需要一些硬件知识,甚至是编译器知识。

在现在纯算法工程师越来越卷,恨不得把leetcode刷一遍都不一定过得了纯算法岗面试的情况下,如果你具备算法+硬件+编程能力的技能,不妨试试算子开发岗。

没准,你很合适呢?

相关文章
|
2天前
|
人工智能 运维 安全
英伟达发布AI Enterprise 5.0,帮助企业加速生成式AI开发
英伟达发布AI Enterprise 5.0,这是一个云端原生平台,加速生成式AI的开发与部署。该平台提供优化的数据科学流程,支持生成式AI,强调性能、安全性和灵活性。核心特性包括NVIDIA NIM和CUDA-X微服务的性能优化,严格的安全监测,多环境运行能力,及企业级支持与服务。API目录提供多种预训练模型,促进跨领域的应用创新。然而,平台可能对小企业有高技术门槛和成本挑战,且可能存在与现有系统兼容性问题。
36 1
英伟达发布AI Enterprise 5.0,帮助企业加速生成式AI开发
|
2天前
|
机器学习/深度学习 人工智能 架构师
【架构师】AI时代架构师必备技能
【架构师】AI时代架构师必备技能
|
2天前
|
人工智能 监控 数据可视化
【项目管理】AI时代项目经理必备技能
【项目管理】AI时代项目经理必备技能
135 0
|
2天前
|
人工智能 固态存储 数据挖掘
3、【KV260开发】Vitis AI library APIs
3、【KV260开发】Vitis AI library APIs
9 0
|
2天前
|
人工智能 IDE Devops
通义灵码技术解析,打造 AI 原生开发新范式
本文第一部分先介绍 AIGC 对软件研发的根本性影响,从宏观上介绍当下的趋势;第二部分将介绍 Copilot 模式,第三部分是未来软件研发 Agent 产品的进展。
|
2天前
|
人工智能 NoSQL atlas
Fireworks AI和MongoDB:依托您的数据,借助优质模型,助力您开发高速AI应用
我们欣然宣布MongoDB与 Fireworks AI 正携手合作让客户能够利用生成式人工智能 (AI)更快速、更高效、更安全地开展创新活动
|
2天前
|
机器学习/深度学习 人工智能 安全
用AI技术创业需要哪些技能?
人工智能(AI)技术作为当今科技创新的前沿领域,为创业者提供了广阔的机会和挑战。随着AI技术的快速发展和应用领域的不断拓展,未来AI技术方面会有哪些创业机会呢? 创什么业打工才是程序员的主旋律,没有资源没有人脉怎么创业。
31 0
|
2天前
|
机器学习/深度学习 人工智能 安全
【AI 场景】描述使用 AI 开发虚拟助手所涉及的步骤
【5月更文挑战第4天】【AI 场景】描述使用 AI 开发虚拟助手所涉及的步骤
|
2天前
|
传感器 人工智能 自动驾驶
【AI 场景】如何开发用于自动驾驶的人工智能系统?
【5月更文挑战第3天】【AI 场景】如何开发用于自动驾驶的人工智能系统?
|
2天前
|
存储 人工智能 安全
【AI 初识】人工智能开发和部署的道德考虑是什么?
【5月更文挑战第3天】【AI 初识】人工智能开发和部署的道德考虑是什么?

热门文章

最新文章