前言
AI(人工智能),人工智能是计算机科学的一个分支,它最早由美国的约翰·麦卡锡在1956年提出,它是新一轮科技革命和产业变革的重要驱动力量,旨在研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统。一门新的技术科学。人工智能可以表现为机器所展现的智能,例如:机器人、语言识别、图像识别和自然语言处理等领域。
现阶段我们的生活的各个方面均已被AI充斥,大到政府机关,小到幼儿园,个体工商户,甚至我们每天早上起来都可能会问一声【小度】【小爱】【豆包】【小易】等等智能语音助手【早上好】。他会跟你说一下今天早上的大致重点新闻信息,天气、出行情况,是否要增添衣服等内容。智能无处不在。那么我们针对于大专生来说,我们的很多工作岗位已经被AI所替代,对应AI衍生出来的工作岗位我们能做一些什么就很重要了,今天我们就来讲一下,大专生毕业后在AI类岗位中能做些什么。
AI发展
要了解我们在AI类岗位中能做什么,至少要知道AI是什么,它能做什么,现阶段发展的动向以及研发方向的基础信息,根据这些基础信息再进行深入探究。
AI框架发展
AI发展一定要说的就是AI的框架发展,没有AI的框架作为依托,我们是无法进行【炼丹】,也就训练大模型操作,
从19年开始我就开始接触到了AI框架,最开始是tensorflow2.0,使用它来做一些卷积的计算等,20年各类的AI比赛就比较多了,哪个使用用的是Pytorch1.6版本,直至23年出现了pytorch2.0算是当前比较稳定的版本,炼丹需要对计算机的要求比较高,显卡最低16G显存,最好是32G的,但是绝大多数的计算机无法达到此要求,对应的算力平台也就出现了很多,我常用的最方便的也就是CSDN的InsCode,腾讯的HAI高性能服务器,其它的例如英特尔与aws也都有,但是用着不是很方便。还是国内的舒服一些。
tensorflow2.0
安装以及导入tensorflow,使用pip安装后默认安装的就是最新版本的tensorflow。
pip install tensorflow import tensorflow as tf
初级
Keras机器学习基础知识
加载和预处理数据
高级
自定义
分布式训练
图像
文本
音频
结构化数据
生成式
模型理解
强化学习
Pytorch2.0
支持通过一行代码实现模型运行加速。直到2023年3月份,PyTorch 2.0才正式发布。
PyTorch 2.0加入了一个新的函数,叫做torch.compile(),能够通过一行代码对已有的模型进行加速。这个函数具备很强的通用性,不仅能对普通PyTorch的模型进行加速,还能对用户自定义的函数和huggingface上的模型进行一键加速。
PyTorch 2.0 中发布了大量足以改变 PyTorch 使用方式的新功能,它提供了相同的 eager mode 和用户体验,同时通过 torch.compile 增加了一个编译模式,在训练和推理过程中可以对模型进行加速,从而提供更佳的性能和对 Dynamic Shapes 及 Distributed 的支持。
- PyTorch 2.0 在保留原有优势的同时,大举支持编译
- torch.compile 为可选功能,只需一行代码即可运行编译
- 4项重要技术:TorchDynamo、AOTAutograd、PrimTorch 以及 TorchInductor
- PyTorch 1.x 代码无需向 2.0 迁移
训练集
想训练AI,那么训练的数据集就必须靠谱,如果玩过AI类对话产品,那么一定知道当问AI不知道,或者不了解的方式或问题时AI会回答一些很杂乱的内容,这叫做AI幻觉,很多LLM框架都会有这类大模型幻觉问题,这都是训练集数据不准确所带来的结果。
训练集概述
在机器学习和模式识别等领域中,一般需要将样本分成独立的三部分:
- 训练集(train set)
- 验证集(validation set )
- 测试集(test set)
其中训练集用来估计模型,验证集用来确定网络结构或者控制模型复杂程度的参数。
测试集则检验最终选择最优的模型的性能如何。
一个典型的划分是训练集占总样本的50%,而其它各占25%,三部分都是从样本中随机抽取。
但当样本总量少的时候,上面的划分就不合适了。常用的是留少部分做测试集。然后对其余N个样本采用K折交叉验证法。就是将样本打乱,然后均匀分成K份,轮流选择其中K-1份训练,剩余的一份做验证,计算预测误差平方和,最后把K次的预测误差平方和再做平均作为选择最优模型结构的依据。特别的K取N,就是留一法(leave one out)。
训练集用于监督学习中,监督学习是指利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程,也称为监督训练或有教师学习。
监督学习是从标记的训练数据来推断一个功能的机器学习任务。训练数据包括一套训练示例。在监督学习中,每个实例都是由一个输入对象(通常为矢量)和一个期望的输出值(也称为监督信号)组成。监督学习算法是分析该训练数据,并产生一个推断的功能,其可以用于映射出新的实例。一个最佳的方案将允许该算法来正确地决定那些看不见的实例的类标签。这就要求学习算法是在一种“合理”的方式从一种从训练数据到看不见的情况下形成。
人工智能训练师
在有了训练集后,我们就可以进行人工智能训练了,很多企业都是需要自己的独立的人工智能客服的,这是最基本的需求,还会有很多生产类的大模型需要训练,例如原画师,基础算法工程师类似的大模型,需求量很大,我们都可以在招聘网站上找到对应的工作,下面是一家机器对话的人工智能训练师招聘,要求的内容主要就是知识库完善,对于大专生来说完全可以迎对,开出的薪资也还是很可观的。
人社部标准
《人工智能训练师国家职业技能标准(2021 年版)》(下称《标准》),明确人工智能训练师分为五个等级。
人工智能训练师是指使用智能训练软件,在人工智能产品实际使用过程中进行数据库管理、算法 参数设置、人机交互设计、性能测试跟踪及其他辅助作业的人员。
人工智能训练师的五个等级分别为:五级/初级工、四级/中级工、三级/高级工、二级/技师、一级/高级技师。其中,五级初级工的数据标注能力,指向原始数据清洗和数据分类等工作;四级中级工的智能系统运维能力,指向对系统的维护、优化工作。
该职业包含数据标注员、人工智能算法测试员两个工种。根据《标准》,人工智能训练师培训内容有数据采集和处理、数据标注、智能系统运维、业务分析、智能训练、智能系统设计、培训与指导等5个项目的学习。
数据标注员的薪资大致范围在4000元-12000元/月之间,人工智能算法测试员的薪资在10000元-30000元/月。人工智能算法测试员的学历要求在本科以上,该工作内容也跟算法更相关。
主流AI服务
✨ AI写作
1、天工AI
要论国内对标ChatGPT的大模型那可是数不胜数,天工AI就是其中首个双千亿的大语言模型~在信息获取这一块,它可完全不输任何首发的智能助手;
一打开官网便能看到搜索、对话、创作、阅读四个主要的模块,想要使用哪个点击即可切换到对应的界面,很是方便;
2、Notion AI
Notion是一个灵活的笔记和项目管理工具,可以帮我们创建各种类型的文档、数据库、任务列表等等;
在使用体验上,Notion AI的上手难度并不高,而且响应速度算快了,界面也支持用浏览器翻译成中文~
所以大家都称它为“地表最强印象笔记工具”,我觉得非常贴切!
3、Copy AI
Copy作为一款专注于营销文案生成的 AI 智能网站,拥有强大的文案生成能力,可以快速生成各种类型的文案,如广告文案、社交媒体文案、产品描述等,支持各种长篇、短篇内容的创建;
网站提供90多种工具和模板,只需点击几下,还可以为所有广告系列生成高转化率的副本;
它对英文的撰写非常专业,即使英语水平一般,也可以用这个AI工具写出高质量的英文文案,此外,我们还能通过草稿内容,再接着进行修饰、润色,从而达到我们想要的写作效果~
✨ AI绘画
1、Vega AI
Vega AI是国内首个在线训练应用AI创作平台,同样支持文生图、图生图、条件生图等多种绘画模式,可以帮助我们通过网页在线快速生成作品;
Vega的风格广场还可以浏览选择他人制作的优秀作品,进行学习或者同款制作~而且Vega强大的自由风格定制功能,让每个用户都能生成属于自己的lora!
2、抠图改图王
AI扩充背景的技术,我只能说太超前了,使用过一次就完全停不下来!
而且各种工具我都尝试过,没想到居然是这款“图片编辑器”效果最好!?
在这款工具中实现这样的效果,实在是轻而易举,打开软件主界面找到【AI扩图】功能后导入我们需要处理的照片,最后只需要调整一下扩图比例即可~
3、美图秀秀
美图秀秀这款软件大家的印象也许还停留在修图功能上,其实在AI绘画的热度开始上涨时,美图秀秀就顺着热度,也加入了AI绘画功能;
通过几个版本的测试,终于迎来了正式版,软件支持“文生图”、“图生图”等功能,导入照片生成不同风格的图片、输入关键词生成图片等等都能一并实现;
✨ AI办公
1、Sheet+
还在花费几小时在电子表格上手动输入数据?一字一句地敲?对于时间成本可不划算,而这时候Sheet+就有了用武之地!
Sheet+是一个创新的AI-powered工具,它在短暂的几秒钟内,就能将文本转换为准确的 Excel和Google Sheets公式,可以帮助你节省时间,简化电子表格工作;
Sheet+最大的特点就是它的易用性,即使你不是Excel或Google Sheets的专家,你也仍然可以使用Sheet+轻松创建复杂的公式~
2、Tome
Tome是一个人工智能生成式平台,它使用多种大语言模型在后台进行大量查询,以满足用户的演示提示;
Tome平台的最大特点是只需要用户输入一句话,就可以自动生成完整的PPT,包括文字和图片,可以极大地提高制作PPT的效率;
此外,Tome平台还提供了丰富的模板库、自定义设计、大量的素材库和多语言支持等功能,使得用户可以根据自己的需求和风格制作出高质量的PPT。
而且Tome已经通过与OpenAI的投资者关系获得了GPT-4使用权限,这使得Tome平台在语言处理方面更加精确和高效;
3、Prezo
Prezo 是一个人工智能驱动的软件平台,旨在帮助用户快速高效地创建专业级幻灯片,使用者可以通过拖拽来创建富有表现力的PPT,非常具有动态效果和视觉吸引力;
Prezo还提供了一系列自定义AI功能,可智能生成和推荐布局、字体、颜色和图片等元素,允许用户定制幻灯片以适应其品牌的外观,让用户可以在很短的时间内创建演示文稿~
✨ AI配音
1、Murf.ai
Murf.ai是一款AI启用的文本转语音工具,可以让用户为视频和演示生成“和真人一样”的配音;
可以帮助我们创建涉及语音配音的不同类型的内容,如视频、广告和播客,该工具提供了120多种文本转语音的语音,可以在20多种语言中选择,并通过自定义文本、语音、图像和镜头来个性化这些模板;
Murf AI可以轻松为讲解视频、产品演示、电子学习视频、有声读物和播客制作画外音,而且还允许用户克隆自己的声音或其他人的声音;
2、Azure
Azure是微软推出的云计算服务平台,其中就包含AI配音功能;利用Azure的AI配音功能,用户可以将文本转换成自然流畅的语音,实现自动语音合成。
浏览器进入Azure官网,注册登录后即可得到免费试用的机会;
Azure其中的配音功能通过自然语言处理技术为用户提供了高质量的文本转语音服务,满足了用户在语音转换方面的需求;
操作也比较简单,在左边输入需要配音的文字,右边则调整各种设置,最后点击播放即可;
3、XAudioPro
XAudioPro是一款先进的在线音频实时剪辑转码工具,兼备专业化与便携化,能够快捷高效地完成音频的各种处理操作,而且也支持配音功能,提供的音色也是非常丰富;
直接点击“开始使用”后选择“AI配音”功能,在文本框输入需要配音的文字,然后选择音色、语速等各种设置,生成配音后下载即可;
✨ AI视频
1、Runway Gen-2
还在为拍摄视频发愁?现在你只需要用文字描述你脑海中的画面,就能自动生成高清晰度、高质量的视频!这就是Runway的最新研究成果——Gen2!
Gen-2是一个多模态的人工智能系统,可以生成带有文本、图像或视频剪辑的新颖视频,8种视频模式自由选择,只需要打字或上传图像就能生成逼真的合成视频~
2、Opus Clip
Opus Clip 是一款生成式 AI 视频工具,可以将你的长视频重新调整为短片;
它通过 AI 分析你的视频,提取最引人注目的亮点,并将它们重新排列成具有凝聚力的病毒式短视频;
Opus Clip的优点在于,它可以自动识别视频中的精彩片段,提取出亮点,并将它们无缝地重新排列,制作成可以单独存在的吸引人的短视频;
此外,它还能自动添加字幕、调整视频布局、平滑过渡效果和添加强有力的结尾呼应;
3、Deepbrain
Deepbrain是一款能够快速、轻松地创建 AI 生成视频的工具;
只需要准备好你的脚本并使用文本转语音功能,就能在短短5分钟内获得你的AI视频,你可以轻松找到最适合自己品牌的定制AI头像,并使用直观易用的工具进行视频准备、拍摄和编辑,从而节省大量时间和成本;
总结了一下,目前主流的AI主要有下面几个领域:
机器学习(Machine Learning):机器学习是一种人工智能的分支,通过数据和算法训练模型,使计算机能够自动学习和改进。常见的机器学习算法包括决策树、支持向量机、神经网络等。
深度学习(Deep Learning):深度学习是机器学习的一种特殊形式,利用神经网络模拟人脑的神经元结构,实现对复杂数据的学习和理解。深度学习在图像识别、语音识别、自然语言处理等领域取得了重大突破。
自然语言处理(Natural Language Processing,NLP):自然语言处理是研究计算机与人类自然语言之间交互的一门学科。它涉及到语音识别、文本理解、机器翻译、情感分析等技术,使计算机能够理解和处理人类语言。
计算机视觉(Computer Vision):计算机视觉是让计算机能够理解和解释图像和视频的技术。它包括图像分类、目标检测、人脸识别、图像生成等领域,广泛应用于安防监控、医学影像分析、无人驾驶等领域。
语音识别(Speech Recognition):语音识别是将语音信号转换成文本的技术。它通过分析声音特征和语音模型,实现对语音的识别和理解。语音识别技术广泛应用于语音助手、语音控制、语音翻译等领域。
抠图改图王
集AI抠图、AI扩图、图片编辑、图片特效、图片修复等功能于一体的全能软件。
它的AI扩图功能提供很多深度模型,上传图片或者直接拍图,均可以快速生成想要的图片效果,质量很不错,非常精致。
导入图片后,选择扩图比例,稍等一会,APP便会给出最后的扩图效果,背景、服饰等都会配合原图特点,达到更精致的画面效果。
如果不满意的话,还可以重新扩图,直到满意为止,最后保存下来即可。
一个在线智能抠图网站,它可以通过AI识别出人物背景,自动抠图,生成透明选区,还能自己按需求选择适合的背景。
网站的抠图技术很高超,连头发丝边缘都能抠取出来,效果很好,而且操作很简单,可以说是傻瓜式抠图,抠图速度也特别快。
可本地架设服务
算力平台
国内算力公司排名前十的企业分别是:腾讯、阿里巴巴、中国移动、抖音、华为、美团、蚂蚁科技、比亚迪、拼多多、京东。
我之前演示的内容都是在腾讯的高性能服务器上所搭建演示的,如果是本地处理的话那将会超级的慢。
百度虽然不在此列,但是百度所提供的【千帆】大模型服务确实实实在在的比较强大。可能做的广告还是少一些吧,但是千帆模型的能力还是可圈可点的。
提问:我是一位程序员,有什么好未来发展方向推荐一下。
回答:
作为一位程序员,您的未来发展方向是多种多样的,具体取决于您的兴趣、技能、经验以及市场需求。以下是一些建议的未来发展方向,您可以根据自己的情况进行选择:
- 人工智能与机器学习:随着人工智能和机器学习技术的快速发展,相关人才的需求也在持续增长。您可以学习相关的算法、框架和工具,成为该领域的专家。
- 云计算与大数据:云计算和大数据技术已经成为企业数字化转型的关键技术。如果您对处理海量数据、分布式系统和云服务平台感兴趣,这个方向将是一个不错的选择。
- 前端开发:随着Web应用的日益普及,前端开发的需求也在不断增加。您可以专注于提升JavaScript、HTML、CSS等前端技能,同时学习前端框架和库,如React、Vue等。
- 移动开发:移动应用市场的持续增长为移动开发者提供了广阔的发展空间。您可以学习iOS或Android开发,掌握原生或跨平台开发技术。
- 后端开发:后端开发是构建稳定、可扩展和安全的Web应用的关键。您可以深入学习服务器端编程语言(如Java、Python、Ruby等)和框架(如Spring、Django、Ruby on Rails等)。
- 网络安全:随着网络攻击的不断增多,网络安全领域的就业前景十分广阔。您可以学习网络协议、加密技术、漏洞分析和防御策略等网络安全知识。
- 嵌入式系统与物联网:嵌入式系统和物联网技术在智能家居、工业自动化等领域有广泛应用。如果您对硬件编程和嵌入式系统设计感兴趣,这个方向将是一个有前景的选择。
- 游戏开发:游戏行业是一个充满创意和挑战的领域。您可以学习游戏引擎(如Unity、Unreal Engine等)和游戏设计原理,参与游戏开发项目。
- 区块链技术:区块链技术是一个新兴且具有颠覆性的领域。如果您对分布式系统、加密算法和智能合约感兴趣,可以考虑深入研究区块链技术。
- 技术管理与领导:随着经验的积累,您可以考虑向技术管理或领导岗位发展。这需要您不仅具备技术能力,还要具备良好的沟通、协作和领导能力。
在选择未来发展方向时,请务必关注市场趋势和行业需求,以便做出明智的决策。同时,持续学习和提升技能也是实现职业发展的关键。
回答的很全面,我们再来看看其它平台的。
回答:
程序员是一个非常重要的职业,因为他们是推动技术进步的关键人物。以下是一些程序员可能感兴趣的发展方向:
- 技术管理:如果你对领导和管理团队感兴趣,那么技术管理可能是一个不错的选择。你可以担任团队领导,负责指导团队成员,确保项目按时完成,并满足质量要求。
- 产品管理:如果你对理解客户需求,制定技术战略,并确保这些战略得到实施感兴趣,那么产品管理可能是一个好选择。产品管理不仅需要技术知识,也需要对市场和商业有深入的理解。
- 咨询:如果你喜欢提供建议和解决方案,那么咨询可能是一个好选择。你可以为各种公司提供技术建议,帮助他们解决各种问题。
- 创业:如果你有创业的梦想,那么成为一名程序员可以为你的创业梦想奠定基础。你可以开发自己的产品,或者与其他人合作开发新产品。
- 教育:如果你喜欢教授别人新的知识,那么教育可能是一个好选择。你可以成为技术讲师,为学校、企业或个人提供编程培训。
- 研究:如果你对深入了解新技术和科学感兴趣,那么研究可能是一个好选择。你可以在大学或研究机构进行研究工作,探索新的技术趋势和应用。
- 跨领域合作:除了以上提到的专业方向,你还可以考虑与其他专业人士合作,如设计师、市场营销人员等一起工作,这样可以充分利用你的技术知识和创新思维,创造出更具影响力的成果。
无论你选择哪个方向,都需要不断学习新的技术和工具,保持对编程领域的关注和热情。这将帮助你在职业生涯中不断进步,并在相关领域取得成功。
两者可以自行判断回答的如何。
AI大环境下——大专生新工作方向
冲击肯定是有的,但是前途依然是一片光明,AI代替了很多工作岗位,生成的工作岗位也是非常的多,仅仅说一个对话功能,就会有无数个大模型需要去训练,那么主推第一个工作岗位就是人工智能训练师,在上文我们已经看到了,这个有一定的难度,适合少部分的大专学生,那么大多数的计算机类大专生适合做什么呢?
AI大数据标注员
AI大数据标注员的主要工作内容包括以下几点:
- 数据分类:从给定的选项类别中选择数据对应的分类。一张图可以有很多分类,需要按照项目需求仔细选择。
- 图片框选:按照要求使用规则选框,框选出相应的物体,如道路行人和车辆等。
- 区域标注:例如在自动驾驶图片数据中,需要识别出道路行驶区域,并使用不规则多边形进行框选标注。
- 图片描点:对图片数据进行关键点的描点标注,例如人脸特征点描点等。
此外,AI大数据标注员还需要根据项目标注规则和要求,在标注平台上利用标注工具对文本、图片、语音、视频等数据进行归类、整理、编辑、纠错、批注和打标签。他们需要能够使用标注工具,对数据内容进行不同方式的标注,这些数据标注工作都是为了帮助人工智能模型更好地理解和识别数据。
AI大数据标注员需要了解不同行业的数据标注规范和要求,以确保标注的准确性和一致性。他们还需要具备一定的行业知识和背景,以便更好地理解数据内容和进行标注。
StableDiffusion/Midjourney AI作画师
Stable Diffusion AI作画师的工作内容主要包括利用Stable Diffusion这种基于随机微分方程的图像生成方法,根据输入的文字描述或图像信息,生成相应的图像。
具体来说,他们可能需要通过反复地扩散和收缩图像,使图像的细节逐渐变得模糊和不清晰,然后再通过反向操作,逐渐恢复图像的细节和清晰度,从而生成具有独特视觉效果的新图像。此外,他们也可能需要对生成的图像进行后期处理,以满足特定的需求或提高图像的质量。
同时,Stable Diffusion AI作画师还需要不断学习和掌握新的图像处理技术和方法,以保持其作品的创新性和竞争力。他们还需要与其他相关人员(如设计师、艺术家、客户等)进行有效的沟通和协作,以确保生成的图像符合需求和期望。
请注意,以上内容只是对Stable Diffusion AI作画师工作内容的概括性描述,具体的工作内容可能会因不同的项目、需求和团队而有所不同。
智能系统设计——低代码开发工程师
现阶段的低代码平台特别的多,原本还只有金蝶和用友,现在华为、阿里、腾讯、甚至网易也有了自己的低代码开发平台,仅仅说网易这个吧,现阶段融入了AI的工具,效率又快了很多,并且对于人员要求也比较低,也就是创建一个逻辑性的数据库,表的操作直接都是一键生成,相当的便捷。
现在还在活跃期,活动还有呢。
千帆的也有
工作岗位还是非常多的,由于时间问题,今天先简单介绍这里,后面我们可以深入到某个岗位去探讨一下具体工作细节。