速通大模型实习的我,现在怎么样?

简介: 这是一篇关于大模型工作、学习路线和实习经验的分享。作者通过自身经历说明了大模型相关工作的就业情况,指出应用开发和算法优化较易找到工作,但部分岗位对学历和论文要求较高。他从投递简历到拿到6份offer仅用两周,并选择了一家生活便利的公司。文中还提到学习路线可自学或付费获取笔记,强调效率与性价比。对于实习,作者描述了自由调优的工作内容及合理薪资范围。最后,他鼓励大家保持热爱,不被世俗束缚,享受生活。

写在最前面,首先感谢各位驻足观看,我受宠若惊,一共赚了三包薯片了,这期呢还是讲讲最近的去向,还有大伙比较关心的实习工作怎么样,好不好找工作,有好些人私信我,这里一块讲一下。

第一个问题,大模型好不好找工作?
还是那句话,看你喜欢做什么,大模型应用agent开发是蛮好找的,大模型底层算法调优蒸馏做小模型也好找(不过有点吃学历这个很多只要硕士),大模型做论文复现,写量化这种(很吃学历和paper,一篇还不够,要高端的paper,ccf-a这种算差不多)。

在5月2号我做完第一份简历,5月6号收到第一份offer,5月11号去北京时候我已经手握6家offer了,有初创,有小厂,有远程,有大厂,最后我选择了来到西二旗附近的一家公司,这个综合考虑下来房子很近,然后吃饭很方便,走路10分钟就到了(反正都是给人打工这个你综合考虑下,谁钱多的听谁的(这是第一),然后是生活质量(又不是非得给你打工了,因为上个破班导致自己心情不好伤心什么的,或者出现身体上的疾病听我的,你直接跑,跑之前先打老板一顿,真给你脸了),最后可能才是大厂的title之类的,没什么必要每天花在两三个小时挤地铁,这是浪费时间,极少数人能做到在地铁上看书,而且你还不一定抢得到座位(作为那极少人数天天看书的人而言,这种花在commute的时间定是无效的)。)

第二个问题,学习路线怎么搞?
这里我也打打广告吧,我也恰饭,你要有足够自律,你去boss上面,把岗位要求东西全学完,然后去投递,去面试,总找得到,

要是嫌太麻烦了,也可以加个微信请我喝杯奶茶嘛,我把自己总结的笔记,学习的项目,好用的网站,简历怎么写,都发给你。一杯奶茶也管不了多少钱,比你动不动报个知识星球大几百也便宜多了,你花个几十块,省点时间,也是极好的,因为后台确实私信的人比较多,我也看不大过来,不强迫,不推销什么,这里白嫖的方式我教给你了,这里恰饭还是恰的心安理得。

第三个问题,实习怎么样?
到了北京上了一天班了,总体还不错,奔着显卡来的,这公司,老板这里有十几块卡,最好的有4090,同时给我自由去调优,

具体大概就是实现就行,大模型一键实现,小模型多个联合做agent都可以,做出来就行了,比我先前干开发时候手搓轮子找前端测试联调还是有意思多了,今天上午搞了yolo,下午搞了RC4解密,晚上笔试AC了三道算法,也许明天就可以去跑模型了。大伙去了公司也许也是这样,先前我就说了,老板自己也不懂,面试他没有成体系的东西,就是什么培训课啊之类的,他们也是抄人家的,你还不如来我这要路线库库学,我也只学了两个月(我个人是很喜欢这个,很有意思,从早坐到晚一直学,而且本身有基础有开发经验),这种上来要个4980,我寻思你真把外行人当白痴啊,这东西能卖这么贵?我人看傻了,就算后面我书写出来了,有对应的课,我明确的说,我的定价估计都也只有几十块,(出版商要收钱,然后交税什么的,作者其实只能拿70%不到,还没自媒体接广告赚钱,都是为爱发电罢了(网文作者除外,斗破苍穹这种作者是赚了打钱了都)因为我写的书肯定是要写纯干货对应小白的,到时候大伙都来看看,人越多越好。)然后是工资部分了,这个跟你做开发只会更高,一般开发大概是1到200一天,算法一般是200到600左右,一天300多比较正常的,太低价格了你看到你自己都可以跟他说,你这个价招不来算法,招不到大模型,然后你可以享受到当那种当大爷的快乐(doge)。这里写的差不多了。

最后写点东西:
最后呢,大伙找不到工作也无所谓,推荐大伙天天喜欢做什么做什么,想打游戏就打游戏,你上不上班都要打游戏,你考不考得上研都要打游戏,为什么要因为这个剥夺自己打游戏的权力呢?不要被世俗所限制,讲到这里我不知道各位看没看过海边的曼彻斯特,

这电影讲了一件事,这主角因为哥哥死去回到故乡,通篇只有两个人在聊天,他和他侄子,他侄子问他,你为什么要离开这里,跑去很远的地方去当个修理工,他只是回忆,因为没关煤气导致烧死女儿,同时和妻子离婚最后终日烦恼郁郁寡欢索性离开伤心地方。你看完你就会发现这个主角啊,他困在过去了,每个人都有拒绝与自己和解的权利,每个人都有说不的权利同样的,你知道的,大胆去追求所爱所期望之物才算不辜负此生啊,那你为什么不去打游戏和朋友聊天呢?所以说啊,没什么好烦恼的,都无所谓的,后面可能更新频率会降低一点,因为要上班,然后下班之后我要做自己的软件,所以点点关注,想看我扯犊子你能最快的看到。

作者:wudangwangye(是本人转载)
链接:https://www.nowcoder.com/discuss/751565402894782464?sourceSSR=users
来源:牛客网

相关文章
|
10月前
|
人工智能 开发工具 git
一看就会的智能换颜项目教程!5分钟速通明星大模型开源项目一键部署
有了通义灵码的帮助,很多明星大模型项目实操过程中遇到的问题:查找错误、解释代码、优化代码、查找文档、代码补全等等都可以用通义灵码一键解决,而且准确率很高,加上灵活的实操环境,项目跑起来会非常高效。关键是通义灵码个人版还免费!
|
25天前
|
机器学习/深度学习 自然语言处理 算法框架/工具
实战 | Qwen2.5-VL模型目标检测(Grounding)任务领域微调教程
在目标检测领域,众多神经网络模型早已凭借其卓越的性能,实现了精准的目标检测与目标分割效果。然而,随着多模态模型的崛起,其在图像分析方面展现出的非凡能力,为该领域带来了新的机遇。多模态模型不仅能够深入理解图像内容,还能将这种理解转化为文本形式输出,极大地拓展了其应用场景。
1524 74
|
1月前
|
人工智能 负载均衡 数据可视化
10分钟上手全球开源模型冠军 Qwen3
阿里通义千问Qwen3在最新全球AI基准测试中智能水平位列全球前五,开源第一,且成本优势显著,推理成本仅为DeepSeek-R1的1/3、Claude 3.7的1/20。Qwen3支持119种语言,具备强大的代码和数学能力,同时提供思考与非思考两种模式无缝切换,适合复杂与简单任务。通过阿里云百炼平台,用户可在10分钟内快速搭建Qwen3模型服务,结合Cherry Studio客户端实现便捷交互。本文详细介绍了Qwen3的部署、体验及工具调用能力,帮助用户轻松上手。
653 78
|
1月前
|
数据可视化 API Swift
全模态图像模型Nexus-Gen对齐GPT-4o!同时搞定,数据、训练框架、模型全面开源
OpenAI GPT-4o发布强大图片生成能力后,业界对大模型生图能力的探索向全模态方向倾斜,训练全模态模型成研发重点。
165 17
|
1月前
|
Kubernetes 调度 开发者
qwen模型 MindIE PD分离部署问题定位
使用MindIE提供的PD分离特性部署qwen2-7B模型,使用k8s拉起容器,参考这个文档进行部署:https://www.hiascend.com/document/detail/zh/mindie/100/mindieservice/servicedev/mindie_service0060.html,1个Prefill,1个Decode。 最后一步测试推理请求的时候,出现报错:model instance has been finalized or not initialized。
155 1
|
25天前
|
人工智能 数据挖掘 API
基于neo4j数据库和dify大模型框架的rag模型搭建——后续补充
基于neo4j数据库和dify大模型框架的rag模型搭建——后续补充
154 21
基于neo4j数据库和dify大模型框架的rag模型搭建——后续补充
|
25天前
|
Java 数据库 Docker
基于neo4j数据库和dify大模型框架的rag模型搭建
基于neo4j数据库和dify大模型框架的rag模型搭建
257 35
|
28天前
|
机器学习/深度学习 人工智能 算法
大型多模态推理模型技术演进综述:从模块化架构到原生推理能力的综合分析
该研究系统梳理了大型多模态推理模型(LMRMs)的技术发展,从早期模块化架构到统一的语言中心框架,提出原生LMRMs(N-LMRMs)的前沿概念。论文划分三个技术演进阶段及一个前瞻性范式,深入探讨关键挑战与评估基准,为构建复杂动态环境中的稳健AI系统提供理论框架。未来方向聚焦全模态泛化、深度推理与智能体行为,推动跨模态融合与自主交互能力的发展。
108 13
大型多模态推理模型技术演进综述:从模块化架构到原生推理能力的综合分析
|
14天前
|
机器学习/深度学习 编解码 缓存
通义万相首尾帧图模型一键生成特效视频!
本文介绍了阿里通义发布的Wan2.1系列模型及其首尾帧生视频功能。该模型采用先进的DiT架构,通过高效的VAE模型降低运算成本,同时利用Full Attention机制确保生成视频的时间与空间一致性。模型训练分为三个阶段,逐步优化首尾帧生成能力及细节复刻效果。此外,文章展示了具体案例,并详细说明了训练和推理优化方法。目前,该模型已开源。

热门文章

最新文章