几周速通大模型实习,你需要做什么?

简介: 这是一篇关于转行进入大模型AI应用开发领域的经验分享。作者凭借自身两年开发经验成功转型,并详细列出学习路线:从Python语言、框架(如LangChain、Flask、FastAPI)到NLP、LLM微调,涉及强化学习、数据清洗、RAG调优等技术。他还提到论文复现、量化模型的重要性,以及高学历和顶会论文对进入顶级公司(如九坤、幻方)的帮助。文中提及面试经历和技术挑战,强调技术深度与努力的必要性。最后,作者鼓励读者坚持学习,并计划全平台发布教程。

那么我也是顺利收下几家offer了,没学多久,今天给一下具体路线,求别私信我(真想问问题,直接把问题写上去留个微信,动不动弹出来红点点,你总会去点他的。。),然后东西都是你感兴趣才能去做,你肯定难以接受一天爽学10几个小时。同时五一假期还不出门,连续5天高强度琢磨新玩意,所谓欲戴王冠,必承其重你知道的,光是走马观花肯定很困难。我给出你具体思路还是比较重要的。
首先确定走这一行,我的话有两年开发经验,有实习经验,然后直接转行,本身就有基础,计算机的知识是有迁移性质的。
我先讲讲大模型ai应用开发学什么吧,首选python语言->python框架(langchain,langgraph),这个东西就算比较新的了,然后flask框架搞搞,fastapi搞搞,差不多了,大胆冲,现在就是10年前的互联网,大模型接入应用层搞就对了。
大模型NLP,LLM微调,要学什么,这个鱼书,花书你看看,强化学习你看看,然后我先前写了怎么跑模型,你去试试,
装个cuda,用GPU,跑跑PT,SFT,混合损失函数,RL,DPO,差不多了,来加上个RAG,RAG调优,MCP来一个,数据集下载人家的这会大概率不够用了,怎么办,学一下数据清洗,召回,检索,怎么强制过滤,之类的那么微调的学的差不多了,搞两个开源模型开源项目,然后pytorch,transformer架构一写就直接冲,
然后是论文复现,量化模型,这个东西首先学历少说你来个9嘛,不是9那怎么着也得有个QS100,这种公司比如九坤,幻方之类的,人少,里面我可以说没一个差的,基本上都是大佬,有了学历不够,CCF-A之类的顶会的一二作,你整一手,那么大概有去面试的资格,里面会涉及到数学公式了,类似这样:贝尔曼方程(具体的不解释,因为你看懂了没什么屁用,快去刷抖音),

有幸面过一个公司,(四位面试官,同时面试,来自哈工大,加利福尼亚大学,港科技大学,清华大学,很友好,但是技术不够,直接被打傻了,问些听都没听过),这种进去的话,工资挺不错,大概是60w-300w不等,幻方也就这个价,除了字节头部高管,基本上鲜有年薪千万的,很感谢你看到这里,但是我推荐各位去试试,有详细的资料后面看看会不会发,上一期才100观看,打字都打了两小时,一度以为被限流了,后面琢磨人家是出去玩了,后面回来再emo??
最后放些图给各位增加些信心吧,如果有人看,我就接着写,后面我的agent会全平台发布,你在那个平台上都能看到我写的教程。

相关文章
|
2月前
|
算法 前端开发
速通大模型实习的我,现在怎么样?
这是一篇关于大模型工作、学习路线和实习经验的分享。作者通过自身经历说明了大模型相关工作的就业情况,指出应用开发和算法优化较易找到工作,但部分岗位对学历和论文要求较高。他从投递简历到拿到6份offer仅用两周,并选择了一家生活便利的公司。文中还提到学习路线可自学或付费获取笔记,强调效率与性价比。对于实习,作者描述了自由调优的工作内容及合理薪资范围。最后,他鼓励大家保持热爱,不被世俗束缚,享受生活。
|
2月前
|
人工智能 资源调度 监控
LangChain脚本如何调度及提效?
本文介绍了通过任务调度系统SchedulerX管理LangChain脚本的方法。LangChain是开源的大模型开发框架,支持快速构建AI应用,而SchedulerX可托管AI任务,提供脚本版本管理、定时调度、资源优化等功能。文章重点讲解了脚本管理和调度、Prompt管理、资源利用率提升、限流控制、失败重试、依赖编排及企业级可观测性等内容。同时展望了AI任务调度的未来需求,如模型Failover、Tokens限流等,并提供了相关参考链接。
231 29
LangChain脚本如何调度及提效?
|
2月前
|
机器学习/深度学习 存储 人工智能
浅入浅出——生成式 AI
团队做 AI 助理,而我之前除了使用一些 AI 类产品,并没有大模型相关的积累。故先补齐一些基本概念,避免和团队同学沟通起来一头雾水。这篇文章是学习李宏毅老师《生成式 AI 导论》的学习笔记。
276 27
浅入浅出——生成式 AI
|
2月前
|
机器学习/深度学习 人工智能 数据库
RAG 2.0 深入解读
本文从RAG 2.0 面临的主要挑战和部分关键技术来展开叙事,还包括了RAG的技术升级和关键技术等。
578 85
|
2月前
|
存储 人工智能 安全
MCP 规范新版本特性全景解析与落地实践
MCP Specification 在 2025-03-26 发布了最新的版本,本文对主要的改动进行详细介绍和解释
1075 145
|
3月前
|
人工智能 JSON 自然语言处理
除了MCP我们还有什么?
本文详细描述 agents.json ,涵盖了其背景、工作原理、与 OpenAPI 的关系等内容。
422 94
除了MCP我们还有什么?
|
Shell Linux Python
基于远程服务器安装配置Anaconda环境及创建python虚拟环境详细方案(一)
基于远程服务器安装配置Anaconda环境及创建python虚拟环境详细方案
5441 0
基于远程服务器安装配置Anaconda环境及创建python虚拟环境详细方案(一)
|
2月前
|
机器学习/深度学习 PyTorch 算法框架/工具
犬鼻纹识别是如何做到的?附代码示例
犬鼻纹识别技术利用深度学习与图像处理,通过手机等设备采集犬鼻图像,定位鼻纹关键点并提取有效区域。经灰度化、降噪等预处理后,输入残差卷积神经网络提取深度特征,形成代表犬鼻独特性的数值向量。最终,将特征与数据库比对,计算相似度完成识别。示例代码基于 PyTorch,包含数据预处理、模型训练及预测流程,实现高效精准的犬只身份认证。
|
2月前
|
机器学习/深度学习 文字识别 自然语言处理
OCR技术:解锁文字识别的无限可能
OCR(光学字符识别)技术是数字化浪潮中的关键工具,可将纸质文档、手写笔记或复杂背景下的文字图像转化为可编辑文本。本文从图像采集、预处理、字符识别到文本校正,全面解析OCR技术的原理,并探讨其在智能办公、智慧交通、便捷生活等领域的广泛应用。未来,OCR将与自然语言处理、计算机视觉等技术深度融合,推动智能化和综合化发展。通过开放生态系统和政策支持,开发者可探索更多创新场景,如古籍数字化、盲人阅读等,为社会带来更多价值。
273 57
|
2月前
|
SQL 存储 NoSQL
Flink x Paimon 在抖音集团生活服务的落地实践
本文整理自抖音集团数据工程师陆魏与流式计算工程冯向宇在Flink Forward Asia 2024的分享,聚焦抖音生活服务业务中的实时数仓技术演变及Paimon湖仓实践。文章分为三部分:背景及现状、Paimon湖仓实践与技术优化。通过引入Paimon,解决了传统实时数仓开发效率低、资源浪费、稳定性差等问题,显著提升了开发运维效率、节省资源并增强了任务稳定性。同时,文中详细探讨了Paimon在维表实践、宽表建设、标签变更检测等场景的应用,并介绍了其核心技术优化与未来规划。
290 10
Flink x Paimon 在抖音集团生活服务的落地实践
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问