面试真题

简介: 汇总多套AI与后端技术面试题,涵盖RAG、微服务、JVM、分布式锁、MySQL优化、大模型部署等核心技术点,深入考察候选人项目经验、系统设计能力及对AI工程化的理解。

第1套

第一轮

1.自我介绍

2.MySql里面如何查询慢sql

3.你是怎么理解RAG的知识增强

4.传统知识库和RAG知识库有什么区别

5.智能体里面的路由是怎么去理解的

6.多轮会话的意图转换是怎么去分发的

7.会话上下文满了是怎么处理的

8.这个AI模块是有多少人在做

9.MCP服务端

10.用户信息查询里面,如何获取到用户id的

11.有没有了解到上下文的缓存,既要保证聊天上下文,还要保证会话的成本足够的低

第二轮

1.还是自我介绍

2.你觉得难度最大的项目

3.你的这个路由意图分析是怎么做的

4.项目做了多久

5.项目的难点在哪里

6.你是怎么去学习相关的技术的

7.有没有使用到AI编程工具去辅助开发

8.AI工具用到了什么模型

9.有没有处理一些并发问题

10.有没有参与过数据分析

11.什么时候毕业,为什么离职,现在工作不好找吧,找工作你会考虑哪些方面

12.团队组成是什么样的,工作节奏是怎么样的,小版本发布是固定时间吗

13.发布中遇到问题,你们是怎么处理的

14.还有什么需要了解吗

第三轮

没录音,也没问什么问题,只记得问了说笔试题难不难,说是笔试题是根据简历AI生成的


第2套

1、先做个自我介绍

2、项目上线了嘛?

3、有多少个用户?是对外的嘛?

4、里面集成了一些AI的能力是吗?

5、AI是你自己搭建的嘛?

6、都用了哪些模型?是做了量化的对吧?

7、是什么样的一个配置?能达到怎么样的一个并发?

8、大模型的并发达到多少?100token?

9、大模型的算力?

10、大模型的并发量是怎么去计算的呢?

11、ToolCalling工具这一块调用的是什么?

12、服务是怎么提供工具给到大模型的?(ToolCalling)

13、实时数据是怎么给到大模型调用的?(ToolCalling)

14、图片模型,文生图,图生文你了解过多少?

15、有没有设想过你的文生图是能够做到怎样的?(之前有没有设计过、用在什么场景上)

16、你有用过哪些AI工具

17、有用Cursor去写代码嘛?

18、向量知识库这一块你有深入了解过嘛?用的是哪个向量知识库

19、Agent这一块你有了解嘛?

20、能不呢说一个具体的你负责的比较核心的,然后有一定的技术栈复杂度的?

21、有没有去做Agent的编排?

22、有没有了解过__define__?

23、用户在实际使用时,在响应上,在体验上怎么样?响应是实时流的是吗?

24、假设100个并发翻10倍呢100倍呢?

25、压测的时候怎么知道服务器的瓶颈呢?或者暴露出来的问题呢?

26、有做过链路的性能分析这一块嘛?

27、现在住在哪里?

28、上家公司什么原因离职?

29、如果让你接触通讯、石油类的项目,你会有什么想法?

30、工作上可以要你紧急配合,你会怎样?(问加班)

31、你有什么想问的嘛?

32、你之前有带过团队嘛?

33、你未来的发展方向呢?要成为技术的leader?走管理方向?带带团队?


第3套

1、自我介绍

2、Javajdk1.8jvm组成

3.平时有遇到jvm调优吗

4.CPU飙增,k8s该怎么解决

5、你对于这个方面解决的思路是怎么样的

6、你觉得这个CPU陡增是因为什么原因导致的呢

7、除了你前面说的这些,还有什么情况吗

8、流量激增该怎么解决

9、如果是用户量上来了,你怎么解决

10、Java你有用到反射的应用吗

11、你平时有用反射来做一些自定义的东西吗

12、多线程的参数,以及你在项目中用到的解决多线程的问题

13、你有用到线程池解决什么问题呢

14、为什么不追加消费者

15.多线程你了解

16.线程和进程的区别

17.http握手的过程

18.在线聊天wobsecket,通道断了,降级策略

19、有理解什么是长轮询和短轮询

20、你有没有哪个项目数据量是比较大的,是多少

21、假设你的订单表每天都是上千万的,你会怎么处理

22、那你怎么解决条件查询这个问题

23、你是根据ID分表的,假设我要查询某个人的订单,你是怎么查询的

24、你说es存储每天上千万数据,那你为什么还要分表呢

25、你说一下数据库索引失效的场景

26、假设索引匹配了,最左匹配原则也遵守了,但数据库依旧没走索引,是为什么呢

27、有没有了解过区分度的概念

28、你这有做到ai智能问答,你是怎么多到自然语言识别的

29、你能讲一下你最近这个项目的整体架构吗

30、你的知识来源是怎么来的

31、你是怎么切割那些文档的

32、你的es向量知识库是自己搭的吗

33、你怎么解决数据量大要存入向量知识库的问题的

34、你搭了es向量知识库之后是怎么测评的,怎么定义回答的是满意的

35、匹配度怎么计算,可以量化吗

36、你的意图识别层是怎么做的

37、你的意图识别层从软件架构方面来讲是怎么设计的

38、那你们意图识别的准确率怎么评测

39、你有没有听过aicoding的模式

40、你有没有试过输入一个需求文档,后面的编写,测试,到落地都让ai来做

41、如果要做这个事情,你有什么思路

42、你有什么想要问的吗


第4套

(非外包,想招个能带团队做AI的) (没有问八股和业务)

1、自我介绍

2、详细了解一下项目

3、这个模块是你负责的还是只完成了一部分?

4、中间有搭载其它中间模块吗?

5、有建立自己的知识库吗?

6、那你们现阶段是直接调用commit那个ollama大模型吗?

7、智能商品推荐这块,没太听清。

8、怎么拆解让AI知道推荐哪个商品给你

9、之前公司在重庆

10、前端开发有接触吗

11、项目周期半年左右,是做外包还是自研?

12、之前有带过团队吗? 团队组成怎么样的

13、如果让你带团队能负责吗?

14、假设你本身是一个管理者的话,开发进度滞后了,甲方又频繁变更需求,怎么处理?

15、怎么看待加班呢?是自愿加班吗?

16、如果项目你作为负责人,你自身要开发,还要带领团队开发,怎么协调?

17、之前的团队怎么样?

18、这边你还有什么想了解的吗?


第5套

1.自我介绍

2.springai在你的项目怎么用的

3.大模型准确率,并发率是多少

4.说说你对langchain4j的了解

5.面试官介绍langchain的好处,自己家在用langchain

6.springai很多bug你怎么解决

7.大文件导出到Excel具体怎么做

8.你3年做了那么多项目吗?

9.说说你项目的难点、亮点,技术栈用了什么来解决什么问题


第6套

1.自我介绍

2.比较有亮点的模块?讲ai了

3.怎么去验证或者标准去达到商用?

4.知识库的来源?

5.你刚刚说的命中率,怎么构建向量的?讲一个具体的例子

6.关于用户的存储没有高频问题?上下文?

7.文本量可控吗?是怎么样的?项目上线了,

8.有其他项目

9.线上故障排查

10.你刚刚说大文件导入导出导致oom怎么解决的?

11.多久会版本迭代?

12.平常的开发的流程是怎么样的?

13.java场景题:投放广告,传入广告素材:图片,视频加一些H5素材,在抖音也会看到,点击进去可以看到广告商落地页,此时用户提交资料,购买,锁单;对于用户我们也会做风控判定(手机号),手机号黑名单库我们有1000w级别,用户请求量是100w级别,这时候想快速得到用户是否是黑名单,在200ms,怎么实现

14.你刚刚的那个误判是怎么解决的

15.离职原因?

16.你有什么想问的?


第7套

1. 自我介绍

2. rag的原理是怎样的

3. 说下为什么用混合检索

4. ai的片段不对时,你是怎么去调优的

5. 还有其他的ai使用案例呢

6. 说一下java中的并发

7. 公平锁怎么实现

8. 说一下java代码里怎么实现乐观锁

9. spring里怎么解决循环依赖的

10. 事物在spring中怎么使用,还有事务失效的场景

11. mysql怎么实现主从架构

12. 说一下你对redis的高可用的理解

13. redis分片时,键是怎么设计的

14. 你有主导过功能到上线吗

15. 说一下之前做的功能(从开头到上线)

16. 预约挂号redis怎么同步到数据库的

17. 消息幂等性你是怎么解决的

18. 数据库里的字段不能做唯一标识,你怎么优化

19. 后台管理系统,一个用户有很多角色,你怎么设计这个系统

20. 你有什么问题


第8套

1.自我介绍

2.你觉得微服务项目和单体项目的区别

3.你在使用微服务的时候为什么选择spring cloud alibaba

4.你还使用了什么其他的阿里的组件

5.你可以自己实现一个分布式锁吗

6.redission锁的主要目的是什么?

7.你在哪些业务上用了redission分布式锁,做了哪些事情

8.这个优惠券超领问题除了使用redission分布式锁来解决,还有其他方式吗?

9.悲观锁和乐观锁的区别和原理

10.你在哪个业务中有用到sync呢

11.你这个购物车的数据存在哪

12你能讲一下你这个购物车的前后端执行流程吗

13.你对cookie了解吗

14.你会前端吗

15.你对js,css了解吗

16.你对jvm,进程这些熟吗

17,jvm的内存模型

18.一个方法的运行,它会分配到哪些区,开辟了哪些空间,做了哪些操作

19.你处理过一些生产故障吗

20.如果浏览器白屏了,你会怎么判断和处理

21.前端发请求,到后端没响应,怎么办

22.事务这块了解吗

23.我看你对ai好像有经验,你是这么做的,自己学的吗

24.用的它的apikey是吧,那你们做了什么封装呢,

25.你们这个除了对接大模型,自己还做了什么事情?

26.你这个项目上线了吗,有多少用户

27.你还有什么要问我的吗


第9套

1.自我介绍

2.从前端来一个请求到后端,你中间会经历哪些环节,以及中间件,包括网关,包括因为你是微服务架构,讲一下里面的细节

3.微服务架构里面,一个服务一个机器,他是有多个节点,你是怎么知道他是在哪一个节点,哪一个环节。

4.怎么做服务发现呢?

5.接口安全有没有一些思考和使用呢?怎么保证接口安全,比如说防刷、防篡改、防重放(不知道这个词对不对)?

6.没接触过线屏(线程屏蔽?)吗?

7.你觉得你做的成就感最高的一个项目是哪一个?

8.你的输入和输出是什么?(AI智能体对话)

9.有没有一些实际的案例,我想知道你一个真实的用户,他在你们这个AI里面会输入什么问题。最后返回给用户

10.中间的环节,就是怎么从文本到最后返回用户想要的结果。

11.这个系统搭建下来你遇到了哪些困难?

12.为什么选择用ollama直接搭建呢,你直接搭建肯定没有开源模型强啊

13.为什么ollama会更好一点,你会对模型做精调吗?

14.那你最后部署的是什么模型呢?

15.你的知识库怎么连接的呢,你的知识库的外挂的,它是怎么做分片呢?你的知识库的数据是什么样的,是纯文本的吗?还是怎么样的呢?

16.那你里面有图片的,那它的图片是怎么做的呢?它是怎么交给大模型的呢?

17.你怎么评价你这个大模型的效果,用户输入了我想要。。。的文本,你怎么评判这样的效果呢?评价的指标是什么呢?

18.如果你是端到端的评价,那是很难去迭代的,那你们是怎么去进行处理的?

19.你刚刚有提到关键词,那关键词有没有命中率啊?

20.那你觉得你从中学到了什么?(任何角度)

21.整个SpringAI这个,你主要负责哪个模块?

22.RAG外挂知识库,整个实现的流程?


第10套

1.自我介绍

2.工作项目哪个比较有挑战性,除了ai智能体,因为之做了几个月

3.签到要做补签怎么做

4.怎么去检查redis跟MySQL是否同步,有没有用到事务追踪

5.联合索引a,b,c,单独查找a或b或c会不会命中索引

6.缓存三剑客

7.有没有做限流,如果不用中间件怎么做限流的策略,编码层面来解决

8.nginx怎么做限流策略

9.springcloud怎么做配置,哪些参数需要做配置

10.mcp服务用在哪里,服务有几个mcp,mcp调用写的是客户端还是服务端

11.rag知识库增强的原理,es有算置信度吗

12.物联网连接除了用到mqtt协议,还有了解其他的协议了吗

13.之前公司加班严重吗,这边项目蛮赶的

14.有带过团队,主导项目吗

15.有攻克过什么关键技术吗(提了嘴ai项目被说其实也没有做的很深),是怎么去了解这些技术的

16.讲一下线程安全,除了加锁还有什么方法线程安全,threadlocal有了解吗

17.hashmap和hashtable的区别

18.hashmap初始容量是多少,为什么是16个

19.MySQL有几种锁,事务隔离级别

20.不靠修改事务隔离级别,在代码层面上怎么解决脏读

21讲一下jvm

22.平常说的gc有哪两种

23.创建一个方法,创建实例化一个对象,对象存在堆还是栈,什么时候会释放掉这个内存

24.用最多的排序是哪几个,冒泡的原理,排序了几遍,快排有用过吗

25.seata有什么模式,tcc用过吗

26.解释下CAP,你们是cp还是ap,知道nacos可以设置ap和cp吗。

27.你怎么理解现在的互联网,有了解我们岗位是做什么的吗

28.上一家公司工作环境怎么样,随便谈谈

29.给你offer最想从我们公司得到的是什么,除了物质上的,技术上的

30.未来职业发展规划

31.有什么想问的,离职原因


第11套

1.自我介绍

2.你在上个项目主要是一个怎么样的角色

3.你的团队都有些什么人

4.你们有用到网上开源的商城来做的吗

5.你有做过一些前端项目

6.你用过什么ai工具

7.cursor怎么个厉害法

8.你用的时候有觉得不好用的时候吗

9.你有没有写着写着就失控了

10.你是用的agent的吗,会不会写着写着会失控,

11. 你之前有做过前端的工作吗

12. 你们团队有测试吗

13.那你自己学习的时候有学过前端框架吗

14.数据库除了MySQL还有接触一些其他的吗

15.有用过mongoDB吗

16.MySQL和Oracle这些有时候不一样,你有做过了解吗

17.你平时关注it的哪一方面的信息

18.说一下你的智能体模块

19.rag用的哪个产品,是用的哪个开源的还是怎么样?

20.你们部署的时候使用什么样的硬件部署啊?

21.你这个基于rag的编程有了解吗

22.你知道结合ai编程工具和rag怎么用吗

23.你们公司沟通平时是怎么沟通的,有和客户沟通的机会吗

24.你们做项目之前,需求是怎么理解的

25.你们的开发周期是怎么样的,有没有周会、日会这样的。


第12套

1、自我介绍

2、用了什么SpringAI组件

3、讲一下智能体模块

4、用的什么平台

5、搭在自己的服务上吗

6、hashmap底层结构

7、hashmap扩容机制

8、链表什么情况转红黑树

9、什么情况下用linkedlist和arraylist

10、上边两个有什么区别

11、索引失效

12、数据库事务四大特性

13、Mysql默认隔离级别

14、线程池的作用

15、介绍一个你熟悉的项目

16、开发团队人员构成

17、讲一下优惠券

18、还有什么比较大的技术挑战

19、AI智能体主要解决什么问题

20、搭建平台是你主要负责吗

21、用过deepseek吗

22、用千问需要token计费吗

23、服务器什么配置

24、docker用过吗

25、日常开发中的开发规范

26、日常开发接口性能优化

27、项目最大的数据量是多少

28、订单表数据越来越多,用到分库分表吗


第13套

1、自我介绍

2、这个项目是做个自己用的还是企业运营的?

3、AI做的是那一块?

4、RAG用的框架是哪一个?

5、这个项目大概多少人做?

6、你参与AI模块,你自己做了哪些功能?

7、Toolcalling和API这一块你是怎么来搭建的?

8、你们做私有化部署时候你们的配置是怎样的?(我部署的是通义千问)

9、(继上一个问题)那你这边是参与了调用而已?

10、你们知识库里面的知识是通过什么途径引入进去的?怎么去维护的?

11、那你A客服模块这一块是怎么做的?

12、AI是如何来跟踪与患者的对话的?(下一次对话,如何记忆上一次的内容呢?)(这里的程序是怎么设计编写的?)

13、这个系统有没有上线在用?

14、目前用户量有多少?

15、简历上后面那两个项目也是在上一家公司的?

16、你在做这个项目,比较有技术挑战性的是哪一方面?

17、为什么要用Lua脚本来保持你并发的原子性呢?目的是啥?

直接用java代码去调用lua脚本?

18、你高并发可以用程序锁来解决抢号的问题啊,为什么要用lua脚本?

19、你对我们公司的业务有么有做过了解?

20、你们的知识库是自己推进去的吗?没有去做UI端维护之类的?

21、你们有没有做个那种大一点的,企业级别的知识库?

22、你介绍下SpringAI?目前我们公司还没有这个

23、你们是怎么来应用SpringAI的?

24、其他的你还想有什么要了解的吗?


第14套

分布式系统与并发

* 你对分布式锁熟悉吗?除了Redis锁,还了解哪些?

* 在什么场景下会选择使用哪种锁?

* 在一个大数据量异步复制的场景下,你会选择什么锁?

* 如果使用Redis锁,在主从切换时发生丢锁问题怎么办?

* 在需要保证强一致性(如复制银行账户或身份信息)的大数据量复制场景下,你会选择什么锁?

* 之前有用过Zookeeper锁吗?

* 如何保证后端接口的幂等性?

* 如何保证你用来实现幂等性的ID是唯一的?跨系统时如何保证?

* 有用过分布式事务吗?在这个场景里要如何保证数据一致性?

数据库

* 你对数据库锁(DB锁)熟悉吗?

* 在之前提到的大数据量复制场景中,如果用数据库锁(DB锁)应如何实现?

* 使用数据库行锁进行大数据量复制时,如何解决可能出现的死锁和性能下降问题?

* 当系统并发数超过1000导致性能问题时,你会如何优化你的设计?

* 如果因为资源和复杂度限制,不能采用分库分表的方案,还有其他方法吗?

* 如果引入Redis作为缓存,如何保证它和数据库的数据一致性?特别是如何保证强一致性?

* 如果通过数据库设计幂等表,这个表该如何设计?

* 使用版本号的方案如何保证唯一性约束?

* 在使用数据库做幂等处理时,如何处理业务执行超时的情况?

AI大模型

* 项目中提到的AI模型是如何部署的?硬件配置是怎样的?

* 你是如何量化评估一个模型效果不好的?你们的评估体系是怎样的?

* 为什么选择使用Ollama而不是VLLM来部署模型?

* 你是否了解Ollama和VLLM在部署模型时的性能差距?

* 在多轮对话中,如何保证模型能够准确识别用户的意图?

* “预约挂号”、“病症分析”和“化验单分析”这三个场景为什么不设计成不同的入口,而是要合并在一起?请分析拆开与合并各自的优劣势。

* 你们的算力设备(A100显卡)在运行时,负载和显存占用大概是多少?

* 线上环境一共运行了几个模型?

* 模型是跑在一张卡还是两张卡上?如何配置Ollama在两张卡上运行模型?

* AI这部分工作是你主要负责的吗?

项目架构与流程

* 请画一下“小精灵宠物医院”这个项目的架构图。

* 这个智慧医疗平台是SaaS服务吗?是给一家医院使用吗?

* 平台的整体数据量有多大?

* 为什么要进行分库分表?

* 请介绍一下你们项目的工作流程(从需求接收到发布)。

* 项目一共有几套环境?分别是怎样部署的?

* 你们使用什么软件进行项目管理?

个人背景与职业规划

* 你毕业的院校(烟台南山学院)是什么性质的学校?

* 你目前是在职还是已经离职?离职原因是什么?

* “小精灵宠物医院”这个项目开发了很久,是你入职后一直在做吗?

* 这个项目团队有多少人?

* 你上一家公司(旭和科技)是做什么性质的?团队规模多大?

* 从上上一家公司(四项联创)跳槽的原因是什么?

* 你在旭和科技的薪资待遇是怎样的?公积金如何缴纳?

相关文章
|
25天前
|
运维 监控 Shell
【自动化运维】告别手动搬运!编写Shell脚本自动备份与清理日志
本文介绍如何通过Shell脚本结合Crontab,实现服务器日志的自动备份与清理。每天凌晨2点自动压缩昨日日志并保存至备份目录,同时删除7天前的旧备份,防止磁盘占满。脚本具备目录创建、压缩打包、错误提示和日志记录功能,操作安全可靠,适合Linux运维新手实践自动化管理。
|
1月前
|
智能硬件
|
25天前
|
人工智能 自然语言处理 API
全面认识MCP:大模型连接真实世界的“USB-C接口”
MCP(模型上下文协议)是Anthropic推出的开放标准,被誉为AI时代的“USB-C”。它统一了大模型与工具、数据源的连接方式,简化集成,提升安全与扩展性,推动AI智能体实现复杂任务自动化,正重塑全球AI应用生态。
106 0
|
5月前
|
缓存 负载均衡 JavaScript
Nginx:高性能Web服务器与反向代理利器
Nginx:高性能Web服务器与反向代理利器
329 110
|
4月前
|
人工智能 JavaScript 前端开发
Github 2024-10-28 开源项目周报 Top15
本周GitHub热门项目涵盖Svelte、Open Interpreter、PowerShell等,涉及Web开发、AI助手、自动化工具等领域,Python、JavaScript为主流语言,展现开源技术活跃生态。(239字)
537 19
|
4月前
|
算法 API 数据安全/隐私保护
深度解析京东图片搜索API:从图像识别到商品匹配的算法实践
京东图片搜索API基于图像识别技术,支持通过上传图片或图片URL搜索相似商品,提供智能匹配、结果筛选、分页查询等功能。适用于比价、竞品分析、推荐系统等场景。支持Python等开发语言,提供详细请求示例与文档。
|
4月前
|
大数据 数据挖掘 定位技术
买房不是拍脑袋:大数据教你优化房地产投资策略
买房不是拍脑袋:大数据教你优化房地产投资策略
215 2
|
4月前
|
机器学习/深度学习 人工智能 JSON
AI应用工程师面试问题清单
本内容涵盖AI与大语言模型(LLM)基础原理、Prompt工程设计及实战项目经验。详解LLM预测机制、Transformer架构、Embedding应用,介绍Prompt优化策略如Zero-shot、Few-shot、RAG技术,并结合实际项目展示AI应用全流程开发与落地能力。
1131 4
|
人工智能 自然语言处理 API
吴恩达开源aisuite:简化AI模型调用的新工具 | AI工具
近日,著名人工智能学者吴恩达教授在推特上宣布了他的最新开源项目——aisuite。这款全新的Python包旨在简化开发者与各大AI模型服务商的集成过程,极大提升了应用开发的效率。aisuite的推出,无疑为人工智能领域的开发者带来了一个强大而便利的工具。
660 5
|
机器学习/深度学习 Serverless 定位技术
深入理解多重共线性:基本原理、影响、检验与修正策略
本文将深入探讨多重共线性的本质,阐述其重要性,并提供有效处理多重共线性的方法,同时避免数据科学家常犯的陷阱。
1067 3

热门文章

最新文章