虚拟机安装(CentOS7)
准备CentOS7镜像及VMware Workstation(可从百度云下载),使用虚拟机创建工具新建虚拟机,参考知乎教程完成安装。默认登录用户为root,密码自设。详情见链接。
大模型应用开发中MCP与Function Call的关系与区别
MCP与Function Call是大模型应用的两大关键技术。前者是跨模型的标准协议,实现多工具动态集成;后者是模型调用外部功能的机制。MCP构建通用连接桥梁,支持多模型、跨平台协作,具备高扩展性与解耦能力;Function Call则依赖特定模型,直接解析意图并调用函数。两者在企业级系统中可协同工作:模型通过Function Call识别意图,转为MCP标准请求调用工具,兼顾智能解析与生态扩展。未来将趋向融合,形成“模型解析-协议传输-工具执行”的统一范式。
低代码IDEA启动项目
本教程介绍如何使用IDEA启动低代码项目Jeecg-Boot(Java+Vue3)。先启动后端SpringBoot项目,需初始化MySQL与Redis,配置application-dev.yml;再启动前端Vue3项目,安装pnpm依赖并配置代理,最后通过localhost访问系统,默认账号admin/123456。
MongoDB常用命令
本文介绍如何使用MongoDB存储文章评论数据,涵盖数据库与集合的创建、文档的增删改查、批量操作、投影查询、排序分页及更新修饰符等核心操作,帮助快速掌握MongoDB基本用法。
基于 RocketMQ LiteTopic 打造企业级 Session 管理
AI场景下,Session需满足低延迟、时序性、隔离性与上下文压缩四大要求。基于RocketMQ LiteTopic,实现会话持久化、断点恢复、多会话隔离与流量削峰,保障会话不丢失、可追溯、高并发稳定,助力企业级多智能体系统构建。
4-MongoDB索引知识
MongoDB索引基于B树结构,支持单字段、复合、地理空间、文本及哈希索引,有效提升查询效率,避免全表扫描,适用于等值、范围、排序与全文检索,显著优化大数据量下的查询性能。
实战演练:三步构建高可靠多智能体应用
本方案基于阿里云ECS与RocketMQ,搭建多智能体系统,实现天气查询与行程规划。通过一键部署资源、创建Topic/Group、发布Agent应用三步,快速构建异步通信的智能体协作系统,支持终端交互与消息轨迹追踪,高效验证任务执行流程。(238字)
大模型伦理与公平性术语解释
大语言模型中的偏见、公平性、可解释性、安全对齐、人类对齐与隐私保护是AI伦理核心议题。偏见源于数据,需通过去偏技术缓解;公平性要求无歧视输出;可解释性提升透明度与信任;安全对齐防止有害内容;人类对齐确保价值观一致;隐私保护防范数据泄露。六者共同构成负责任AI发展基石,需技术、伦理与法规协同推进。(238字)
线程池:故障梳理总结
本文从故障与技术双重视角,总结线程池满导致服务不可用的常见成因与规避方案。涵盖数据库慢查询、锁争用、DDL阻塞、连接池配置不当等典型问题,并结合真实案例剖析根因。强调fast-fail理念,提出超时控制、资源隔离、流控背压、谨慎重试等最佳实践,助力开发者提升系统稳定性。
RocketMQ for AI:重新定义 AI 应用通信范式
RocketMQ LiteTopic 专为 AI 场景打造,支持百万级轻量队列,实现会话级私有通道与细粒度订阅。LiteConsumer 动态管理节点订阅,免依赖 Redis 与广播,简化架构。原生支持断点续传、状态恢复,保障多轮交互可靠闭环,构建高效弹性通信新模式。(238 字)
SpringBoot@Configuration使用总结
被@Configuration标注的类视为Spring配置类,等同于XML配置文件,通过@Bean定义Bean。结合AnnotationConfigApplicationContext可启动IOC容器,加载并管理所有Bean实例,包括配置类自身,实现基于注解的容器配置与组件注册。(238字)
Redis集群伸缩,转移插槽失败
Redis集群出现节点配置不一致,提示slot 0处于importing状态。需登录对应实例,执行`cluster setslot 0 stable`命令,将异常slot状态恢复稳定,修复后方可进行 rebalance 操作。注意根据实际slot ID调整命令参数。
MongoDB实战演练
本项目基于SpringDataMongoDB实现头条文章评论功能,涵盖增删改查、按文章ID查询及评论点赞。通过MongoTemplate优化操作,结合索引提升查询性能,构建高效稳定的评论微服务模块。
XXLJob定时任务概述
定时任务是基于时间表达式调度执行的任务,适用于定时对账、超时取消等场景。单体架构可使用轮询、Timer、ScheduledExecutorService、Quartz或SpringTask;分布式环境下需解决重复执行、故障转移等问题,主流方案有XXL-JOB、Elastic-Job、Saturn和ScheduleX。
SpringCloud自定义注解
本文介绍Java自定义注解的实现与应用,结合Spring AOP与过滤器,演示日志处理、权限控制等场景。通过@Target、@Retention等元注解定义注解,并在Controller中结合AOP或拦截器实现登录验证等功能,提升代码可读性与复用性。(238字)
MongoDB相关概念
MongoDB是一款高性能、无模式的文档型数据库,支持海量数据存储、水平扩展与高可用,适用于社交、游戏、物联网等读写频繁、事务要求不高的场景。采用BSON格式,数据结构灵活,开发运维成本低,是Web2.0时代理想的数据库解决方案。
大模型推理与应用术语解释
简介:大语言模型核心技术涵盖推理、生成式AI、检索增强生成(RAG)、提示工程、上下文学习、代理、多模态学习与语义搜索。这些技术共同推动AI在内容生成、知识检索、智能决策和跨模态理解等方面的能力跃升,广泛应用于对话系统、创作辅助、企业服务与自动化场景,正重塑人机交互与信息处理范式。(239字)
全面认识MCP:大模型连接真实世界的“USB-C接口”
MCP(模型上下文协议)是Anthropic推出的AI“万能接口”,旨在统一大模型与工具、数据源的连接标准。它简化集成、提升任务处理能力,被誉为AI时代的“USB-C”。通过标准化通信,MCP让智能体可自主调用工具、执行复杂任务,推动AI应用迈向高效、安全、可扩展的新阶段。
基于 RocketMQ 构建 高可靠 A2A 通信通道
A2A协议由Google于2025年发起,旨在构建跨厂商AI智能体的标准化通信机制。通过支持gRPC、JSON-RPC及RocketMQ异步通信,实现多智能体高效协同。基于RocketMQ的实现方案提供开箱即用的高可靠通信,支持任务分发、流式交互与状态查询,助力构建开放、可扩展的多智能体系统生态。(238字)
MyBatis映射关系(1-1 1-n n-n)
本文介绍MyBatis四大关联映射:一对一(字段-属性映射)、一对多(如用户含多个角色,用`<collection>`)、多对一(如博客关联作者,用`<association>`)和多对多(通过中间类实现,如用户与部门)。解决复杂实体关系映射问题,提升数据查询效率与灵活性。
如何做好SQL质量监控
SLS推出用户级SQL质量监控功能,集成于CloudLens for SLS,提供健康分、服务指标、运行明细、SQL Pattern分析及优化建议五大维度,帮助用户全面掌握SQL使用情况,实现精细化管理与性能优化,提升日志分析效率与体验。
MongoDB单机部署
本文介绍MongoDB在Windows与Linux系统的安装启动方法,涵盖下载、解压、配置数据目录与端口,支持命令行和配置文件方式启动服务。详细说明如何通过mongo shell连接数据库,使用Compass图形化工具管理,以及Linux下部署、防火墙配置和安全关闭服务等操作,助你快速搭建MongoDB运行环境,适用于开发与生产场景。
一场FullGC故障排查
本文通过一次JDOS容器CPU告警排查,揭示了由Full GC引发的性能问题。通过对比机器与JVM监控,结合堆内存分析工具定位到大对象导致老年代频繁GC。进一步分析发现,Excel数据以List<Map>形式加载致内存膨胀,最终提出缓存优化与结构精简两种解决方案,并总结了线上CPU问题排查思路:重JVM监控、善用工具、精准定位代码根源。
大模型训练方法与技术术语解释
预训练、微调、RLHF、思维链等技术共同构建大模型能力。预训练打基础,微调适配具体任务,RLHF融入人类偏好,思维链提升推理,少/零样本学习增强泛化,指令微调优化交互,自监督学习利用海量无标注数据,温度控制生成风格,蒸馏实现知识迁移,缩放定律指导模型扩展。这些核心技术推动大模型在多领域智能应用中持续突破,实现从理解到创造的跨越。(238字)
大模型优化与压缩术语解释
模型压缩技术如知识蒸馏、量化、剪枝、稀疏化、低秩分解与权重共享,可显著减小大模型体积与计算开销。这些方法在保持性能的同时,提升部署效率,推动大模型在边缘设备上的广泛应用。
大模型评估与调试术语解释
困惑度衡量语言模型预测能力,值越低越好;过拟合指模型记住了训练数据却泛化差;泛化能力体现模型应对新任务的适应性;人工评估是生成质量的“金标准”;BLEU和ROUGE分别基于n-gram和召回率评估生成文本与参考的相似度;混淆矩阵用于分析分类错误模式。这些指标共同构成大模型评估体系,需结合使用以全面评价性能。
SpringCloud常见注解及使用说明
本文介绍了SpringMVC中@RequestMapping注解的作用及原理,它用于将HTTP请求映射到控制器方法,实现前后端接口路径对应。并通过@GetMapping等派生注解简化常用请求类型处理。
大模型基础概念术语解释
大语言模型(LLM)基于Transformer架构,通过海量文本训练,实现强大语言理解与生成。其核心包括注意力机制、位置编码、嵌入层等,支持万亿级参数与涌现能力,能完成翻译、问答等多任务,展现卓越泛化与推理能力。
详解RAG五种分块策略,技术原理、优劣对比与场景选型之道
RAG通过检索与生成结合,提升大模型在企业场景的准确性与安全性。分块策略是其核心,直接影响检索效果与生成质量。本文系统解析五种主流分块方法:固定大小、语义、递归、基于结构和基于LLM的分块,对比其优缺点及适用场景,助力构建高效、可信的RAG系统,尤其适用于金融、医疗等高精度领域。(239字)
什么是RESTful
RESTful是一种基于资源的API设计规范,主张用URI唯一标识资源,通过HTTP动词(GET、POST、PUT、DELETE)操作资源,实现统一、标准的接口行为。它解决了传统接口路径混乱、行为不一致的问题,具有结构清晰、易于理解与扩展的优势。
MyBatis常见配置
MyBatis配置优先级:方法参数 > resource/url > properties。支持缓存、延迟加载、自动生成主键等配置,可通过environments配置多环境,默认使用development。事务管理支持JDBC和MANAGED,与Spring集成时由Spring接管事务。
大数据与机器学习
大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。