从 RAG 到智能体:解决大模型“幻觉”的工程化路径探讨 (智能体来了——西南总部)
本文探讨如何通过RAG与AI Agent结合,工程化解决大模型“幻觉”难题。从原理到实践,详解检索增强、智能决策与生产部署路径,助力构建可信、可追溯、高准确性的企业级AI应用,释放大模型真实生产力。(238字)
拒绝“大海捞针”:如何在大规模知识库下保持RAG系统的尖端性能?
当RAG知识库从千页扩至十万页,搜索准确率竟下降12%。本文揭示“规模陷阱”成因:高维空间拥塞、语义模糊与信息过载,并提出混合搜索、上下文增强、路由模型等四步优化方案,助你构建高可靠的大规模RAG系统。
少样本链式思维:让AI推理像名侦探一样聪明
你有没有发现,有些AI能像福尔摩斯一样推理解题,而有些却像没头苍蝇乱撞?关键就在于能否让AI学会「思考过程」!通过少样本链式思维技术,让AI从「直接蒙答案」升级为「步步推理」,轻松解决数学、逻辑等复杂问题。想知道如何让你的AI变成推理高手?这里有答案。 #人工智能 #AI推理 #提示工程 #机器学习
百炼高代码应用的一点想法与实践
AgentScope 框架接触已经有一段时间了, 也写了不少,但对 AgentScope-Runtime 还没有详细看过。这次通过百炼高代码应用,从开发到部署完整跑了一遍,正好系统梳理了一次 Runtime 在整个链路中的位置。
宠物识别算法在AI摄像头的应用实践:从多宠识别到行为分析
基于边缘计算与轻量化AI模型,本方案实现多宠家庭中宠物个体识别、行为分析与健康监测。通过端云协同架构,在本地完成实时识别(延迟<50ms),保障隐私同时支持8只宠物同屏追踪。结合多模态特征与行为模式,准确率超98%,可联动喂食器、猫砂盆等设备,为宠物提供个性化智能照护,适用于家庭、托管中心及医疗场景,推动智能养宠迈向精准化、生态化发展。
智能宠物设备端侧AI技术深度解析:从模型压缩到实时响应
随着宠物经济兴起,智能设备迎来发展机遇。本文聚焦端侧AI在宠物识别中的应用,探讨模型压缩、硬件适配与性能优化技术,解决识别不准、响应慢等痛点,助力开发者打造高效、低功耗的智能宠物产品,实现毫秒级精准识别。
医疗票据OCR图像预处理:印章干扰过滤方案与代码实现
医疗票据OCR技术能自动提取票据中的关键信息,但在实际应用中面临多重挑战。首先,票据版式多样,不同医院、地区的格式差异大,需借助动态模板匹配技术来应对。其次,图像质量参差不齐,存在褶皱、模糊、倾斜、印章遮挡等问题,常通过超分辨率重建和图像修复算法处理。此外,手写体识别、复杂业务逻辑理解(如医疗术语和费用规则)以及数据安全与隐私合规要求也是技术难点。 为应对这些挑战,快瞳系统采用“OCR基础识别 + NLP语义修正”的混合架构,并结合深度学习模型(如CRNN、Transformer)来提升准确率和泛化能力。该技术能显著提升医保报销、保险理赔等场景的效率,是推动医疗信息数字化管理的重要工具。
算法入门:专题二---滑动窗口(长度最小的子数组)类型题目攻克!
给定一个正整数数组和目标值target,找出总和大于等于target的最短连续子数组长度。利用滑动窗口(双指针)优化,维护窗口内元素和,通过单调性避免重复枚举,时间复杂度O(n)。当窗口和满足条件时收缩左边界,更新最小长度,最终返回结果。
工具设计+动态检索:上下文工程如何让AI智能体像人类一样思考?
本文深入解析AI Agent时代的上下文工程,阐述其从提示工程的演进逻辑,剖析系统提示、工具设计与示例策划三大核心,并探讨长时程任务应对策略,揭示高效信息流管理对构建可靠Agent的关键作用。建议收藏细读。
语义检索翻车?可能是你的Embedding模型没选对!
本文深入解析Embedding模型在RAG系统中的核心作用,涵盖其原理、类型、选型策略及实战建议。选对模型可显著提升语义检索准确性与效率,避免成本浪费。干货满满,值得收藏!
vulnhub靶机实战_DC-3
本文介绍DC-3靶机渗透测试全过程,涵盖环境搭建、信息扫描、SQL注入、权限提升等环节。通过Joomla漏洞获取管理员密码,上传木马并提权至root,最终获取flag,是一套完整的渗透实战流程。
向量化与嵌入模型:RAG系统背后的隐形英雄
传统搜索只懂字面不懂含义,向量化技术让AI真正理解语言。从日常类比到实际案例,揭秘为何向量化技术是RAG的灵魂,以及如何用最少的努力构建最聪明的AI应用。
自一致性提示技术:让AI像老师一样反复确认
想让AI给出更准确的答案?试试自一致性提示技术!就像找三个朋友帮你做同一道数学题,然后看谁的答案出现最多次。这个看似'折磨'AI的方法,却能让它变得更聪明、更可靠。本文用轻松幽默的方式,带你掌握这个让AI自我验证的神奇技巧。
工程师的AGI落地指南:从基础概念到智能体开发的完整地图
本文系统讲解大型语言模型(LLM)核心技术与开发实践,涵盖基础概念、模型架构、训练方法、应用策略与伦理安全,适合AI开发者全面学习与参考。
硅基流动入驻阿里云云市场,核心API服务将全面接入阿里云百炼平台💐
2025年6月18日,AI Infra企业硅基流动与阿里云达成战略合作,加入“繁花计划”并入驻云市场。其大模型推理平台SiliconCloud核心API将接入阿里云百炼平台,依托灵骏智能计算集群为客户提供高效服务。作为国内领先的MaaS平台,SiliconCloud已集成百余款开源大模型,服务600万用户及众多企业。双方将在算力协同、行业解决方案等领域深化合作,推动AI生态发展。
零基础用 DevEco Studio 打造你的首个 HarmonyOS 应用,开启鸿蒙生态的创新之旅,实现你的技术探索梦想
在鸿蒙生态蓬勃发展的当下,越来越多的开发者怀揣着热情与创意,渴望投身于HarmonyOS应用开发的浪潮之中。
Deepseek官网太卡,教你白嫖阿里云的Deepseek-R1满血版
本文介绍了如何解决Deepseek官网卡顿问题,并详细讲解了阿里云提供的Deepseek-R1满血版解决方案。新用户可领取100万token,支持网页版和API调用。文中还提供了在Chatbox和Cursor中配置API的具体步骤,帮助用户轻松体验高性能的Deepseek-R1模型。适合初学者和开发者快速上手使用。
DeepSeek-R1满血版上线阿里云,新用户专享100万token额度,5分钟快速部署!
DeepSeek是当前AI领域的热门话题,尤其其大模型备受关注。由于网页版访问时常超时,推荐使用阿里云百炼的API调用方式快速体验。此方法仅需五分钟,提供100万免费Token,有效期至2025年7月26日。用户可通过注册阿里云账户、开通服务、创建API-Key、安装并配置ChatBox客户端等步骤轻松上手。测试结果显示,DeepSeek-R1在回答问题、解释数学概念及编写代码等方面表现优异。部署成本低、操作简便,是体验DeepSeek的理想选择。
阿里云百炼xWaytoAGI共学课DAY1 - 必须了解的企业级AI应用开发知识点
本课程旨在介绍阿里云百炼大模型平台的核心功能和应用场景,帮助开发者和技术小白快速上手,体验AI的强大能力,并探索企业级AI应用开发的可能性。
阿里云与零一万物达成战略合作,成立产业大模型联合实验室
阿里云与零一万物达成战略合作,成立“产业大模型联合实验室”。结合双方顶尖研发实力,加速大模型从技术到应用的落地。实验室涵盖技术、业务、人才等板块,通过阿里云百炼平台提供模型服务,针对ToB行业打造全面解决方案,推动大模型在金融、制造、交通等领域的应用,助力AI驱动的产业升级。
【最佳实践系列】高并发调用百炼语音合成大模型
本文介绍了阿里云百炼的CosyVoice语音合成大模型及其高并发调用优化方案。CosyVoice支持文本到语音的实时流式合成,适用于智能设备播报、音视频创作等多种场景。为了高效稳定地调用服务,文章详细讲解了WebSocket连接复用、连接池和对象池等优化技术,并通过对比实验展示了优化效果。优化后,机器负载降低,任务耗时减少,网络负载更优。同时,文章还提供了异常处理方法及常见问题解决方案,帮助开发者更好地集成和使用SDK。
本地数据调用析言的解决方案
本文介绍了通过API创建虚拟数据库,利用阿里云百炼/析言GBI平台实现数据查询、分析及可视化的方法。方案结合本地与云端资源,确保数据安全,同时提供灵活的API调用方式,支持按需调用析言的各项功能,有效降低已有本地数据库系统的迁移成本,提升数据分析效率。
开放应用架构,建设全新可精细化运营的百炼
本文介绍了阿里云智能集团在百炼大模型应用中的技术实践和运营经验。主要内容包括:1) RAG技术的背景及其在落地时面临的挑战;2) 多模态多语言RAG技术的研发与应用;3) 多模态多元embedding和rank模型的训练;4) 基于千问大模型的embedding和rank模型;5) 开源社区推出的GT千问系列模型;6) 模型应用中的可运营实践;7) AI运营的具体方法论和实践经验。通过这些内容,展示了如何解决实际应用中的复杂需求,提升系统的准确性和用户体验。
阿里云百炼模型训练评测
【7月更文挑战第1天】阿里云百炼提供一站式的模型开发服务,包括大模型训练、调用与部署。用户可查看剩余调用次数,点击开通服务以使用模型。计费基于调用量,涵盖推理、训练和部署。开通服务需同意协议,成功后将收到短信通知。评测显示,平台功能丰富,易用性强,能显著提升模型效果,且模型部署简便。建议优化数据预处理工具并增加实例教程。
通义千问2(Qwen2)大语言模型在PAI-QuickStart的微调、评测与部署实践
阿里云的人工智能平台PAI,作为一站式的机器学习和深度学习平台,对Qwen2模型系列提供了全面的技术支持。无论是开发者还是企业客户,都可以通过PAI-QuickStart轻松实现Qwen2系列模型的微调、评测和快速部署。
【MCP教程系列】在阿里云百炼上用Qwen3+且慢MCP,用AI重新定义资产管理效率
通义千问Qwen3通过MCP协议,在Agent中具备强大的工具调度与复杂任务拆解能力,成为构建复杂AI应用的核心引擎。以“基金助手”为例,集成且慢MCP服务后,可一键调用多源金融数据并动态组合分析工具,实现精准调度。在阿里云百炼平台上,只需4步即可构建一个“金融顾问”智能体:开通且慢MCP服务、新建智能体、添加MCP技能、测试效果。此外,还可增加提示词规范输出内容,完成更复杂的任务。
【开源剪映小助手】视频信息生成接口
视频信息生成接口(/v1/video_infos)是CapCut Mate核心API,支持多视频URL与时间线参数联动,生成标准化视频信息JSON。具备遮罩、转场、音量等丰富配置,采用智能截断容错机制(自动处理数组长度不匹配并告警),基于FastAPI+Pydantic构建,兼顾类型安全、性能与易用性。(239字)
【开源剪映小助手】文字样式接口
文字样式接口是CapCut Mate核心模块,支持关键词高亮、颜色/字体大小配置及文本装饰等富文本处理能力。采用三层架构,具备参数化配置、链式样式组合、智能继承与动态生成等特性,兼顾性能、可维护性与扩展性。(239字)
意图共鸣科技:AI双轨制,就是AI记忆链的房电分离
AI限速根源在于订阅制混淆“存储”与“算力”两笔账:前者如房租(固定成本),后者如电费(按需浮动)。双轨制将其分离——存储轨按月租用专属记忆空间,算力轨按Token用量付费。账平了,用户不被薅,平台不需限速,AI才能真正成为长期陪伴的数字伙伴。
OpenClaw 造神记录-01:从V1到V5的蜕变
《造神计划》是AI认知伙伴的持续进化实践:从V1工具链到V5完整认知管道,历经记忆构建、模块化、模式提炼、认知升级五阶段。以问题驱动、错误学习、用户反馈为引擎,实现启动提速85%、意图识别达90%、支持情绪感知与AI视频生成。开源项目xyvaclaw已落地V4,GitHub可体验。(239字)
Svelte无虚拟DOM、极致性能的现代高性能Web开发框架
Svelte是现代Web框架,通过编译时优化将组件转为高效原生JS,无需虚拟DOM。其5.0版引入Runes实现细粒度响应式,体积小、性能高。配套SvelteKit支持SSR与静态生成,生态丰富,中文文档完善,GitHub持续活跃。
构建AI智能体:五十八、智能工作流引擎:基于LangGraph的模块化内容创作系统
本文介绍了一个基于LangGraph工作流引擎、Qwen大模型和Gradio界面的智能内容创作系统。该系统采用模块化设计,将内容创作过程分解为8个可配置节点(主题分析、大纲生成、内容创作等),通过工作流驱动实现从主题输入到完整内容(文字+配图)的全自动化生成。系统特点包括:1)灵活可配置的工作流模板;2)强类型状态管理确保数据安全;3)多重容错机制(重试/降级方案);4)实时可视化流程监控。该方案适用于营销、教育等多个场景,展示了现代AI系统中架构设计、工程实现与用户体验的有机结合。
技术赋能医药全链路:AI 大模型应用在药企的落地痛点与破局之道
本文阐述AI技术在制药行业的深度变革,涵盖企业微信私有化部署、CRM系统智能升级、Data-Agent演进等全链路转型实践,结合RAG优化与幻觉控制方案,推动业务提效与合规双提升,展现AI赋能下行业模式的重塑路径。
JDK 21 字符串拼接最佳实践:场景化选择最优方案
JDK 21 字符串拼接需按场景选择最优方案:静态拼接用`+`,编译器自动优化;单线程动态拼接优选`StringBuilder`;格式化模板结合`formatted()`与文本块,提升可读性;集合拼接用`String.join()`或Stream;多线程场景选`StringBuffer`保障安全。
通义万相2.5-图生视频-Preview,模型使用指南
该表格展示了多个设计场景,包括模型选择、复制粘贴提示词与图片、一键生成视频等步骤。每个步骤配有详细描述及示意图,呈现了不同主题和风格的设计构思与实现方式。
Spring Boot 可视化监控
本文介绍了如何通过Spring Actuator、Micrometer、Prometheus和Grafana为Spring Boot应用程序添加监控功能。首先创建了一个Spring Boot应用,并配置了Spring Actuator以暴露健康状态和指标接口。接着,利用Micrometer收集应用性能数据,并通过Prometheus抓取这些数据进行存储。最后,使用Grafana将Prometheus中的数据可视化,展示在精美的仪表板上。整个过程简单易行,为Spring Boot应用提供了基本的监控能力,同时也为后续扩展更详细的监控指标奠定了基础。
钉钉对话机器人实现赞踩收集
本文介绍如何通过AppFlow记录钉钉AI对话卡片的用户反馈情况。首先确保已接入钉钉AI机器人,然后分三步实现:1) 修改钉钉AI消息卡片,添加点赞按钮并配置回调参数;2) 配置钉钉卡片点赞消息接收连接流,更新卡片状态;3) 设置日志收集节点,存储用户反馈数据。完成配置后,用户可在群聊中与机器人互动,并使用点踩点赞功能,反馈数据将被有效记录和分析。
AI编程:Coze + Cursor实现一个思维导图的浏览器插件
本文是小卷关于AI编程工具学习的第3篇文章,通过开发一个思维导图生成工具,详细介绍了AI编程的完整流程。从需求分析、插件选择(如Coze的TreeMind),到创建测试工作流、发布API,再到整合API和开发浏览器插件,最终实现了用户选中文字后生成思维导图的功能。文章展示了如何利用现有工具高效开发,并总结了AI编程的优势与未来趋势。
阿里云百炼|全妙:全面升级,助力伙伴推动产业落地
本次分享由阿里云智能集团资深产品专家秦璇主讲,主题为大模型在内容创作、数据分析、智能服务领域的应用。内容涵盖大模型市场概况、全妙产品介绍、部分案例及全妙建设重点与功能介绍。全妙产品包括妙策、妙笔、妙搜,旨在通过多模态技术和算法优化,助力企业和政府客户实现高效的内容创作和管理。
Java 流(Stream)、文件(File)和IO的区别
Java中的流(Stream)、文件(File)和输入/输出(I/O)是处理数据的关键概念。`File`类用于基本文件操作,如创建、删除和检查文件;流则提供了数据读写的抽象机制,适用于文件、内存和网络等多种数据源;I/O涵盖更广泛的输入输出操作,包括文件I/O、网络通信等,并支持异常处理和缓冲等功能。实际开发中,这三者常结合使用,以实现高效的数据处理。例如,`File`用于管理文件路径,`Stream`用于读写数据,I/O则处理复杂的输入输出需求。
计算机英文教材太难啃,Higress 和通义千问帮你
英文技术内容翻译难于理解,如何跨语言学习?通义千问结合 Higress 的多模型协议转换能力,可以通过配置插件获得推理模型基于内容理解后的精准翻译,点击本文手把手教你如何配置。
展望2024: 中国AI算力能否引爆高性能计算和大模型训练的新革命?
2023年是人工智能发展的重要转折年,企业正在从业务数字化迈向业务智能化。大模型的突破和生成式人工智能的兴起为企业实现产品和流程的革新提供了先进工具,引领产业迈入智能创新的新阶段。在这个新时代,企业不再仅关注如何增强智能化能力,而更加注重如何利用人工智能实现产品和流程的革新。