|
2月前
|
人工智能 自然语言处理 监控
|

多智能体如何高效协作?AI Agent指挥官与AI调度官的实践方法

本文提出AI Agent“指挥官+调度官”协同治理机制,通过角色分离、统一调度与规则约束,解决多智能体系统中的任务冲突、资源争抢与决策分散问题,提升复杂场景下的可扩展性、稳定性与可解释性。

230 3
|
2月前
|
机器学习/深度学习 数据采集 人工智能
|

大模型应用:大模型参数调优:结合本地模型对比多种组合探索差异.7

本文系统解析大模型核心生成参数(如temperature、top_p、top_k、repetition_penalty等)的原理、作用机制与实践影响,结合Qwen1.5-1.8B本地模型实测,通过创意写作、技术问答、代码生成三类任务对比分析参数组合效果,并提供分场景调优建议与黄金配置方案,助力从“调参新手”进阶为“生成质量掌控者”。

258 21
|
5月前
|
存储 人工智能 前端开发
|

超越问答:深入理解并构建自主决策的AI智能体(Agent)

如果说RAG让LLM学会了“开卷考试”,那么AI智能体(Agent)则赋予了LLM“手和脚”,使其能够思考、规划并与真实世界互动。本文将深入剖析Agent的核心架构,讲解ReAct等关键工作机制,并带你一步步构建一个能够调用外部工具(API)的自定义Agent,开启LLM自主解决复杂任务的新篇章。

1005 6
|
11月前
|
存储 自然语言处理 前端开发
|

2025年大模型发展脉络:深入分析与技术细节

本文深入剖析2025年大模型发展脉络,涵盖裸模型与手工指令工程、向量检索、文本处理与知识图谱构建、自动化提示生成、ReAct多步推理及AI Agent崛起六大模块。从技术细节到未来趋势,结合最新进展探讨核心算法、工具栈与挑战,强调模块化、自动化、多模态等关键方向,同时指出计算资源、数据质量和安全伦理等问题。适合关注大模型前沿动态的技术从业者与研究者。

3334 9
|
11月前
|
Arthas 监控 Java
|

Arthas trace (方法内部调用路径,并输出方法路径上的每个节点上耗时)

Arthas trace (方法内部调用路径,并输出方法路径上的每个节点上耗时)

1636 10
|
1月前
|
机器学习/深度学习 自然语言处理 定位技术
|

大模型应用:循序渐进掌握CLIP:领悟训练推理过程的进阶特性.17

本文系统解析CLIP模型:从跨模态对比学习原理、零样本能力本质,到双塔架构、训练机制(InfoNCE损失、温度参数τ)与推理应用(分类/检索/标注),辅以多模板提示工程等实战技巧,揭示其“用图文相关性替代任务学习”的核心思想。

196 10
|
1月前
|
存储 人工智能 自然语言处理
|

大模型应用:从问题到答案:LlamaIndex RAG系统工作流程详解.15

本文深入解析LlamaIndex核心概念与实战:Document(文档封装)、Node(语义切分)、Index(向量检索)、Query Engine(端到端问答)、Retriever(精准检索)及Response Synthesis(智能合成),配套本地Qwen+MiniLM代码示例,助力RAG快速落地。(238字)

261 22
|
2月前
|
存储 消息中间件 人工智能
|

【架构模式】解构多智能体协作:AI Agent “指挥官”与“调度官”的双层治理实践

本文提出“指挥官-调度官”双层架构,解决多智能体系统中的意图漂移、死循环与资源竞争问题。通过职能分离,实现高并发、高可用的复杂任务协同。

281 3
|
3月前
|
人工智能 安全 网络安全
|

首批!通义千问、通义万相通过生成式AI安全国标符合性验证

喜报~

1678 12
|
5月前
|
文字识别 自然语言处理 API
|

同时斩获两个开源第一,超火的通义Qwen3-VL CookBook来了

Qwen3-VL开源发布后广受认可,登顶Chatbot Arena视觉榜与OpenRouter图像处理市场份额第一。支持文档解析、OCR、视频理解、3D定位等多模态任务,现推出详细Cookbook助力开发者高效应用。

1589 3
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
|

AIGC技术深度解析:生成式AI的革命性突破与产业应用实战

蒋星熠Jaxonic,AI技术探索者,深耕生成式AI领域。本文系统解析AIGC核心技术,涵盖Transformer架构、主流模型对比与实战应用,分享文本生成、图像创作等场景的实践经验,展望技术趋势与产业前景,助力开发者构建完整认知体系,共赴AI原生时代。

1037 2
|
7月前
|
存储 人工智能 自然语言处理
|

告别文字乱码!全新文生图模型Qwen-Image来咯

通义千问团队开源了Qwen-Image,一个20B参数的MMDiT模型,具备卓越的文本渲染和图像编辑能力。支持复杂中英文文本生成与自动布局,适用于多场景图像生成与编辑任务,已在魔搭社区与Hugging Face开源。

1329 2
|
1月前
|
前端开发 数据可视化 API
|

大模型应用:完整语音交互闭环:TTS+ASR融合系统可视化场景实践.22

本文介绍了一个轻量级TTS+ASR融合交互系统,基于HTML/CSS/JS前端与Python Flask后端,集成Whisper语音识别与pyttsx3文本转语音,实现“语音→文本→语音”闭环。支持浏览器录音、实时转写、语音播放及历史管理,无需依赖框架或网络,适合快速部署与二次开发。

234 18
|
2月前
|
人工智能 开发者
|

Qwen-Image又登顶啦!

Qwen-Image-2512登顶Hugging Face趋势榜榜首,并在AI Arena稳居最强开源图像模型!新发布的Qwen-image-edit-202511也在Chatbot Arena获开源第一、全球第九。双榜佳绩,技术再突破!

354 0
|
3月前
|
人工智能 自然语言处理 算法
|

6步走I 大模型备案《通关手册》

本文依据《生成式人工智能服务管理暂行办法》,梳理企业上线大模型服务所需的备案流程、材料及注意事项,涵盖“是否需备案”“六步备案法”“安全评估重点”“特殊行业提示”等内容,助力企业合规落地。

750 0
|
3月前
|
算法框架/工具 PyTorch
|

RTX5060Ti运行Qwen3-VL-8B-Instruct模型速度慢

470 0
|
3月前
|
JSON 人工智能 安全
|

Qwen Code 能力再升级

Qwen Code v0.3.0 正式发布!全面支持 Stream JSON、多语言界面切换,提升安全稳定与生态适配,助力开发者高效构建 AI 工具。欢迎体验并参与共建!

578 1
|
10月前
|
JSON 缓存 并行计算
|

NVIDIA 实现通义千问 Qwen3 的生产级应用集成和部署

阿里巴巴近期开源了通义千问Qwen3大语言模型(LLM),包含两款混合专家模型(MoE)235B-A22B与30B-A3B,以及六款稠密模型(Dense)从0.6B到32B不等。开发者可基于NVIDIA GPU使用TensorRT-LLM、Ollama、SGLang、vLLM等框架高效部署Qwen3系列模型,实现快速词元生成和生产级应用开发。

2217 8
|
27天前
|
数据采集 人工智能 搜索推荐
|

深度解析:GEO(生成式引擎优化)在医疗行业的底层逻辑与战略权重

GEO(生成式引擎优化)是AI时代医疗品牌赢得语义信任的核心战略。它通过结构化知识注入、语义权威构建与证据链强化,提升医疗机构在LLM输出中的引用率与专业可信度,将传统流量竞争升维为“语义主权”博弈。(239字)

235 11
|
2月前
|
人工智能 Java 开发者
|

Java接入AI大模型:从踩坑到顺滑落地的实战

本文分享Java开发者接入AI大模型的实战经验,从跨语言调用的坑到手动封装HTTP接口的繁琐,最终通过原生Java框架JBoltAI实现高效落地。该框架深度融入Spring生态,支持统一API调用主流大模型,提供高并发、熔断降级等企业级能力,助力Java团队零成本平滑集成AI能力,提升开发与运维效率。

266 1
|
2月前
|
人工智能 JavaScript API
|

【教案生成平台】实战教程二:接入 AI 大模型实现智能教案生成

一款基于 Vue 3 + Vite 的教师辅助工具,聚焦教案智能生成。输入课程主题,AI 流式输出完整教学设计,支持 Markdown 实时预览与 Word 导出,提升备课效率。核心技术涵盖流式 API 调用、提示词工程与文档生成,构建从输入到输出的完整 AI 工作流。

292 8
|
3月前
|
人工智能 前端开发 JavaScript
|

GLM-4.7实战指南:三个梯度测试,解锁国产大模型的代码生成与审美上限

国产大模型 GLM-4.7 在前端代码生成与智能体编程(Agentic Coding)上实现突破,凭借强大的逻辑推理、UI 审美与交互设计能力,可媲美 Claude 3.5 Sonnet。实测显示,其在 SVG 生成、网页游戏开发及高级页面设计中表现惊艳,支持长上下文、高性价比 API,成为开发者高效落地 AI 编程的优选工具。

855 1
|
3月前
|
机器学习/深度学习 人工智能 搜索推荐
|

构建AI智能体:七十一、模型评估指南:准确率、精确率、F1分数与ROC/AUC的深度解析

本文系统介绍了机器学习模型评估的核心指标与方法。首先阐述了混淆矩阵的构成(TP/FP/FN/TN),并基于此详细讲解了准确率、精确率、召回率和F1分数的计算原理和适用场景。特别指出准确率在不平衡数据中的局限性,强调精确率(减少误报)和召回率(减少漏报)的权衡关系。然后介绍了ROC曲线和AUC值的解读方法,说明如何通过调整分类阈值来优化模型性能。最后总结了不同业务场景下的指标选择策略:高精度场景侧重精确率,高召回场景关注召回率,平衡场景优选F1分数,不平衡数据则推荐使用AUC评估。

523 20
|
3月前
|
人工智能 自然语言处理 机器人
|

AI也会说谎?揭秘可靠RAG让智能助手不再胡说八道

你的AI助手老是答非所问、胡编乱造?别急,可靠RAG技术专治各种"AI幻觉症"!通过文档相关性检查、幻觉检测和来源追溯,让你的智能客服从"胡说八道王"变身"靠谱答题员" #人工智能 #RAG #智能客服 #幻觉检测

292 1
|
5月前
|
并行计算 测试技术 异构计算
|

Qwen3 Next 在 TensorRT LLM 上的部署指南

本指南介绍如何在TensorRT LLM框架上部署Qwen3-Next-80B-A3B-Thinking模型,基于默认配置实现快速部署。涵盖环境准备、Docker容器启动、服务器配置与性能测试,支持BF16精度及MoE模型优化,适用于NVIDIA Hopper/Blackwell架构GPU。

1333 154
|
6月前
|
SQL 安全 关系型数据库
|

渗透技术--sqlmap使用

Sqlmap是一款自动化SQL注入工具,支持MySQL、Oracle、PostgreSQL等多种数据库。它可扫描并利用URL中的SQL注入漏洞,提供丰富的参数选项,如查询数据库、表、字段,支持POST注入、代理设置及写入文件等功能,适用于安全测试与漏洞评估。

875 1
|
8月前
|
API vr&ar 索引
|

1张照片 2秒钟 一键变身3D数字人

LHM是一种基于单视角图像的端到端Transformer模型,结合SMPL-X人体模型与高斯渲染技术,可从一张照片生成可驱动的3D数字人。它采用Vision Transformer和Mae模型提取特征,并通过Body-Head Transformer融合2D与3D信息,输出具有动作能力的高精度3D人体模型。应用于动作重现、游戏角色生成及虚拟现实等领域,代码已开源并提供在线体验入口。

919 1
|
2月前
|
人工智能 架构师 安全
|

后大模型时代:从 Model 到 Agent,下一代企业级应用架构演进指南

摘要:当大模型(LLM)的能力逐渐同质化,基于 Agent(智能体)的应用架构正在成为新的技术护城河。本文将探讨 Agent 如何重构软件开发范式,并梳理开发者在这一转型过程中所需的关键技术栈。

211 2
|
6月前
|
人工智能 算法 安全
|

AIGEO助力企业内容传播

AIGEO是一款低成本、高效率的内容优化工具,助力企业提升曝光与转化。适配多行业,支持AI收录推荐,精准匹配用户搜索意图,合规安全,推动小微企业数字化转型。(238字)

671 99
|
7月前
|
人工智能 数据可视化 开发者
|

深度解析基于LangGraph的Agent系统架构设计与工程实践

LangGraph作为Agent 生态中非常热门的框架,今天我将借助 LangGraph,更高效、更优雅的方式构建复杂智能体系统。

1811 2
|
19天前
|
人工智能 算法 搜索推荐
|

从“竞价内卷”到“算法裁决”:医疗行业在生成式搜索时代的流量重构路径

爱搜光年(AISO)提出医疗GEO(生成式引擎优化)体系,直击竞价内卷、流量欺诈、算法黑箱、ROI崩塌等八大痛点。通过向量锚定、推荐度管理、可见度重构与数字信誉资产构建,助力医疗机构适配生成式搜索裁决逻辑,实现自然流量跃升与信任重建。(239字)

117 1
|
2月前
|
设计模式 人工智能 供应链
|

2026年智能体架构综述:从笨重设计到多智能体架构(MAS)

2024是智能体“前哨战”,2026则是生产级智能体的“分水岭”。告别笨重的单体设计,多智能体系统(MAS)正成为主流。通过“路由+执行者”架构与审计机制,实现专业分工、高效协作。AI不再只是工具,而是企业级操作系统,开启智能化协作新纪元。

389 3
|
2月前
|
数据采集 人工智能 物联网
|

教AI学会说'我是小喵'竟然这么神奇?LlamaFactory微调揭秘

想让AI助手记住自己叫什么名字?就像教小孩背诵身份证信息一样简单!通过LlamaFactory的SFT微调,你的AI不仅能记住自己是谁,还能在千万个问题中准确回答身份信息。从技术小白到微调高手,一篇文章搞定! #人工智能 #LlamaFactory #模型微调 #AI助手

265 2
|
2月前
|
自然语言处理 运维 物联网
|

大模型微调技术入门:从核心概念到实战落地全攻略

本课程系统讲解大模型微调核心技术,涵盖全量微调与高效微调(LoRA/QLoRA)原理、优劣对比及适用场景,深入解析对话定制、领域知识注入、复杂推理等四大应用,并介绍Unsloth、LLaMA-Factory等主流工具与EvalScope评估框架,助力从入门到实战落地。

428 8
|
3月前
|
机器学习/深度学习 人工智能 算法
|

奥维:AI技术赋能水利工程 “人工智能+”展现巨大潜力

奥维数字科技凭借对AI技术的深耕与水利场景的深刻理解,打造出奥维水利算法云这一核心解决方案,将AI能力渗透到大坝安全、洪水预报、淹没分析等关键环节,以“精准、实时、可进化”的服务特性,为水利行业智能化升级提供了可落地的技术范式。奥维通过“AI+水利”的实践证明,人工智能并非简单的“技术叠加”,而是能从“数据处理、模型优化、决策支撑”三个核心环节重构水利工程的运行模式:它让大坝监测更精准、洪水预报更及时、应急响应更科学,也让水利决策从“经验驱动”转向“数据驱动”。

452 5
|
6月前
|
缓存 监控 Java
|

SpringBoot @Scheduled 注解详解

使用`@Scheduled`注解实现方法周期性执行,支持固定间隔、延迟或Cron表达式触发,基于Spring Task,适用于日志清理、数据同步等定时任务场景。需启用`@EnableScheduling`,注意线程阻塞与分布式重复问题,推荐结合`@Async`异步处理,提升任务调度效率。

957 128
|
7月前
|
人工智能 JSON 前端开发
|

告别无效调参!ReAct代理设计:让LLM精准执行复杂任务的终极方案

ReAct模式通过“推理+行动”循环,使大语言模型能自主调用工具、获取实时信息并执行多步骤任务,有效突破LLM固有局限,提升任务准确性和智能化水平。

1113 0
|
1月前
|
SQL 人工智能 分布式计算
|

太香了!MaxCompute SQL AI:一行 SELECT 搞定情感分析|MaxCompute 实战

本文介绍MaxCompute SQL AI如何通过`AI_GENERATE`函数,直接在SQL中调用通义千问Qwen3-1.7B模型实现轻量级评论情感分析(正面/负面/中性)。无需切换环境、无需AI开发经验,仅需标准SELECT语句+精准提示词(含`/no_think`),即可完成端到端分析,兼顾准确性、效率与易用性。

200 9
|
1月前
|
JSON 自然语言处理 数据格式
|

大模型应用:结构化思维:Schema在大模型信息抽取中的认知引导作用.14

本文介绍大模型+Schema结构化信息抽取技术,涵盖核心原理(Schema引导、大模型语义理解、格式校验)、三大范式(Zero-shot/少样本/思维链)及完整执行流程,并提供多类型抽取示例(单字段、嵌套、数组、关系等),支持CPU环境本地部署与后处理校验。

229 15
|
6月前
|
Java 数据库 数据安全/隐私保护
|

Spring Boot四层架构深度解析

本文详解Spring Boot四层架构(Controller-Service-DAO-Database)的核心思想与实战应用,涵盖职责划分、代码结构、依赖注入、事务管理及常见问题解决方案,助力构建高内聚、低耦合的企业级应用。

1262 1
|
9月前
|
机器学习/深度学习 人工智能 自然语言处理
|

视觉感知RAG×多模态推理×强化学习=VRAG-RL

通义实验室自然语言智能团队发布并开源了VRAG-RL,一种视觉感知驱动的多模态RAG推理框架。它能像人一样“边看边想”,通过粗到细的视觉仿生感知机制,逐步聚焦关键区域,精准提取信息。VRAG-RL结合强化学习与多专家采样策略,优化检索与推理路径,在多个视觉语言基准数据集上表现出色,显著提升准确性和效率。项目已发布技术方案并开源代码,支持快速部署和二次开发。

714 11
|
1月前
|
存储 人工智能 缓存
|

我用半天时间,一行代码没写ai的一个开源软件 ”一个仓库,管理所有 AI 工具配置“

DotAI 是一个开源工具,通过 Git 统一管理 Cursor、Claude、Copilot 等十余款 AI 编程助手的原生配置,零格式转换、自动分发、支持用户/项目双作用域,并提供 CLI 与 VSCode 插件双界面。

176 2
|
2月前
|
机器学习/深度学习 人工智能 调度
|

从单体到集群:AI Agent 中“指挥官”与“调度官”的双层协作模式设计

本文提出一种“指挥官+调度官”双层治理架构,解决多智能体系统中的通信混乱与任务死锁问题。指挥官负责高层规划,调度官专注任务分发,通过职责解耦实现高效协作,并结合Python代码展示核心实现,提升复杂场景下多Agent系统的稳定性与可扩展性。

201 0
|
2月前
|
SQL 数据可视化 JavaScript
|

构建AI智能体:九十九、大模型性能评估技巧:Qwen1.5的完整测试框架与可视化分析

本文介绍了Qwen1.5-1.8B-Chat轻量级大模型的本地部署与评估框架。针对硬件资源有限的个人开发者,该模型仅需4GB内存即可在CPU环境流畅运行。通过构建完整的评估体系,文章详细测试了推理速度(4.09 tokens/s)、内存占用(7GB参数内存+2.4GB推理内存)等基础性能指标,并评估了中文理解(0.75/1.0)、知识准确性(0.67)、多轮对话连贯性(1.0/1.0)、创造性(0.78/1.0)和代码生成能力(0.9/1.0)。测试结果显示该模型在创意生成和中文理解方面表现突出

350 10
|
4月前
|
人工智能 自然语言处理 安全
|

技术人办活动不用慌,这个AI指令帮你搞定完整策划案

技术人办活动头疼?用AI指令轻松生成完整策划案!覆盖目标分析、流程设计、预算风控等八大模块,适配沙龙、发布会等多种场景。结合国产AI工具,30分钟搞定专业方案,助力开发者高效落地活动。

637 2
|
7月前
|
人机交互 API 开发工具
|

基于通义多模态大模型的实时音视频交互

Qwen-Omni是通义千问系列的全新多模态大模型,支持文本、图像、音频和视频的输入,并输出文本和音频。Omni-Realtime服务针对实时交互场景优化,提供低延迟的人机交互体验。

1314 23
|
11月前
|
JavaScript 前端开发 Java
|

通义灵码 Rules 库合集来了,覆盖Java、TypeScript、Python、Go、JavaScript 等

通义灵码新上的外挂 Project Rules 获得了开发者的一致好评:最小成本适配我的开发风格、相当把团队经验沉淀下来,是个很好功能……

1699 103
|
11月前
|
Arthas 监控 Java
|

Arthas profiler(使用async-profiler对应用采样,生成火焰图)

Arthas profiler(使用async-profiler对应用采样,生成火焰图)

1715 10
|
12月前
|
人工智能 边缘计算 自然语言处理
|

Google 发布其开源模型系列最新模型 Gemma 3

Google 发布了其开源模型系列的最新成员 Gemma 3,这是一款轻量级、高性能的 AI 模型,支持多语言和复杂任务。它具备 140+ 语言支持、128K-token 上下文窗口、增强的多模态分析能力以及函数调用功能,适用于聊天 AI、代码生成等多种场景。Gemma 3 在性能上超越 Llama 3-8B 和 Mistral 7B,且仅需单 GPU 即可运行,大幅降低计算成本。提供 1B 至 27B 不同参数规模版本,满足多样化需求,并优化了量化模型以适应边缘计算和移动设备。其多模态设计整合了 SigLIP 图像编码器,扩展上下文窗口至 128k token,显著提升了视觉和文本理解能力。

851 3
|
6月前
|
芯片
|

MicroPython+ESP32 C3+ST7735S LCD屏 WIFI联网并显示时间

本案例基于ESP32 C3与ST7735S驱动的1.8寸TFT屏,实现WIFI连接显示、实时时间展示及中英文字符渲染。通过MicroPython驱动屏幕,支持自定义字库与彩色文字输出,适用于嵌入式图形显示应用。

828 1

千问大模型

阿里云自主研发的千问大模型,凭借万亿级超大规模数据训练和领先的算法框架,实现全模态高效精准的模型服务调用。https://www.aliyun.com/product/tongyi

3
今日
1801
内容
8
活动
1229
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大模型服务平台百炼