|
2月前
|
机器学习/深度学习 人工智能 机器人
|

大模型应用:稀疏注意力 vs 滑动窗口:大模型扩窗技术完全解析.58

本文详解大模型“扩窗”核心技术:滑动窗口注意力(快而局部,适合中短文本)与稀疏注意力(兼顾局部+跨步+首尾,支持超长上下文)。二者均通过降低O(n²)计算复杂度至线性,解决大模型长文本处理的内存与算力瓶颈,推动其从聊天工具升级为长文档分析、代码全量理解等实用AI。

657 26
|
3月前
|
存储 机器学习/深度学习 人工智能
|

大模型应用:通俗理解大模型量化:从概念到实践的原理流程完整拆解.38

大模型量化是通过降低参数精度(如FP32→INT8),在几乎不损精度的前提下,显著压缩模型体积、提升推理速度、降低硬件门槛与功耗的关键技术,使大模型得以落地手机、PC等端侧设备。

650 16
|
3月前
|
机器学习/深度学习 自然语言处理 定位技术
|

大模型应用:循序渐进掌握CLIP:领悟训练推理过程的进阶特性.17

本文系统解析CLIP模型:从跨模态对比学习原理、零样本能力本质,到双塔架构、训练机制(InfoNCE损失、温度参数τ)与推理应用(分类/检索/标注),辅以多模板提示工程等实战技巧,揭示其“用图文相关性替代任务学习”的核心思想。

595 10
|
4月前
|
人工智能 数据处理 调度
|

智能体如何被统一管理?AI Agent 指挥官的底层逻辑

AI Agent指挥官是面向多智能体系统的统一调度中枢,通过目标拆解、动态分配、状态管控与闭环约束,解决协作失序、结果不可控等难题,提升自动化系统的稳定性、可解释性与可扩展性,正成为智能体规模化落地的关键基础设施。

414 8
|
5月前
|
JSON 人工智能 安全
|

Qwen Code 能力再升级

Qwen Code v0.3.0 正式发布!全面支持 Stream JSON、多语言界面切换,提升安全稳定与生态适配,助力开发者高效构建 AI 工具。欢迎体验并参与共建!

973 1
|
11月前
|
人工智能 API 开发者
|

智能体(AI Agent)开发实战之【LangChain】(一)接入大模型输出结果

LangChain 是一个开源框架,专为构建与大语言模型(LLMs)相关的应用设计。通过集成多个 API、数据源和工具,助力开发者高效构建智能应用。本文介绍了 LangChain 的环境准备(如安装 LangChain、OpenAI 及国内 DeepSeek 等库)、代码实现(以国内开源大模型 Qwen 为例,展示接入及输出结果的全流程),以及核心参数配置说明。LangChain 的灵活性和强大功能使其成为开发对话式智能应用的理想选择。

2436 1
|
机器学习/深度学习 编解码 缓存
|

通义万相2.1首尾帧模型开源!细节真实生动+过渡丝滑,指令遵循表现出色!

通义万相2.1首尾帧模型开源!细节真实生动+过渡丝滑,指令遵循表现出色!

1822 7
|
Arthas 监控 Java
|

Arthas trace (方法内部调用路径,并输出方法路径上的每个节点上耗时)

Arthas trace (方法内部调用路径,并输出方法路径上的每个节点上耗时)

1916 10
|
人工智能
|

免费、可商用,阿里云开源70亿参数通义千问大模型

免费、可商用,阿里云开源70亿参数通义千问大模型

7543 0
|
1月前
|
存储 自然语言处理 安全
|

大模型应用:医疗行业大模型:从生成前校验到生成后审计的应用实践.73

本文提出医疗大模型“生成前校验+生成后审计”全链路管控方案,通过输入完整性/合规性校验、隐私脱敏、标准化处理,及输出格式/准确性/隐私审计等闭环流程,确保病历撰写、医嘱辅助等场景安全、合规、准确落地。

397 7
|
2月前
|
人工智能 IDE 开发工具
|

下一代 IDE,没有文本编辑器

当AI自主写代码,开发者角色正从“编码者”转向“指挥官”。本文以独立开发者打造的CodexMonitor为切入点,揭示OpenAI Codex的平台野心——通过开放的App-Server协议,构建AI Agent时代的“操作系统”。它重新定义IDE:无需编辑器,重在多代理协同、安全审批与工作流编排。协议即权力,平台已启幕。(239字)

519 0
|
4月前
|
存储 消息中间件 人工智能
|

【架构模式】解构多智能体协作:AI Agent “指挥官”与“调度官”的双层治理实践

本文提出“指挥官-调度官”双层架构,解决多智能体系统中的意图漂移、死循环与资源竞争问题。通过职能分离,实现高并发、高可用的复杂任务协同。

714 3
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
|

构建AI智能体:六十一、信息论完全指南:从基础概念到在大模型中的实际应用

摘要: 信息论是人工智能尤其是大语言模型的核心数学工具。本文系统介绍了八大核心概念: 信息量:衡量事件意外程度,公式为I(x)=-log₂P(x) 信息熵:评估系统不确定性,H(X)=-ΣP(x)log₂P(x) 联合熵/条件熵:分析多变量关系及条件不确定性 互信息:量化变量间共享信息量 KL散度:衡量概率分布差异 交叉熵:模型训练的核心损失函数 在大语言模型中,这些概念被广泛应用于: 训练阶段:交叉熵优化预测,KL散度防止过拟合 推理阶段:温度参数调节生成文本的创造性(高熵增加多样性)

781 2
|
9月前
|
SQL 人工智能 Java
|

用 LangChain4j+Ollama 打造 Text-to-SQL AI Agent,数据库想问就问

本文介绍了如何利用AI技术简化SQL查询操作,让不懂技术的用户也能轻松从数据库中获取信息。通过本地部署PostgreSQL数据库和Ollama模型,结合Java代码,实现将自然语言问题自动转换为SQL查询,并将结果以易懂的方式呈现。整个流程简单直观,适合初学者动手实践,同时也展示了AI在数据查询中的潜力与局限。

1227 8
|
人工智能 达摩院 搜索推荐
|

通义大模型:解码中国AI的"通"与"义"

“通义”取自中国传统文化中“通晓大义”,寓意技术与人文的结合。作为阿里巴巴旗下的超大规模语言模型,通义在知识蒸馏、动态稀疏激活和文化感知模块上实现三大突破,大幅提升效率与适切性。其已在医疗、司法、文化传播等领域落地,如辅助病历处理、法律文书生成及文物解说等。测试显示,通义在中文诗歌创作、商业报告生成等方面表现优异。同时,开放的开发者生态已吸引5万+创新者。未来,通义将探索长期记忆、自我反思及多智能体协作,向AGI迈进,成为智能本质的载体。其对中文语境情感的精准把握,更是中国AI“通情达义”的典范。

3861 22
|
人工智能 并行计算 监控
|

深入剖析 Qwen2.5 - 32B 模型在 VLLM 上的单机三卡部署与运行

本文深入探讨了Qwen2.5 - 32B模型在VLLM框架上的部署过程,从模型下载、启动命令、资源占用分析到GPU资源分配及CUDA图应用,详述了大模型运行的挑战与优化策略,强调了硬件资源规划与技术调优的重要性。

8770 2
|
Java 编译器 测试技术
|

全面理解Maven Compiler Plugin-Maven编译插件

【10月更文挑战第16天】

4047 1
|
前端开发 机器人 API
|

前端大模型入门(一):用 js+langchain 构建基于 LLM 的应用

本文介绍了大语言模型(LLM)的HTTP API流式调用机制及其在前端的实现方法。通过流式调用,服务器可以逐步发送生成的文本内容,前端则实时处理并展示这些数据块,从而提升用户体验和实时性。文章详细讲解了如何使用`fetch`发起流式请求、处理响应流数据、逐步更新界面、处理中断和错误,以及优化用户交互。流式调用特别适用于聊天机器人、搜索建议等应用场景,能够显著减少用户的等待时间,增强交互性。

5157 2
|
人工智能 API Python
|

三分钟快速搭建基于FastAPI的AI Agent应用!

【10月更文挑战第1天】

1945 0
|
21天前
|
存储 人工智能 算法
|

102.大模型应用:差分隐私与大模型融合:数据隐私保护与模型效能的应用实践.102

本文系统阐述差分隐私(DP)如何破解大模型训练中的“数据不出库”与“模型需高质量数据”矛盾。通过在数据或梯度中添加可控噪声,DP在保障个体隐私(ε-δ严格可证)前提下,保留统计有效性,结合联邦学习实现医疗、金融等敏感场景的合规建模,兼顾隐私安全、数据可用与模型效能。

190 1
|
1月前
|
机器学习/深度学习 存储 人工智能
|

大模型应用:批量文档摘要与分类实践:本地合同、报告数据处理与导出.70

本方案基于Qwen 1.5 7B大模型,实现本地化批量文档处理:自动读取Word/PDF,经TextSplitter智能分块、Schema引导式提示,生成标准化摘要与多标签分类,最终导出CSV。全程离线运行,保障敏感数据安全,显著提升合同、报告等高频文档的处理效率与准确性。

400 16
|
2月前
|
机器学习/深度学习 监控 安全
|

再也不怕局部拍屏泄露:一项能抗部分屏幕拍摄的溯源黑科技来了(第10期)

针对“拍屏截取局部”导致传统水印失效的难题,合肥高维数据与中科大联合研发《抗部分屏幕拍摄的溯源水印方法》,首创结构化水印+双阶段深度学习增强技术,支持畸变、裁剪、摩尔纹等复杂干扰下的高鲁棒溯源,已应用于政企保密、版权保护与司法取证等领域。(239字)

328 2
|
3月前
|
人工智能 算法 搜索推荐
|

算法备案必看:多产品≠多备案!被驳回的 “重复申请” 坑一次讲清

AI企业多产品算法备案常陷“重复申请”误区。本文揭秘:同主体、同算法仅场景不同,只需1份备案,关联多个产品即可;唯算法类型/原理不同时才需分开。附命名规范、填报要点与避坑指南,助您一次过审。(239字)

327 14
|
4月前
|
人工智能 JavaScript API
|

【教案生成平台】实战教程二:接入 AI 大模型实现智能教案生成

一款基于 Vue 3 + Vite 的教师辅助工具,聚焦教案智能生成。输入课程主题,AI 流式输出完整教学设计,支持 Markdown 实时预览与 Word 导出,提升备课效率。核心技术涵盖流式 API 调用、提示词工程与文档生成,构建从输入到输出的完整 AI 工作流。

674 8
|
4月前
|
存储 人工智能 自然语言处理
|

智能体领航员——深度解析 AI 驱动的企业级知识库搭建全流程

智能体运用场景

1074 0
|
5月前
|
人工智能 安全 前端开发
|

写单元测试太痛苦?教你用DeepSeek/通义千问一键生成高质量测试代码

单元测试难写且枯燥?本文分享一套经过验证的AI生成指令,将DeepSeek/通义千问化身为10年经验的测试专家。支持自动Mock、全场景覆盖和参数化测试,让代码质量保障从"体力活"变成高效的"指挥活"。

1197 3

通义千问Image模型使用指南

该表格展示了多个设计场景,包括模型选择、复制粘贴提示词、一键生图等步骤。每个步骤配有详细描述及示意图,呈现了不同主题如商业海报、IP主视觉、品牌包装、街拍风格等的设计构思与实现方式。

2435 1
|
9月前
|
人工智能 算法 安全
|

算法备案新手攻略——2025全网最新最详细解读版

本文介绍了算法备案的背景、法规依据、备案类型及流程,涵盖生成合成、个性化推送等五大算法类型,并详细说明所需材料与备案周期,强调未备案将面临行政处罚甚至刑事追责,助力企业合规运营。

953 1
|
存储 人工智能 安全
|

自媒体创作场景实践|通义千问3 + MCP=一切皆有可能

本文介绍了通过MCP(Model Context Protocol)结合通义千问大模型实现跨平台、跨服务的自动化任务处理方案。使用Qwen3-235B-A22B模型,配合ComfyUI生成图像,并通过小红书等社交媒体发布内容,展示了如何打破AI云服务的数据孤岛。具体实践包括接入FileSystem、ComfyUI和第三方媒体Server,完成从本地文件读取到生成图像再到发布的全流程。 方案优势在于高可扩展性和易用性,但也存在大模型智能化不足、MCP Server开发难度较大及安全风险等问题。未来需进一步提升模型能力、丰富应用场景并解决安全挑战,推动MCP在更多领域落地。

3083 27
|
小程序 API 开发工具
|

支付宝支付对接案例详解

支付宝支付对接指南,涵盖电脑网站、当面付和手机网站支付方式。对接前需了解支付宝开放平台和商家平台的区别,完成注册、实名认证、创建应用及签约产品等步骤。配置支付环境包括API密钥、回调地址和开发环境搭建。提供三种SDK供选择,推荐使用alipay-easysdk。详细步骤和示例代码可参考官方文档。

1748 15
|
人工智能 编解码 机器人
|

通义千问,又开源了!

通义千问,又开源了!

53026 66
|
1月前
|
机器学习/深度学习 自然语言处理 算法
|

大模型应用:从语义理解到最优匹配:大模型赋能的二分图匈牙利算法全解析.93

本文详解“大模型+匈牙利算法(KM)”融合的智能匹配技术:大模型负责语义理解与对齐,将非结构化文本(如岗位描述、简历)转化为0–100分量化权重;KM算法在此基础上求解带权二分图的全局最优匹配。该方案突破人工规则局限,实现精准、自适应、跨场景的智能配对,广泛适用于人岗匹配、题库组卷、客服问答等核心业务。

216 10
|
3月前
|
前端开发 数据可视化 API
|

大模型应用:完整语音交互闭环:TTS+ASR融合系统可视化场景实践.22

本文介绍了一个轻量级TTS+ASR融合交互系统,基于HTML/CSS/JS前端与Python Flask后端,集成Whisper语音识别与pyttsx3文本转语音,实现“语音→文本→语音”闭环。支持浏览器录音、实时转写、语音播放及历史管理,无需依赖框架或网络,适合快速部署与二次开发。

583 18
|
4月前
|
人工智能 开发者
|

Qwen-Image又登顶啦!

Qwen-Image-2512登顶Hugging Face趋势榜榜首,并在AI Arena稳居最强开源图像模型!新发布的Qwen-image-edit-202511也在Chatbot Arena获开源第一、全球第九。双榜佳绩,技术再突破!

762 0
|
6月前
|
人工智能 语音技术 流计算
|

一图掌握通义千问:模型生态与应用场景全览

通义千问(Qwen)系列提供全栈开源AI能力,涵盖语言、视觉、语音等多模态应用。旗舰模型Qwen3-Max性能领先,支持92种语言翻译与高精度语音识别,具备强大代码生成与图像处理能力,助力开发者与企业高效构建智能应用。

1063 2
|
测试技术 API 开发者
|

LiveBench放榜:Qwen3斩获全球开源冠军

最新一期LiveBench榜单显示,阿里云旗舰模型Qwen3-235B-A22B荣登全球开源模型冠军,小尺寸Qwen3-32B位列Top3。千问3在指令遵循能力上超越多个顶级闭源模型,位居全球第一。该评测由图灵奖得主Yann LeCun发起,采用动态防污染机制,确保公平性。千问3支持119种语言,具备混合推理架构与强大Agent能力,现已上线阿里云百炼平台,提供免费体验与API调用。

1133 10
|
机器学习/深度学习 人工智能 算法
|

算法备案全流程实操

随着《生成式人工智能服务管理暂行办法》在2024年实施,算法备案成为强制性要求。未合规将导致APP下架或高额罚款。本文详解算法备案的核心逻辑与流程,涵盖必备案算法类型、三大监管红线、六大阶段的关键节点,并提供阿里云工具支持,如合规预评估平台和备案助手插件。内容包括金融风控算法的可解释性要求、生成式AI的内容安全措施及个人开发者的技术能力证明方法,助力开发者实现持续合规。

1706 4
|
机器学习/深度学习 人工智能 自然语言处理
|

AI大模型企业应用实战-什么是zero-shot, one-shot和few-shot Learning

【8月更文挑战第17天】

2432 0
|
自然语言处理 开发者
|

通义语音大模型评测:CosyVoice与SenseVoice

随着人工智能技术的不断发展,语音生成和理解模型在各个领域得到了广泛应用。本文将评测两个由FunAudioLLM团队开发的多语言语音模型——[CosyVoice](https://github.com/FunAudioLLM/CosyVoice)和[SenseVoice](https://github.com/FunAudioLLM/SenseVoice),并结合阿里云开发者社区的相关资源,探讨其在实际应用中的表现。

3896 3
|
人工智能 API C++
|

【AI绘画大比拼】通义万相VS文心一格:探索十种风格下的绘画生成差异!

近日,通义大模型家族的新成员——通义万相已在人工智能大会上亮相。其中,通义万相的强大的“文生图”功能,不禁让我想到了去年八月由百度依托飞桨、文心大模型的技术创新推出的“AI作画”首款产品——文心一格。 那么,在类似的Prompt下,两款产品的表现将会如何呢?今天就让我们就十种风格下二者生成图像的表现力,来看看这两款产品的差异。

6297 8
|
16天前
|
人工智能 编解码 移动开发
|

Windows 部署 OpenClaw 借助本地 AI 快速搭建静态企业站点

本文详解如何用本地离线AI工具OpenClaw,零代码快速搭建企业静态网站:从一键部署、自然语言生成HTML/CSS/JS源码,到本地调试与上线部署,全流程30分钟搞定,安全可控、高度定制。(239字)

115 0
|
4月前
|
人工智能 自然语言处理 监控
|

多智能体如何高效协作?AI Agent指挥官与AI调度官的实践方法

本文提出AI Agent“指挥官+调度官”协同治理机制,通过角色分离、统一调度与规则约束,解决多智能体系统中的任务冲突、资源争抢与决策分散问题,提升复杂场景下的可扩展性、稳定性与可解释性。

589 3
|
4月前
|
人工智能 并行计算 算法框架/工具
|

英伟达三大AI法宝:CUDA、NVLink、InfiniBand——构筑AI时代的算力基石

英伟达三大AI法宝——CUDA(编程层)、NVLink(芯片互连)、InfiniBand(系统互连),构成软硬协同的全栈加速体系:CUDA释放GPU通用算力,NVLink实现多卡高速协同,InfiniBand支撑万卡集群高效通信,共同筑就AI时代的算力基石。(239字)

545 1
|
4月前
|
人工智能 架构师 安全
|

后大模型时代:从 Model 到 Agent,下一代企业级应用架构演进指南

摘要:当大模型(LLM)的能力逐渐同质化,基于 Agent(智能体)的应用架构正在成为新的技术护城河。本文将探讨 Agent 如何重构软件开发范式,并梳理开发者在这一转型过程中所需的关键技术栈。

505 2
|
7月前
|
数据采集 人工智能 物联网
|

国产AI封神!炒股狂赚40%碾压对手 教你微调Qwen3打造专属金融分析师

国产AI在实盘炒股中大放异彩,DeepSeek与Qwen3收益率最高超60%,碾压国际大模型。本文教你用LLaMA Factory平台微调Qwen3-VL-30B,打造专属多模态金融分析师,实现趋势研判、财报分析等专业能力,赋能投资决策。

2105 157
|
7月前
|
人工智能 自然语言处理 数据可视化
|

多模态AI重构科研范式:从"读文献"到"理解世界"

2025年,多模态AI正重塑科研:可同时理解文字、图像、公式等,实现文献智能解析、数据自动提取与跨学科融合,大幅提升研究效率。AI助力科研进入“人机协同”新时代,释放创造力,推动知识发现跃迁。

799 3
|
8月前
|
机器学习/深度学习 人工智能 自然语言处理
|

AIGC技术深度解析:生成式AI的革命性突破与产业应用实战

蒋星熠Jaxonic,AI技术探索者,深耕生成式AI领域。本文系统解析AIGC核心技术,涵盖Transformer架构、主流模型对比与实战应用,分享文本生成、图像创作等场景的实践经验,展望技术趋势与产业前景,助力开发者构建完整认知体系,共赴AI原生时代。

1492 2
|
8月前
|
机器学习/深度学习 缓存 人工智能
|

MoE模型加速秘籍:vLLM混合KV缓存管理解析​

vLLM是高效分布式大模型推理引擎,采用分页注意力、连续批处理等技术实现高吞吐与低延迟。本文详解其架构设计与关键技术,包括KV缓存管理、调度机制、推测解码与分布式扩展等,助你深入理解性能优化原理。

1511 1
|
9月前
|
人机交互 API 开发工具
|

基于通义多模态大模型的实时音视频交互

Qwen-Omni是通义千问系列的全新多模态大模型,支持文本、图像、音频和视频的输入,并输出文本和音频。Omni-Realtime服务针对实时交互场景优化,提供低延迟的人机交互体验。

1697 23
|
9月前
|
存储 人工智能 自然语言处理
|

大模型备案攻略—2025全网最新最详细解读版

随着AI技术的发展,大模型备案成为行业热点。本文详解备案所需具体条件与注意事项,涵盖模型功能、适用场景、研制情况、安全评估及备案材料等核心内容,帮助企业全面了解备案流程,规避合规风险,顺利推进产品上线。

2124 2

千问大模型

阿里云自主研发的千问大模型,凭借万亿级超大规模数据训练和领先的算法框架,实现全模态高效精准的模型服务调用。https://www.aliyun.com/product/tongyi

0
今日
1956
内容
8
活动
1408
关注
你好!
登录掌握更多精彩内容

活跃用户

相关产品

  • 大模型服务平台百炼