|
7月前
|
存储 人工智能 资源调度
|

MCP协议深度集成:生产级研究助手架构蓝图

本文详解基于LangGraph与MCP协议构建研究助手的技术方案,涵盖双服务器集成、状态化智能体设计与用户元命令控制,助你掌握生产级代理系统开发要点。

611 1
|
12月前
|
机器学习/深度学习 人工智能 算法
|

算法备案全流程实操

随着《生成式人工智能服务管理暂行办法》在2024年实施,算法备案成为强制性要求。未合规将导致APP下架或高额罚款。本文详解算法备案的核心逻辑与流程,涵盖必备案算法类型、三大监管红线、六大阶段的关键节点,并提供阿里云工具支持,如合规预评估平台和备案助手插件。内容包括金融风控算法的可解释性要求、生成式AI的内容安全措施及个人开发者的技术能力证明方法,助力开发者实现持续合规。

1499 4
|
人工智能 开发工具 git
|

使用Git LFS从Hugging Face下载大型语言模型

Hugging Face作为主流的模型库,提供了大量预训练模型,但这些模型的大尺寸使得直接下载可能会遇到困难。Git LFS(Large File Storage)作为Git的一个扩展,为我们提供了一个解决方案

2085 0
|
Web App开发 人工智能 达摩院
|

阿里通义千问大模型加持,专攻音视频生产力的「听悟」来了

阿里通义千问大模型加持,专攻音视频生产力的「听悟」来了

3075 0
|
29天前
|
人工智能 自然语言处理 前端开发
|

告别Agent Skills, 拥抱 Agent Apps

在AI Agent时代,传统GUI为人类设计,而LLM缺乏视觉、双手与持续感知能力。AOTUI(面向Agent的文本界面)应运而生:以语义化Markdown替代像素渲染,用类型化引用(如`Contact:contacts[2]`)实现“选择”,以Tool函数调用替代鼠标操作,构建专为LLM优化的离散快照式交互范式。

248 9
|
2月前
|
存储 机器学习/深度学习 人工智能
|

大模型应用:通俗理解大模型量化:从概念到实践的原理流程完整拆解.38

大模型量化是通过降低参数精度(如FP32→INT8),在几乎不损精度的前提下,显著压缩模型体积、提升推理速度、降低硬件门槛与功耗的关键技术,使大模型得以落地手机、PC等端侧设备。

405 16
|
5月前
|
人工智能 缓存 决策智能
|

AI律师数字分身:法律科技领域的多智能体架构实践

AI数字分身破解法律服务规模化难题,通过多模态智能体实现7×24小时咨询响应、案情结构化提取与智能分流。基于知识图谱与推理引擎,提升律所线索留存率与律师人效,推动法律服务降本增效。

840 11
|
6月前
|
人工智能 搜索推荐 程序员
|

从程序员到UP主:一个结构化的B站视频文案生成方案

专为技术人打造的B站视频文案生成指令,结构化拆解内容创作流程。输入主题、类型等信息,结合AI一键生成含分镜脚本、标题、SEO及互动设计的完整方案,提升创作效率与视频质量。

863 2
|
8月前
|
存储 人工智能 自然语言处理
|

大模型备案攻略—2025全网最新最详细解读版

随着AI技术的发展,大模型备案成为行业热点。本文详解备案所需具体条件与注意事项,涵盖模型功能、适用场景、研制情况、安全评估及备案材料等核心内容,帮助企业全面了解备案流程,规避合规风险,顺利推进产品上线。

1864 2
|
11月前
|
人工智能 API 开发者
|

用Qwen3+MCPs实现AI自动发布小红书笔记!支持图文和视频

魔搭自动发布小红书MCP,是魔搭开发者小伙伴实现的小红书笔记自动发布器,可以通过这个MCP自动完成小红书标题、内容和图片的发布。

3404 41
|
人工智能 自然语言处理 算法
|

接入DeepSeek需要做算法备案吗?一文读懂算法备案的那些事儿

在AI快速发展的今天,算法备案成为企业合规运营的关键。本文通过五个案例解析接入DeepSeek是否需备案:1) 微调模型需备案,流程4-6个月;2) 面向公众服务需备案;3) 内部使用通常无需备案;4) 个人自用无需备案;5) 面向特定专业人士通常无需备案。了解这些要求,确保企业在享受AI红利的同时合规运营,规避风险。

1835 15

hashCode()和 equals()方法的默认实现

在Java中,`hashCode()` 和 `equals()` 方法的默认实现由 `Object` 类提供。`equals()` 默认比较对象引用是否相同,`hashCode()` 则返回对象的内存地址的整数表示。为了确保哈希表等数据结构的正确性,当重写 `equals()` 时,通常也需要重写 `hashCode()`。

532 9
|
人工智能 测试技术 开发者
|

大模型自动生成并运行代码的体验与优化

随着近两年大模型的不断发展,它们在各个领域展示出了惊人的能力,可以说是在各个领域到了“开花结果”的阶段。比如最近技术圈比较火的阿里云的通义千问已经可以自己写代码、跑代码了,作为开发者,我觉得这种能力不仅提高了开发效率,还推动了编程实践向更高层次的转变和发展。但是,在使用大模型自动生成代码时,我们也会面临一些挑战,其中之一是代码可能会曲解开发者的需求。那么本文就来分享一下个个人的体验以及如何优化这种情况。

1670 2
|
人工智能 自然语言处理 搜索推荐
|

AiChat—智能办公助手

在当今的数字化时代,人工智能(AI)已经在各个领域中展现出了强大的能力和潜力。AI在许多方面都为我们的生活带来了便利,其中最显著的一点就是在我们的日常交流和工作中。 现在,最简单的低门槛软件应该是AiChat……

186215 15
|
5月前
|
人工智能 自然语言处理 安全
|

妙妙妙妙!公文、合同、标书…全妙闭环了

阿里云百炼|全妙,是面向政企、媒体等专业领域的智能创作平台,集“妙策、妙搜、妙笔、妙读”于一体,覆盖公文撰写、合同审查、标书生成、内容采编等高合规场景,助力用户降本增效,释放创造力。

523 25
|
6月前
|
存储 缓存 PyTorch
|

如何优雅地为 TensorRT-LLM 添加新模型

本指南详细介绍如何在TensorRT-LLM中优雅集成新大语言模型,涵盖模型配置、定义、权重加载与注册全流程,支持作为核心模块或独立扩展集成,助力高效推理部署。(238字)

360 1
|
6月前
|
前端开发 Go API
|

Coze Loop 架构学习指南

本指南系统解析 Coze Loop 架构,涵盖项目结构、DDD 设计、技术栈与学习路径,助你从零掌握 AI Agent 平台开发与贡献。

557 2
|
8月前
|
SQL 人工智能 Java
|

用 LangChain4j+Ollama 打造 Text-to-SQL AI Agent,数据库想问就问

本文介绍了如何利用AI技术简化SQL查询操作,让不懂技术的用户也能轻松从数据库中获取信息。通过本地部署PostgreSQL数据库和Ollama模型,结合Java代码,实现将自然语言问题自动转换为SQL查询,并将结果以易懂的方式呈现。整个流程简单直观,适合初学者动手实践,同时也展示了AI在数据查询中的潜力与局限。

987 8
|
10月前
|
数据采集 机器学习/深度学习 搜索推荐
|

利用通义大模型构建个性化推荐系统——从数据预处理到实时API部署

本文详细介绍了基于通义大模型构建个性化推荐系统的全流程,涵盖数据预处理、模型微调、实时部署及效果优化。通过采用Qwen-72B结合LoRA技术,实现电商场景下CTR提升58%,GMV增长12.7%。文章分析了特征工程、多任务学习和性能调优的关键步骤,并探讨内存优化与蒸馏实践。最后总结了大模型在推荐系统中的适用场景与局限性,提出未来向MoE架构和因果推断方向演进的建议。

1505 11
|
人工智能 自然语言处理 机器人
|

【Prompt Engineering 提示词工程指南】​文本概括、信息提取、问答、文本分类、对话、代码生成、推理​

本文介绍了使用提示词与大语言模型(LLM)交互的基础知识。通过调整参数如温度(Temperature)、最高概率词元(Top_p)、最大长度(Max Length)及停止序列(Stop Sequences),可以优化模型输出。温度参数影响结果的随机性;Top_p 控制结果的多样性;最大长度限制输出长度;停止序列确保输出符合预期结构。此外,频率惩罚(Frequency Penalty)和存在惩罚(Presence Penalty)可减少重复词汇,提升输出质量。提示词需包含明确指令、上下文信息、输入数据及输出指示,以引导模型生成理想的文本。设计提示词时应注重具体性、避免歧义,并关注模型的具体行为

1884 1
|
弹性计算 并行计算 Shell
|

在云上搭建CosyVoice环境-保姆级教程

发现个好玩的模型,阿里最近开源的,可以便捷的复刻人声,本文提供全套安装过程。仓库地址:https://github.com/FunAudioLLM/CosyVoice。

6509 1
|
存储 SQL 人工智能
|

从 CodeGemma 到 CodeQwen1.5:开源编程大模型百家争鸣

笔者最近刚刚试用完 CodeGemma ,准备分享我的心得时,通义千问的 CodeQwen1.5 就也悄然发布。本文主要介绍 CodeQwen1.5 这款开源编程大模型,并展示如何在 VSCode 中使用它帮你提升编程体验。

2281 0
|
弹性计算 API Python
|

如何利用通义千问查询阿里云资源

本篇文章详细阐述了如何利用LangChain框架构建一款Python工具,该工具能够调用通义千问大模型来查询和获取阿里云资源信息。

116383 48
|
人工智能 搜索推荐 云栖大会
|

解密!通义智文-你的AI阅读助手!

通义智文是基于通义大模型的AI阅读助手,网页阅读、论文阅读、图书阅读和自由阅读,用AI帮你读得多、读得快、读得懂。 通过文档场景化阅读、结构化导读、给我灵感、多文档处理等亮点功能和文档智能大小模型协同的核心技术。让AI帮你更准确,更深入,更专业的读懂文档,沉淀专属知识资产。 产品已于2023年10月31日在云栖大会正式对外发布,现免费公测全面开放。

3252 1
|
2月前
|
人工智能 分布式计算 自然语言处理
|

大模型应用:大模型 MapReduce 全解析:核心概念、中文语料示例实现.12

本文对比分析传统Hadoop MapReduce与大模型MapReduce:前者面向结构化数据批处理,依赖CPU/磁盘IO,按数据分片、Shuffle混洗后输出统计结果;后者适配语义任务,基于本地大模型GPU/CPU推理,按语义完整性拆分超长文本,并行处理后语义聚合生成文本结果。

215 6
|
3月前
|
人工智能 并行计算 算法框架/工具
|

英伟达三大AI法宝:CUDA、NVLink、InfiniBand——构筑AI时代的算力基石

英伟达三大AI法宝——CUDA(编程层)、NVLink(芯片互连)、InfiniBand(系统互连),构成软硬协同的全栈加速体系:CUDA释放GPU通用算力,NVLink实现多卡高速协同,InfiniBand支撑万卡集群高效通信,共同筑就AI时代的算力基石。(239字)

333 1
|
3月前
|
机器学习/深度学习 人工智能 安全
|

数据安全智能体:AI驱动的新一代企业数据安全防护范式

随着大语言模型(LLM)技术的快速演进,以及企业数字化转型的深入推进,传统的被动式数据安全防护体系已难以满足现代威胁的防御需求。国内首款数据安全智能体通过将生成式AI、自适应防护机制、多智能体协作等前沿技术融为一体,实现了从”人工堆砌”向”智能主动”的范式转变。

388 6
|
4月前
|
人工智能 前端开发 JavaScript
|

GLM-4.7实战指南:三个梯度测试,解锁国产大模型的代码生成与审美上限

国产大模型 GLM-4.7 在前端代码生成与智能体编程(Agentic Coding)上实现突破,凭借强大的逻辑推理、UI 审美与交互设计能力,可媲美 Claude 3.5 Sonnet。实测显示,其在 SVG 生成、网页游戏开发及高级页面设计中表现惊艳,支持长上下文、高性价比 API,成为开发者高效落地 AI 编程的优选工具。

989 1
|
4月前
|
人工智能 文字识别 运维
|

通过人工智能平台PAI部署DeepSeek-OCR模型 官网控制台部署

本方案介绍如何在阿里云PAI平台部署DeepSeek-OCR开源模型,涵盖从账号准备、模型部署到应用体验的完整流程。通过PAI的Model Gallery可一键部署,结合PAI-EAS实现高性能推理,支持公网调用。适用于OCR场景快速搭建与测试,体验后建议及时清理资源以避免计费。

451 2
|
5月前
|
人工智能 运维 自然语言处理
|

国家网信办发布的第十四批深度合成算法备案综合分析报告

截至2025年11月,全国深度合成算法备案达5100款,广东以1329款居首,服务提供者占比77.1%。第14批新增680款创新高,医疗、教育、企业服务成主流方向,多模态与垂直领域加速发展,AI合规进入“政策+市场”双驱动新阶段。

502 4
|
7月前
|
安全 中间件 应用服务中间件
|

WEB渗透-文件上传漏洞-下篇

本文详解文件上传安全漏洞,涵盖白名单绕过(如00截断、条件竞争)、图片木马制作与利用、以及IIS、Apache、Nginx等常见解析漏洞原理与防御。结合实战案例,深入剖析攻击手法与修复方案。

506 1
|
8月前
|
机器学习/深度学习 存储 算法
|

Trinity-RFT:构建智能体持续学习的自动化强化微调工厂

大型语言模型作为智能体在真实环境中持续交互学习面临诸多挑战。 Trinity-RFT 是通义实验室推出的强化微调框架,旨在实现智能体的持续进化。它通过探索、训练与经验池的解耦设计,支持多样化训练模式,提升资源利用率和学习稳定性。同时,Trinity-RFT 提供灵活的数据处理与算法模块化功能,降低应用与研究门槛,助力迈向终身学习与自主进化的智能体时代。

793 2
|
10月前
|
人工智能 自然语言处理 搜索推荐
|

Qwen 家族再上新!

Qwen3 Embedding 是基于 Qwen3 基础模型训练的文本嵌入模型系列,可将离散符号转化为连续向量,捕捉语义关系。结合 Qwen3 Reranker 模型,通过“初筛+精排”流程提升搜索与推荐系统的相关性排序能力。该系列模型支持多语言、提供灵活架构(0.6B-8B 参数规模),并在 MTEB 多语言榜单中排名第一。用户可通过 Hugging Face、ModelScope 和 GitHub 快速体验模型服务。

1173 3
|
安全 算法 Java
|

Java“NoSuchProviderException”解决

“NoSuchProviderException”是Java中的一种异常,通常在尝试使用未安装或未正确注册的安全提供者时抛出。解决方法包括确保所需的安全提供者已正确安装和配置,或在代码中显式添加提供者。

597 0
|
人工智能 自然语言处理 数据库
|

基于RAG和LLM的水利知识问答系统研究

随着全球水资源紧张加剧,我国面临严峻的水资源管理挑战。《十四五规划》提出构建智慧水利体系,通过科技手段提升水情测报和智能调度能力。基于大语言模型(LLM)的水利智能问答系统,利用自然语言处理技术,提供高效、准确的水利信息查询和决策支持,助力水资源管理智能化。该系统通过RAG技术和Agent功能,实现了对水利知识的深度理解和精准回答,适用于水利知识科普、水务治理建议及灾害应急决策等多个场景,推动了水利行业的信息化和智能化发展。

1586 1
ly~
|
人工智能 搜索推荐 自动驾驶
|

人工智能的应用

人工智能在多个领域广泛应用,包括:医疗领域的疾病诊断、药物研发和医疗机器人;交通领域的自动驾驶和智能交通管理;金融领域的风险评估、金融诈骗检测和投资决策;教育领域的个性化学习和智能辅导;工业领域的质量检测和生产流程优化;家居领域的智能家居系统,如智能音箱和智能灯具等,极大提升了各行业的效率与服务质量。

1113 1
|
人工智能 JSON API
|

一张图读懂大模型应用是如何工作的,一图胜千言

用一张图,带你轻松读懂大模型应用的工作原理。不需要复杂的代码和艰深的理论,只需要一张图,就能让你对大模型有一个全新的认识

2974 2
|
人工智能 Serverless 数据安全/隐私保护
|

函数计算X 通义千问快速部署 AI 个人助手应用

基于函数计算X 通义千问快速部署 AI 个人助手应用,用户可以根据需要选择不同角色的AI助手开启写作,角色包括职业顾问、小红书写手、心灵导师等,你可以尽情发挥创造力,通过限制提示词、字数、情节等各种条件生成短篇小说。

12229 17
|
人工智能 达摩院 自然语言处理
|

覆盖200+服务场景,阿里「通义」大模型系列打造国内首个AI统一底座(2)

覆盖200+服务场景,阿里「通义」大模型系列打造国内首个AI统一底座

4279 0
|
10天前
|
人工智能 安全
|

AI 审计不该是事后烟:为什么我们需要 1MB 级的运行时“物理熔断”内核?

丢掉那些臃肿的权重和不可预测的概率。在大规模自动化执行面前,Agent 真正缺的不是聪明才智,而是“被管住”的能力。本文公开一套基于离散逻辑的 AI 守卫内核,支持实时 Review、Deny 和一键 Rollback。我们用不到 1MB 的代码,解决了千亿参数模型搞不定的行为归因和事故复现。这是给 Agent 补上的最后一块骨架,也是通往高责任生产环境的唯一路标。

88 2
|
23天前
|
人工智能 搜索推荐 SEO
|

虎博科技CEO卢鑫Echo提出:GEO 双轮信任引擎,品牌如何真正进入 AI 信任体系

虎博科技CEO卢鑫(Echo)提出GEO双轮信任引擎方法论,突破“AI版SEO”浅层认知,强调品牌需系统构建AI信任体系:第一轮建立稳定、可被外部反复确认的品牌信号;第二轮将官网打造为AI高引用的原生可信信源。

224 6
|
1月前
|
机器学习/深度学习 存储 运维
|

大模型应用:大模型权重敏感性分析:L1/L2 范数、梯度贡献深入解读.39

本文系统讲解大模型权重敏感性:即权重微小变化对模型输出的影响程度。核心依据是“静态潜力”(L1/L2范数)与“动态贡献”(梯度范数),二者结合可精准识别高敏感(需保护/精细调优)与低敏感(可剪枝/量化)权重,支撑模型压缩、加速与稳定性优化。

211 2
|
4月前
|
人工智能 自然语言处理 Java
|

AI工具选择困难症?Spring AI帮你省掉64%的令牌费用

你的AI助手有50+个工具但每次对话前就烧掉55000个令牌?就像带着全套工具箱去拧个螺丝一样浪费!Spring AI的工具搜索模式让AI按需发现工具,实现34-64%的令牌节省,告别工具选择困难症和账单焦虑。#Spring AI #工具优化 #令牌节省 #AI开发

537 2
|
6月前
|
数据采集 人工智能 物联网
|

国产AI封神!炒股狂赚40%碾压对手 教你微调Qwen3打造专属金融分析师

国产AI在实盘炒股中大放异彩,DeepSeek与Qwen3收益率最高超60%,碾压国际大模型。本文教你用LLaMA Factory平台微调Qwen3-VL-30B,打造专属多模态金融分析师,实现趋势研判、财报分析等专业能力,赋能投资决策。

1813 157
|
7月前
|
IDE 开发工具 Python
|

通义灵码+支付 MCP:30 分钟实现创作打赏智能体

本文介绍如何使用通义灵码智能体与 qwen3 和支付 MCP 编写创作打赏智能体,该智能体能够完成日常聊天、诗词创作和请求打赏并生成支付链接功能。

638 1
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
|

通义千问推理模型QwQ-32B开源,更小尺寸、更强性能

阿里云发布并开源全新推理模型通义千问QwQ-32B,通过大规模强化学习,在数学、代码及通用能力上实现质的飞跃,性能比肩DeepSeek-R1。该模型大幅降低部署成本,支持消费级显卡本地部署,并集成智能体Agent相关能力。阿里云采用Apache2.0协议全球开源,用户可通过通义APP免费体验。此外,通义团队已开源200多款模型,覆盖全模态和全尺寸。

1546 20
|
JSON 自然语言处理 Serverless
|

基于阿里云通义千问开发智能写作助手

现代办公中,撰写邮件、会议记录、报告等任务耗费大量时间。一个智能写作助手能显著提升效率,帮助用户快速生成高质量的文本内容。阿里云通义千问作为阿里巴巴推出的强大大语言模型(LLM),具备出色的自然语言理解与生成能力,非常适合用于开发智能写作工具。本博客将介绍如何基于通义千问构建一个智能写作助手,实现高效的内容生成和编辑功能。

1159 2
|
人工智能 前端开发 JavaScript
|

前端架构思考 :专注于多框架的并存可能并不是唯一的方向 — 探讨大模型时代前端的分层式微前端架构

随着前端技术的发展,微前端架构成为应对复杂大型应用的流行方案,允许多个团队使用不同技术栈并将其模块化集成。然而,这种设计在高交互性需求的应用中存在局限,如音视频处理、AI集成等。本文探讨了传统微前端架构的不足,并提出了一种新的分层式微前端架构,通过展示层与业务层的分离及基于功能的横向拆分,以更好地适应现代前端需求。

562 0
|
机器学习/深度学习 人工智能 自然语言处理
|

【Prompt Engineering提示工程技术:思维树 (ToT)、检索增强生成 (RAG)、自动推理并使用工具 (ART)】

思维树(ToT)框架,旨在解决复杂任务,通过构建一棵思维树,利用语言模型生成并评估中间步骤,结合搜索算法(如广度优先搜索)进行系统探索。ToT在不同任务中需定义思维步骤及候选数量,如“算24游戏”需三分步骤,每步评估可行性。实验表明,ToT显著优于其他提示方法。此外,ToT框架可结合强化学习不断进化,提升解决复杂问题的能力。

958 1
|
自然语言处理 测试技术 API
|

探索通义语音团队的创新之作 —— FunAudioLLM模型评测

随着人工智能技术的飞速发展,语音识别和语音合成技术在各个领域得到了广泛应用。阿里云推出的“通义语音大模型FunAudioLLM”作为最新的语音处理技术,备受业界关注。本次评测将深入探讨通义语音大模型的功能、性能及其在实际应用中的表现。

811 1

千问大模型

阿里云自主研发的千问大模型,凭借万亿级超大规模数据训练和领先的算法框架,实现全模态高效精准的模型服务调用。https://www.aliyun.com/product/tongyi

0
今日
1859
内容
8
活动
1279
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大模型服务平台百炼