|
XML 搜索推荐 API
|

通义千问API:让大模型使用各种工具

本章我们将通过一个简单的例子,揭示基于LangChain的Agent开发的秘密,从而了解如何扩展大模型的能力。

78546 193
|
人工智能 API C++
|

【AI绘画大比拼】通义万相VS文心一格:探索十种风格下的绘画生成差异!

近日,通义大模型家族的新成员——通义万相已在人工智能大会上亮相。其中,通义万相的强大的“文生图”功能,不禁让我想到了去年八月由百度依托飞桨、文心大模型的技术创新推出的“AI作画”首款产品——文心一格。 那么,在类似的Prompt下,两款产品的表现将会如何呢?今天就让我们就十种风格下二者生成图像的表现力,来看看这两款产品的差异。

4607 8
|
1天前
|
人工智能 自然语言处理 安全
|

直播带货效率提升300%:这个AI指令让技术人也能写出专业话术

技术人写直播话术太难?逻辑思维 vs 情感营销冲突大,学得慢、改得累。本文分享一套结构化AI指令,将专业带货方法论转化为可执行模板,支持多品类定制,30分钟生成高转化话术,助力开发者高效应对朋友求助或产品推广,轻松玩转直播文案。

48 5
|
2月前
|
机器学习/深度学习 存储 算法
|

动态规划算法深度解析:0-1背包问题

0-1背包问题是经典的组合优化问题,目标是在给定物品重量和价值及背包容量限制下,选取物品使得总价值最大化且每个物品仅能被选一次。该问题通常采用动态规划方法解决,通过构建二维状态表dp[i][j]记录前i个物品在容量j时的最大价值,利用状态转移方程避免重复计算子问题,从而高效求解最优解。

347 1
|
人工智能 自然语言处理 API
|

AI大模型 智能AI开源模型与大模型接口整理(8个开源模型+7个大模型接口)

AI大模型 智能AI开源模型与大模型接口整理(8个开源模型+7个大模型接口)

1853 5

通义大模型使用指南之通义听悟

本文介绍了阿里云通义平台的注册和使用,主要包括两个部分:注册和功能介绍。用户可以通过访问网址 <https://tongyi.aliyun.com/> 进行注册。在功能介绍中,重点讲解了通义听悟的功能,它提供实时语音转文字、音视频文件转文字、智能总结和中英互译服务。用户可以体验实时录音并标记重点、问题和代办事项,方便会议记录和整理。此外,通义听悟还支持上传音视频文件转写和播客链接转写,以及浏览器插件用于处理网页、手机和微信上的语音内容。

2279 0
|
3月前
|
人工智能 自然语言处理 安全
|

大模型备案要点一次过【附材料清单详解】

广东省最新公布一批大模型备案名单,新增14款备案模型、6款登记模型,累计达80款备案、23款登记。文章详解大模型备案流程、周期(5-10个月)、要求(主体资质、数据合规、内容安全、模型完成度)、所需材料(备案表、安全评估报告、服务协议、语料标注规则等)及完整备案流程(初审、自测、提交、整改、终审、公示)。为大模型企业备案提供全面指导。

649 2
|
5月前
|
数据采集 机器学习/深度学习 搜索推荐
|

利用通义大模型构建个性化推荐系统——从数据预处理到实时API部署

本文详细介绍了基于通义大模型构建个性化推荐系统的全流程,涵盖数据预处理、模型微调、实时部署及效果优化。通过采用Qwen-72B结合LoRA技术,实现电商场景下CTR提升58%,GMV增长12.7%。文章分析了特征工程、多任务学习和性能调优的关键步骤,并探讨内存优化与蒸馏实践。最后总结了大模型在推荐系统中的适用场景与局限性,提出未来向MoE架构和因果推断方向演进的建议。

740 11
|
自然语言处理 搜索推荐 API
|

通义千问API:用4行代码对话大模型

本章将通过一个简单的例子,让你快速进入到通义千问大模型应用开发的世界。

243143 110
|
人工智能 搜索推荐 云栖大会
|

什么是通义智文?AI阅读助手,用AI帮你读得多、读得快、读得懂

介绍通义智文产品发展历程、使用场景及主要功能。

52386 9
|
存储 人工智能 OLAP
|

LangChain+通义千问+AnalyticDB向量引擎保姆级教程

本文以构建AIGC落地应用ChatBot和构建AI Agent为例,从代码级别详细分享AI框架LangChain、阿里云通义大模型和AnalyticDB向量引擎的开发经验和最佳实践,给大家快速落地AIGC应用提供参考。

131720 94
|
3月前
|
机器学习/深度学习 存储 人工智能
|

深度解析大模型压缩技术:搞懂深度学习中的减枝、量化、知识蒸馏

本文系统解析深度学习模型压缩三大核心技术:剪枝、量化与知识蒸馏,详解如何实现模型缩小16倍、推理加速4倍。涵盖技术原理、工程实践与组合策略,助力AI模型高效部署至边缘设备。

698 1
|
4月前
|
存储 缓存 资源调度
|

# Qwen3-8B 与 ChatGPT-4o Mini 的 TTFT 性能对比与底层原理详解

Qwen3-8B 是通义实验室推出的80亿参数模型,支持32K上下文,采用FP8量化和CUDA优化,提升推理效率;ChatGPT-4o Mini 为OpenAI轻量模型,参数约3.8B,支持128K上下文,通过蒸馏技术实现低延迟。两者在TTFT、长文本处理和部署优化上各有优势,适用于不同应用场景。

540 9
|
6月前
|
机器学习/深度学习 人工智能 关系型数据库
|

通义 CoGenAV 大模型音画同步感知,重新定义语音理解边界

CoGenAV 是一种创新的多模态语音理解模型,核心理念是实现“音画同步”的深度理解。通过学习 audio-visual-text 的时序对齐关系,构建更鲁棒、更通用的语音表征框架。它在视觉语音识别(VSR)、音视频语音识别(AVSR)、语音增强与分离(AVSE/AVSS)及主动说话人检测(ASD)等任务中表现出色,尤其在嘈杂环境下性能显著提升。仅需 223 小时数据训练即可媲美传统数千小时数据的效果,大幅降低训练成本。CoGenAV 支持主流平台如 GitHub、HuggingFace 和 ModelScope,助力多场景应用开发。

498 10
|
6月前
|
存储 人工智能 关系型数据库
|

向量数据库和嵌入模型

本文介绍了向量数据库和嵌入模型的概念及应用,重点探讨了两者在AI技术栈中的协作关系。向量数据库是一种用于存储高维向量数据的解决方案,支持相似性搜索而非传统的关系型数据库精确匹配。文中通过实例展示了如何使用阿里百炼的文本嵌入模型(text-embedding-v3)将文本向量化,并结合Qdrant向量数据库进行存储与检索。代码示例部分详细说明了从文本嵌入到向量存储及查询的完整流程,为开发者提供了实践参考。

715 15
|
6月前
|
人工智能 运维 Serverless
|

一键部署 Qwen3! 0 代码,2 种方式全新体验

Qwen3 正式发布并开源 8 款混合推理模型,包括两款 MoE 模型(Qwen3-235B-A22B 和 Qwen3-30B-A3B)及六个 Dense 模型。这些模型支持 119 种语言,在代码、数学等测试中表现优异,并提供思考与非思考两种模式。依托阿里云函数计算 FC 算力,FunctionAI 平台支持模型服务和应用模板部署,适用于多种场景。用户可通过 Serverless 架构快速构建高弹性、智能化应用,显著降低开发成本,提升效率。试用链接及详细文档已提供,欢迎体验。

1720 1
|
27天前
|
人工智能 API 开发工具
|

AutoGen - 架构学习指南

AutoGen 是微软开源的 AI Agent 框架,支持多智能体协作与分布式部署。本指南从架构解析、技能清单到学习路径,带你由浅入深掌握其核心原理与实战应用,助力构建可扩展的智能系统。

316 5
|
7月前
|
Arthas 监控 Java
|

Arthas trace (方法内部调用路径,并输出方法路径上的每个节点上耗时)

Arthas trace (方法内部调用路径,并输出方法路径上的每个节点上耗时)

911 10
|
6天前
|
安全 定位技术 数据安全/隐私保护
|

数据被拍泄露,事后溯源还有意义吗? 屏幕隐形水印为您精准锁定泄露源!

数据泄露后溯源并非无用,而是阻断扩散、震慑违规、完善防护的关键。屏幕隐形水印可无感嵌入用户信息,实现精准追责,助力构建“事前防控、事中可控、事后可溯”的全周期安全体系。

44 2
|
4月前
|
人工智能 自然语言处理 vr&ar
|

通义首个音频生成模型 ThinkSound 开源,你的专业音效师

通义实验室推出首个音频生成模型ThinkSound,突破传统视频到音频生成技术局限,首次将思维链(CoT)应用于音频生成领域,实现高保真、强同步的空间音频生成。基于自研AudioCoT数据集,结合多模态大语言模型与统一音频生成模型,支持交互式编辑,显著提升音画匹配度与时序一致性。代码已开源,助力游戏、VR、AR等场景创新应用。

1012 4
|
5月前
|
人工智能 自然语言处理 算法
|

AI企业必看:最新结果标识合规要求及规范

随着《人工智能生成合成内容标识办法》及配套标准的发布,AI企业需快速掌握政策要求以确保合规运营。该办法明确指出,利用AI生成的内容(如文本、图片、音频、视频等)需通过显性标识(如“AI生成”字样)或隐性标识(如元数据、数字水印)进行标注。内容传播平台也需核验标识并提醒用户内容性质。此外,应用程序分发平台在审核时需确认是否提供AI生成服务及相关标识材料。对于AI企业而言,合规已成为必修课,需重点关注标识的规范性和溯源能力,以应对即将到来的监管要求。

802 0
|
6月前
|
Arthas 监控 Java
|

Arthas thread(查看当前JVM的线程堆栈信息)

Arthas thread(查看当前JVM的线程堆栈信息)

999 10
|
6月前
|
JSON 缓存 并行计算
|

NVIDIA 实现通义千问 Qwen3 的生产级应用集成和部署

阿里巴巴近期开源了通义千问Qwen3大语言模型(LLM),包含两款混合专家模型(MoE)235B-A22B与30B-A3B,以及六款稠密模型(Dense)从0.6B到32B不等。开发者可基于NVIDIA GPU使用TensorRT-LLM、Ollama、SGLang、vLLM等框架高效部署Qwen3系列模型,实现快速词元生成和生产级应用开发。

1162 8
|
6月前
|
Web App开发 人工智能 JSON
|

Windows版来啦!Qwen3+MCPs,用AI自动发布小红书图文/视频笔记!

上一篇用 Qwen3+MCPs实现AI自动发小红书的最佳实践 有超多小伙伴关注,同时也排队在蹲Windows版本的教程。

861 1
|
人工智能 自然语言处理 IDE
|

颠覆编程!通义灵码、包阅AI、CodeGeeX三大AI助手解锁无限潜力!

【10月更文挑战第12天】

1214 0
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
|

AIGC技术深度解析:生成式AI的革命性突破与产业应用实战

蒋星熠Jaxonic,AI技术探索者,深耕生成式AI领域。本文系统解析AIGC核心技术,涵盖Transformer架构、主流模型对比与实战应用,分享文本生成、图像创作等场景的实践经验,展望技术趋势与产业前景,助力开发者构建完整认知体系,共赴AI原生时代。

292 2
|
2月前
|
存储 机器学习/深度学习 算法
|

​​LLM推理效率的范式转移:FlashAttention与PagedAttention正在重塑AI部署的未来​

本文深度解析FlashAttention与PagedAttention两大LLM推理优化技术:前者通过分块计算提升注意力效率,后者借助分页管理降低KV Cache内存开销。二者分别从计算与内存维度突破性能瓶颈,显著提升大模型推理速度与吞吐量,是当前高效LLM系统的核心基石。建议收藏细读。

534 125
|
7月前
|
Arthas 监控 Java
|

Arthas profiler(使用async-profiler对应用采样,生成火焰图)

Arthas profiler(使用async-profiler对应用采样,生成火焰图)

910 10
|
11月前
|
自然语言处理 前端开发 Serverless
|

基于阿里云通义千问开发编程辅助与代码生成工具

随着软件开发需求的增加,编程辅助与代码生成工具成为开发者提高效率的利器。这类工具能够根据用户描述生成代码片段、协助调试、生成自动化脚本等,大大减少重复性劳动。阿里云通义千问作为一款先进的大语言模型,具备强大的自然语言处理和代码生成能力,非常适合用于开发这样的工具。

1342 3
|
2月前
|
人工智能 Ubuntu 固态存储
|

《2核2G阿里云神操作!Ubuntu+Ollama低成本部署Deepseek模型实战》

本文详解如何在阿里云2核2G轻量服务器上,通过Ubuntu系统与Ollama框架部署Deepseek-R1-Distill-Qwen-1.5B大模型。涵盖环境搭建、Ollama安装、虚拟内存配置及模型运行全流程,助力开发者以极低成本实现AI模型云端运行。

484 1
|
3月前
|
人机交互 API 开发工具
|

基于通义多模态大模型的实时音视频交互

Qwen-Omni是通义千问系列的全新多模态大模型,支持文本、图像、音频和视频的输入,并输出文本和音频。Omni-Realtime服务针对实时交互场景优化,提供低延迟的人机交互体验。

574 23
|
3月前
|
人工智能 JSON 前端开发
|

告别无效调参!ReAct代理设计:让LLM精准执行复杂任务的终极方案

ReAct模式通过“推理+行动”循环,使大语言模型能自主调用工具、获取实时信息并执行多步骤任务,有效突破LLM固有局限,提升任务准确性和智能化水平。

458 0
|
9月前
|
人工智能 自然语言处理 机器人
|

招商银行X通义大模型,2024年度AI最佳实践案例!

招商银行X通义大模型,2024年度AI最佳实践案例!

619 2
|
人工智能 架构师 搜索推荐
|

通义大模型使用指南之通义千问

本文介绍了如何注册并使用通义大模型,该平台提供了通义千问、通义万相和通义听悟三大功能。通义千问包含对话和百宝箱两个子功能。在对话中,用户需按照特定格式提问,如设定角色、背景等,但实际体验中,回复可能不够理想。百宝箱提供不同场景的应用,如健身教练和办公助理。通过示例展示了健身计划的生成,但与专业教练相比仍有差距。对于职场问题,通义千问的回答显得较为通用,难以满足个性化需求。

4673 0
|
2月前
|
人工智能 运维 API
|

高级RAG优化手册:3招解决检索不准和查询模糊

本文深入解析RAG(检索增强生成)技术的核心优化方法,涵盖背景、架构与实践。RAG通过整合外部知识库,弥补大语言模型在实时性、准确性和专业性上的不足,广泛应用于企业场景。文章系统讲解RAG如何解决知识静态、生成幻觉与专业深度不足等问题,并剖析其离线索引与在线生成的闭环流程。此外,还介绍了高级优化策略,如查询重写、混合检索与结果重排序,助力突破RAG应用瓶颈。

328 1
|
7月前
|
机器学习/深度学习 编解码 缓存
|

通义万相2.1首尾帧模型开源!细节真实生动+过渡丝滑,指令遵循表现出色!

通义万相2.1首尾帧模型开源!细节真实生动+过渡丝滑,指令遵循表现出色!

898 7
|
12月前
|
人工智能 自然语言处理 并行计算
|

探索大模型部署:基于 VLLM 和 ModelScope 与 Qwen2.5 在双 32G VGPU 上的实践之旅

本文介绍了使用 `VLLM` 和 `ModelScope` 部署 `Qwen2.5` 大模型的实践过程,包括环境搭建、模型下载和在双 32G VGPU 上的成功部署,展现了高性能计算与大模型结合的强大力量。

2798 3
|
人工智能 API Python
|

三分钟快速搭建基于FastAPI的AI Agent应用!

【10月更文挑战第1天】

945 0
|
存储 并行计算 PyTorch
|

社区供稿 | 10G显存,通义千问-7B-int4消费级显卡最佳实践

在魔搭社区,通义千问团队发布了Qwen-7B-Chat的Int4量化模型,Qwen-7B-Chat-Int4。该方案的优势在于,它能够实现几乎无损的性能表现,模型大小仅为5.5GB,内存消耗低,速度甚至超过BF16。

28203 8
|
数据可视化 物联网 PyTorch
|

通义千问7B模型开源,魔搭最佳实践来了

通义千问开源!阿里云开源通义千问70亿参数模型,包括通用模型Qwen-7B-Base和对话模型Qwen-7B-Chat,两款模型均已上线ModelScope魔搭社区,开源、免费、可商用,欢迎大家来体验。

48311 59

昇腾910A部署Qwen2-7B教程

Qwen2-7BS适配昇腾910A教程。

2007 0
|
3月前
|
存储 人工智能 自然语言处理
|

大模型备案攻略—2025全网最新最详细解读版

随着AI技术的发展,大模型备案成为行业热点。本文详解备案所需具体条件与注意事项,涵盖模型功能、适用场景、研制情况、安全评估及备案材料等核心内容,帮助企业全面了解备案流程,规避合规风险,顺利推进产品上线。

662 2
|
27天前
|
并行计算 PyTorch 算法框架/工具
|

vLLM 架构学习指南

本指南深入解析vLLM高性能推理引擎架构,涵盖核心创新PagedAttention与连续批处理技术,结合代码结构、学习路径与实践建议,系统指导用户从入门到贡献源码的全过程。

360 2
|
3月前
|
存储 自然语言处理 前端开发
|

百亿级知识库解决方案:从零带你构建高并发RAG架构(附实践代码)

本文详解构建高效RAG系统的关键技术,涵盖基础架构、高级查询转换、智能路由、索引优化、噪声控制与端到端评估,助你打造稳定、精准的检索增强生成系统。

534 2
|
5月前
|
编解码 自然语言处理 安全
|

📣通义大模型新成员Qwen-VLo,重磅上线,它实现了从“看懂”世界到“描绘”世界

通义千问团队推出全新多模态统一理解与生成模型Qwen VLo,具备强大的图像理解与生成能力。它不仅能“看懂”图像内容,还能基于理解进行高质量再创造,实现从感知到生成的跨越。支持开放指令编辑、多语言交互及复杂任务处理,适用于图像生成、风格迁移、检测标注等多种场景。

948 1
|
5月前
|
人工智能 API 开发者
|

智能体(AI Agent)开发实战之【LangChain】(一)接入大模型输出结果

LangChain 是一个开源框架,专为构建与大语言模型(LLMs)相关的应用设计。通过集成多个 API、数据源和工具,助力开发者高效构建智能应用。本文介绍了 LangChain 的环境准备(如安装 LangChain、OpenAI 及国内 DeepSeek 等库)、代码实现(以国内开源大模型 Qwen 为例,展示接入及输出结果的全流程),以及核心参数配置说明。LangChain 的灵活性和强大功能使其成为开发对话式智能应用的理想选择。

1059 0
|
6月前
|
人工智能 弹性计算 智能设计
|

🎨 三步打造AI创意工坊 | 通义万相图像生成服务极速部署指南

🚀 从零到大师 | 通义万相智能创作系统部署指南

979 146
|
机器学习/深度学习 人工智能 自然语言处理
|

AI大模型企业应用实战-什么是zero-shot, one-shot和few-shot Learning

【8月更文挑战第17天】

1201 0
|
2月前
|
设计模式 算法 Java
|

软考中级软件设计师专项-设计模式篇

备战软考中级软件设计师?本文聚焦高分设计模式模块,详解23种模式的核心意图与场景,结合UML图、Java代码实例及历年真题,覆盖创建型、结构型、行为型三大类,助你打通理论到实战。

180 1
|
4月前
|
人工智能 搜索推荐 小程序
|

AI题库考试系统

本平台融合AI智能技术,打造高效课程试题库,支持PC、手机在线刷题,提供智能出题、自动解析、错题回顾、背题模式等功能,覆盖章节练习、笔记收藏、多端同步,助力学员精准提分,全面提升学习效率。

455 1

通义大模型

阿里云自主研发的通义大模型,凭借万亿级超大规模数据训练和领先的算法框架,实现全模态高效精准的模型服务调用。https://www.aliyun.com/product/tongyi

0
今日
1487
内容
8
活动
995
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大模型服务平台百炼