|
6月前
|
人工智能 自然语言处理 搜索推荐
|

Qwen 家族再上新!

Qwen3 Embedding 是基于 Qwen3 基础模型训练的文本嵌入模型系列,可将离散符号转化为连续向量,捕捉语义关系。结合 Qwen3 Reranker 模型,通过“初筛+精排”流程提升搜索与推荐系统的相关性排序能力。该系列模型支持多语言、提供灵活架构(0.6B-8B 参数规模),并在 MTEB 多语言榜单中排名第一。用户可通过 Hugging Face、ModelScope 和 GitHub 快速体验模型服务。

774 3
|
人工智能 编解码 机器人
|

通义千问,又开源了!

通义千问,又开源了!

52273 66
|
13天前
|
传感器 人工智能 算法
|

2025 全球 GEO 行业观察:双轮驱动(市场 + 技术),AI 时代品牌新基建的破局之道

AI重构信息分发,GEO成品牌新基建。2025年AI搜索占全球63%,传统SEO失效,生成式引擎优化(GEO)通过结构化数据、语义适配与权威构建,助力内容在AI答案中优先被引。本文解析GEO六大核心挑战与落地策略。

119 2
|
2月前
|
机器学习/深度学习 测试技术
|

先SFT后RL但是效果不佳?你可能没用好“离线专家数据”!

通义实验室Trinity-RFT团队提出CHORD框架,通过动态融合SFT与RL,解决大模型训练中“越学越差”“顾此失彼”等问题。该框架引入细粒度Token级权重与软过渡机制,实现从模仿到超越的高效学习,在数学推理与通用任务上均显著提升性能,相关代码已开源。

414 0
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
|

AIGC技术深度解析:生成式AI的革命性突破与产业应用实战

蒋星熠Jaxonic,AI技术探索者,深耕生成式AI领域。本文系统解析AIGC核心技术,涵盖Transformer架构、主流模型对比与实战应用,分享文本生成、图像创作等场景的实践经验,展望技术趋势与产业前景,助力开发者构建完整认知体系,共赴AI原生时代。

663 2
|
4月前
|
人机交互 API 开发工具
|

基于通义多模态大模型的实时音视频交互

Qwen-Omni是通义千问系列的全新多模态大模型,支持文本、图像、音频和视频的输入,并输出文本和音频。Omni-Realtime服务针对实时交互场景优化,提供低延迟的人机交互体验。

904 23
|
6月前
|
数据采集 自然语言处理 调度
|

优化通义大模型推理性能:企业级场景下的延迟与成本削减策略

本文基于金融、电商、医疗等领域的实战经验,深入探讨通义千问等大模型的推理优化技术栈。从计算图优化、批处理策略、量化压缩到系统架构四个维度展开,结合Python代码示例与压力测试数据,提供企业级解决方案。针对延迟敏感、高吞吐及成本敏感场景,分析性能瓶颈并提出算子融合、动态批处理、混合精度量化等方法,同时设计分布式推理架构与冷启动优化策略。通过案例展示,如电商大促场景优化,实现峰值QPS提升6.5倍、P99延迟降低53%、月度成本下降62%。文章还提供优化实施路线图,助力企业分阶段落地技术方案。

787 5
|
6月前
|
数据采集 机器学习/深度学习 搜索推荐
|

利用通义大模型构建个性化推荐系统——从数据预处理到实时API部署

本文详细介绍了基于通义大模型构建个性化推荐系统的全流程,涵盖数据预处理、模型微调、实时部署及效果优化。通过采用Qwen-72B结合LoRA技术,实现电商场景下CTR提升58%,GMV增长12.7%。文章分析了特征工程、多任务学习和性能调优的关键步骤,并探讨内存优化与蒸馏实践。最后总结了大模型在推荐系统中的适用场景与局限性,提出未来向MoE架构和因果推断方向演进的建议。

1114 11
|
6月前
|

TortoiseSVN使用-合并分支代码

TortoiseSVN使用-合并分支代码

488 1
|
人工智能 前端开发 API
|

基于agentscope的多智能体游戏场景-骗子酒馆

骗子酒馆是一款基于多智能体系统的在线社交推理游戏,玩家通过掷骰子和扑克牌进行智力和心理博弈,结合大语言模型技术,每个游戏角色由AI扮演,具备独特的性格和决策逻辑,提供高度沉浸式的体验。游戏采用黑板通信模式,确保信息高效交换,支持多种角色如胆小鬼、占卜师等,每个角色拥有特定的技能和行为模式,增强游戏的策略深度和互动性。游戏界面简洁,操作流畅,适合喜欢心理战和策略游戏的玩家。文章末尾有源码和体验地址。

1646 13
|
存储 人工智能
|

AI大模型企业应用实战-为Langchain Agent添加记忆功能

【8月更文挑战第18天】

953 0
|
机器学习/深度学习 人工智能 自然语言处理
|

聊一聊生成式AI

生成式AI(Generative AI)是指一类能够自主创造新内容的人工智能技术,这些内容可以是文本、图像、音频、视频等。与传统的分析性或分类性AI系统不同,生成式模型的主要任务不是对现有数据进行分类或预测,而是生成全新的、之前不存在的数据实例。这些模型通过学习现有数据集中的模式和规律,能够创造出逼真或富有创意的内容。

781 0
|
1月前
|
人工智能 弹性计算 自然语言处理
|

史上首次!万卡AI集群支撑双11,通义千问大规模落地

2025年双11,阿里云提供超千万核ECS算力及万卡灵骏智算集群,支撑淘宝推荐等核心业务性能提升超30%。通义千问大模型大规模落地,Qwen-MT单日调用超14亿次,助力商品出海、客服与经营分析,全面赋能双11智能化升级。

284 0
|
2月前
|
人工智能 自然语言处理 前端开发
|

最佳实践2:用通义灵码以自然语言交互实现 AI 高考志愿填报系统

本项目旨在通过自然语言交互,结合通义千问AI模型,构建一个智能高考志愿填报系统。利用Vue3与Python,实现信息采集、AI推荐、专业详情展示及数据存储功能,支持响应式设计与Supabase数据库集成,助力考生精准择校选专业。(239字)

321 12
|
6月前
|
机器学习/深度学习 人工智能 算法
|

通义OmniAudio大模型,让 AI 看懂 360° 视频,并“听”出对应的空间音频

OmniAudio 是一项突破性的空间音频生成技术,能够直接从 360° 视频生成 FOA(First-order Ambisonics)空间音频,为虚拟现实和沉浸式娱乐带来全新可能。通过自监督 coarse-to-fine 预训练和双分支视频表示微调,OmniAudio 在非空间音频质量和空间定位准确性上显著优于现有方法。项目包含超过 103,000 个视频片段的 Sphere360 数据集,支持高质量的模型训练与评估。代码、数据及论文均已开源,助力沉浸式体验技术发展。

851 63
|
8月前
|
机器学习/深度学习 人工智能 算法
|

算法备案全流程实操

随着《生成式人工智能服务管理暂行办法》在2024年实施,算法备案成为强制性要求。未合规将导致APP下架或高额罚款。本文详解算法备案的核心逻辑与流程,涵盖必备案算法类型、三大监管红线、六大阶段的关键节点,并提供阿里云工具支持,如合规预评估平台和备案助手插件。内容包括金融风控算法的可解释性要求、生成式AI的内容安全措施及个人开发者的技术能力证明方法,助力开发者实现持续合规。

1140 4
|
10月前
|
人工智能 自然语言处理 算法
|

垂直领域大模型必须备案吗?90%企业都搞错的大模型备案真相!

珠宝设计师专用的大模型是否需要备案?本文解析大模型备案与算法备案的区别及法规边界。大模型备案针对公众服务,仅面向专业设计师可暂缓;但算法备案必须完成。涉及深度合成类算法的企业需在30日内备案。合规不仅是义务,更是提升企业竞争力的关键。

717 1
|
JSON 自然语言处理 Serverless
|

基于阿里云通义千问开发智能写作助手

现代办公中,撰写邮件、会议记录、报告等任务耗费大量时间。一个智能写作助手能显著提升效率,帮助用户快速生成高质量的文本内容。阿里云通义千问作为阿里巴巴推出的强大大语言模型(LLM),具备出色的自然语言理解与生成能力,非常适合用于开发智能写作工具。本博客将介绍如何基于通义千问构建一个智能写作助手,实现高效的内容生成和编辑功能。

774 2
|
存储 人工智能 缓存
|

AI 提示词模板相关的架构设计

现在很多企业纷纷研发大语言模型以解决业务问题。提示词在与模型交互中起到关键作用。为优化提示词模板的修改、提高渲染效率及确保安全性,架构设计注重可修改性、安全性、可靠性和性能。设计包括:将提示词存储在OSS以方便修改和版本控制;使用本地缓存提升读取性能;模板引擎增强灵活性;秘钥安全存储在加密系统中;并通过配置中心动态调整。此设计旨在提供高效、安全且可靠的AI交互体验等。

1267 78
|
2月前
|
存储 缓存 负载均衡
|

TensorRT LLM 中的并行策略

TensorRT LLM提供多种GPU并行策略,支持大模型在显存与性能受限时的高效部署。涵盖张量、流水线、数据、专家及上下文并行,并推出宽专家并行(Wide-EP)应对大规模MoE模型的负载不均与通信挑战,结合智能负载均衡与优化通信核心,提升推理效率与可扩展性。

494 154
|
2月前
|
人工智能 搜索推荐 程序员
|

从程序员到UP主:一个结构化的B站视频文案生成方案

专为技术人打造的B站视频文案生成指令,结构化拆解内容创作流程。输入主题、类型等信息,结合AI一键生成含分镜脚本、标题、SEO及互动设计的完整方案,提升创作效率与视频质量。

415 2
|
3月前
|
芯片
|

MicroPython+ESP32 C3+ST7735S LCD屏 WIFI联网并显示时间

本案例基于ESP32 C3与ST7735S驱动的1.8寸TFT屏,实现WIFI连接显示、实时时间展示及中英文字符渲染。通过MicroPython驱动屏幕,支持自定义字库与彩色文字输出,适用于嵌入式图形显示应用。

485 1
|
9月前
|
存储 人工智能 搜索推荐
|

WiseMindAI:一款AI智能知识库,数据完全本地化,支持文档对话、10+种文档、10+AI大模型等

WiseMindAI 是一款由 Chris 开发的 AI 智能学习助手,支持数据完全本地化存储,确保用户隐私安全。它兼容多种文档格式(如 PDF、Markdown 等),并提供 AI 文档总结、智能笔记、沉浸式翻译、知识卡片生成等功能。此外,WiseMindAI 支持 10+ 大语言模型和自定义 AI 插件,适用于 Windows 和 Mac 平台,支持简体中文、繁体中文及英文。

836 74
|
10月前
|
存储 人工智能 API
|

DeepSeek——DeepSeek模型部署实战

本文介绍了DeepSeek大模型的本地部署方法、使用方式及API接入。首先,通过下载Ollama平台部署DeepSeek-R1模型,提供7种不同参数版本(1.5b至671b),用户可根据硬件选择合适的模型大小。接着,文章详细描述了如何在终端运行命令启动模型,并通过Chatbox官网下载并接入DeepSeek API,实现本地和云端模型的交互。最后,提及了DeepSeek官网和集成工具如POE的使用,帮助用户更好地利用DeepSeek进行开发和应用。

1195 76
|
API 开发工具
|

MAC 环境变量设置方法

本文介绍在MAC环境下设置环境变量的方法,以“DASHSCOPE_API_KEY”为例,图文展示设置环境变量的操作方法。

2033 0

vs code 安装通义灵码 网络连接失败

vs code 安装通义灵码时 无法访问 127.0.0.1:37510 网站

2304 0
|
1月前
|
人工智能 搜索推荐 安全
|

商务邮件沟通效率提升85%:一套AI指令解决企业邮件痛点

本文基于3000+企业邮件案例,提供一套专业的AI商务邮件指令,通过数据驱动的方法论,帮助企业实现邮件沟通效率提升85%,客户转化率增加60%,年度ROI达400%。包含完整指令代码、实战案例和量化收益分析。

235 11
|
3月前
|
人工智能
|

上海徐汇区大模型备案与大模型登记奖励补贴申报指南

上海徐汇区启动大模型备案及服务登记奖励申报,最高奖励500万元。适用于已通过备案或登记的企业,申报期为2025年8月29日至9月12日。奖励政策旨在推动人工智能产业发展,申报材料包括备案/登记证明、信用代码、身份证明等。纸质与电子材料需按要求提交。

310 1
|
4月前
|
人工智能 算法 前端开发
|

超越Prompt Engineering:揭秘高并发AI系统的上下文工程实践

本文系统解析AI工程范式从Prompt Engineering到Context Engineering的演进路径,深入探讨RAG、向量数据库、上下文压缩等关键技术,并结合LangGraph与智能体系统架构,助力开发者构建高可靠AI应用。

655 2
|
4月前
|
机器学习/深度学习 存储 人工智能
|

深度解析大模型压缩技术:搞懂深度学习中的减枝、量化、知识蒸馏

本文系统解析深度学习模型压缩三大核心技术:剪枝、量化与知识蒸馏,详解如何实现模型缩小16倍、推理加速4倍。涵盖技术原理、工程实践与组合策略,助力AI模型高效部署至边缘设备。

1022 2
|
8月前
|
JSON 测试技术 API
|

大模型工程师基础之学会使用openai

本系列教程涵盖OpenAI API基础到高级应用,包括文本生成、图像处理、语音交互、会话管理、流式响应、文件输入、推理模型及性能评估等十大核心功能。适合新手入门与工程师实践,助您掌握大模型开发关键技术。从简单Prompt设计到复杂多模态任务,逐步深入,结合实例代码与最佳实践,提升实际开发能力。希望这些内容对您有帮助!

880 11
|
26天前
|
人工智能 JavaScript IDE
|

别用"战术勤奋"掩盖"战略懒惰":AI时代的降维竞品分析

5%的产品死于"盲视"。本文不仅是一套竞品分析AI指令,更是一次从战术勤奋到战略觉醒的认知升级。教你如何利用AI构建全天候商业情报雷达,寻找巨头缝隙中的差异化生存之道,实现商业战场的降维打击。

204 7
|
1月前
|
人工智能 缓存 决策智能
|

AI律师数字分身:法律科技领域的多智能体架构实践

AI数字分身破解法律服务规模化难题,通过多模态智能体实现7×24小时咨询响应、案情结构化提取与智能分流。基于知识图谱与推理引擎,提升律所线索留存率与律师人效,推动法律服务降本增效。

485 11
|
2月前
|
人工智能 JSON 监控
|

三步构建AI评估体系:从解决“幻觉”到实现高效监控

AI时代,评估成关键技能。通过错误分析、归类量化与自动化监控,系统化改进AI应用,应对幻觉等问题。Anthropic与OpenAI均强调:评估是产品迭代的核心,数据驱动优于直觉,让AI真正服务于目标。

305 8
|
3月前
|
安全 Java 数据库
|

SpringSecurity认证授权及项目集成

本文介绍了基于Spring Security的权限管理框架,涵盖认证、授权与鉴权核心概念,通过快速入门示例演示集成流程,并结合数据库实现用户认证。进一步扩展实现正常登录,JWT登录及鉴权管理器,实现灵活的安全控制,适用于前后端分离项目中的权限设计与实践。

367 4
|
7月前
|
机器学习/深度学习 人工智能 自然语言处理
|

通义千问推理模型QwQ-32B开源,更小尺寸、更强性能

阿里云发布并开源全新推理模型通义千问QwQ-32B,通过大规模强化学习,在数学、代码及通用能力上实现质的飞跃,性能比肩DeepSeek-R1。该模型大幅降低部署成本,支持消费级显卡本地部署,并集成智能体Agent相关能力。阿里云采用Apache2.0协议全球开源,用户可通过通义APP免费体验。此外,通义团队已开源200多款模型,覆盖全模态和全尺寸。

982 20
|
7月前
|
人工智能 运维 Serverless
|

一键部署 Qwen3! 0 代码,2 种方式全新体验

Qwen3 正式发布并开源 8 款混合推理模型,包括两款 MoE 模型(Qwen3-235B-A22B 和 Qwen3-30B-A3B)及六个 Dense 模型。这些模型支持 119 种语言,在代码、数学等测试中表现优异,并提供思考与非思考两种模式。依托阿里云函数计算 FC 算力,FunctionAI 平台支持模型服务和应用模板部署,适用于多种场景。用户可通过 Serverless 架构快速构建高弹性、智能化应用,显著降低开发成本,提升效率。试用链接及详细文档已提供,欢迎体验。

1968 1
|
8月前
|
Arthas 监控 Java
|

Arthas trace (方法内部调用路径,并输出方法路径上的每个节点上耗时)

Arthas trace (方法内部调用路径,并输出方法路径上的每个节点上耗时)

1218 10
|
10月前
|
人工智能 算法 搜索推荐
|

单纯接入第三方模型就无需算法备案了么?

随着人工智能的发展,企业接入第三方模型提升业务能力的现象日益普遍,但算法备案问题引发诸多讨论。根据相关法规,无论使用自研或第三方模型,只要涉及向中国境内公众提供算法推荐服务,企业均需履行备案义务。这不仅因为服务性质未变,风险依然存在,也符合监管要求。备案内容涵盖模型基本信息、算法优化目标等,且需动态管理。未备案可能面临法律和运营风险。建议企业提前规划、合规管理和积极沟通,确保合法合规运营。

896 17

昇腾910A部署Qwen2-7B教程

Qwen2-7BS适配昇腾910A教程。

2320 0
|
机器学习/深度学习 自然语言处理 搜索推荐
|

通义语音大模型评测:迈向更自然、更智能的语音交互

随着人工智能技术的迅猛发展,语音识别和自然语言处理领域不断涌现出新的模型和应用。阿里云推出的通义语音大模型,正是在这一背景下应运而生。本文将对通义语音大模型进行详细评测,探讨其技术架构、应用场景、性能表现以及未来发展前景。

1505 0
|
人工智能 自然语言处理 测试技术
|

通义灵码评测: 阿里云出品通义大模型AI代码编程辅助工具

通义灵码是阿里云出品的一款基于通义大模型的AI智能编码辅助工具,提供行级/函数级实时续写、自然语言生成代码、单元测试生成、代码注释生成、代码解释、研发智能问答、异常报错排查等能力,并针对阿里云 SDK/OpenAPI 的使用场景调优,助力开发者高效、流畅的编码。

1912 0
|
人工智能
|

【奶奶看了都会】ComfyUI+SVD制作AI视频教程,附效果演示

AI一天,人间一年。大家好啊,我是小卷,最近AI绘画又发展出一些新玩意了,小卷因为工作的关系有一个月没关注AI的发展了,都有点跟不上版本节奏了。。。

1150 2
|
机器学习/深度学习 自然语言处理 达摩院
|

通义大模型:打造更智能、更灵活的自然语言处理技术

大家好,今天我想向大家介绍一款备受瞩目的自然语言处理技术——通义大模型。作为一种基于深度学习的人工智能技术,通义大模型能够模拟人类的思维方式,实现更智能、更灵活的自然语言处理,为我们的生活和工作带来了极大的便利。

1454 2
|
1月前
|
机器学习/深度学习 人工智能 算法
|

乘AIGC浪潮:把握万亿级机遇

AIGC正加速从技术走向产业落地,万亿市场规模催生全链条人才需求。北京、上海政策加码,算力基建完善,2025-2027年成关键窗口期。七大核心岗位——AIGC工程师、大模型训练师、AI工程师等全面爆发,覆盖技术到应用各层级,高薪抢人成常态。工信部认证加持,职业前景广阔,人人皆可入局,抢占AI时代新风口。

239 1
|
5月前
|
人工智能 自然语言处理 搜索推荐
|

AI赋能教育与阿里云通义千问的结合

本简介介绍了AI技术如何赋能教育行业,结合阿里云“通义千问”大模型,助力海豚大数据及人工智能实验平台实现个性化教学、智能答疑与资源优化,推动高校与企业人才培养模式革新,构建终身学习生态体系。

428 1
|
7月前
|
人工智能 弹性计算 智能设计
|

🎨 三步打造AI创意工坊 | 通义万相图像生成服务极速部署指南

🚀 从零到大师 | 通义万相智能创作系统部署指南

1231 146
|
10月前
|
传感器 人工智能 算法
|

雷鸟创新X阿里云:AR眼镜接入通义大模型!

雷鸟创新X阿里云:AR眼镜接入通义大模型!

779 0
|
11月前
|
人工智能 编解码
|

通义万相2.1:VBench榜单荣登第一!阿里通义万相最新视频生成模型,支持生成1080P长视频

万相2.1是阿里通义万相最新推出的视频生成模型,支持1080P无限长视频生成,具备复杂动作展现、物理规律还原、艺术风格转换等功能。

2268 27
|
存储 人工智能 Serverless
|

搭建文生图AI系统

随着人工智能的发展,**文本生成图像(文生图)**技术在广告创意、视觉设计、内容营销等领域应用广泛。阿里云通义千问作为先进的大语言模型,不仅具备强大的文本理解能力,还能与图像生成技术结合,实现根据文本描述自动生成高质量图像。 本博客将展示如何使用通义千问与阿里云的其他产品(如函数计算、API 网关、对象存储 OSS)搭建一个简单的文生图系统,实现用户输入文本并生成相应图像的功能。

766 6

通义大模型

阿里云自主研发的通义大模型,凭借万亿级超大规模数据训练和领先的算法框架,实现全模态高效精准的模型服务调用。https://www.aliyun.com/product/tongyi

1
今日
1570
内容
8
活动
1064
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大模型服务平台百炼