通义大模型-最新-第7页-阿里云开发者社区

bailiantest1

|

6月前

|

机器学习/深度学习编解码缓存

|

博文

通义万相首尾帧图模型一键生成特效视频！

本文介绍了阿里通义发布的Wan2.1系列模型及其首尾帧生视频功能。该模型采用先进的DiT架构，通过高效的VAE模型降低运算成本，同时利用Full Attention机制确保生成视频的时间与空间一致性。模型训练分为三个阶段，逐步优化首尾帧生成能力及细节复刻效果。此外，文章展示了具体案例，并详细说明了训练和推理优化方法。目前，该模型已开源。

924 9 9

刘大猫.

|

6月前

|

博文

TortoiseSVN使用-合并深度介绍

121 1 1

dbxvajaw7tgeq

|

6月前

|

开发工具 git

|

问答

通义灵码生成git commit时描述文件，能否自己定义规则。

421 1 0

已解决

游客cyl7mbctc25es

|

6月前

|

问答

我设置了enable_thinking，但是回答时候还是携带了思考。

297 0 0

bailiantest1

|

6月前

|

机器学习/深度学习人工智能算法

|

博文

通义OmniAudio大模型，让 AI 看懂 360° 视频，并“听”出对应的空间音频

OmniAudio 是一项突破性的空间音频生成技术，能够直接从 360° 视频生成 FOA（First-order Ambisonics）空间音频，为虚拟现实和沉浸式娱乐带来全新可能。通过自监督 coarse-to-fine 预训练和双分支视频表示微调，OmniAudio 在非空间音频质量和空间定位准确性上显著优于现有方法。项目包含超过 103,000 个视频片段的 Sphere360 数据集，支持高质量的模型训练与评估。代码、数据及论文均已开源，助力沉浸式体验技术发展。

851 63 63

刘大猫.

|

6月前

|

Java Linux 开发工具

|

博文

Linux下版本控制器(SVN) -命令行客户端

199 4 4

JustDoIT技术吧

|

6月前

|

人工智能自然语言处理搜索推荐

|

博文

Spark-TTS: AI语音合成的"变声大师"

Spark-TTS 是一款革命性的语音合成模型，被誉为“变声大师”。它通过创新的 BiCodec 技术将语音分解为语义和全局两种 Token，实现对音色、性别、语速等属性的精细控制。结合统一的 LLM 架构，Spark-TTS 简化了传统 TTS 的复杂流程，同时提供了前所未有的灵活性。此外，团队还发布了 VoxBox 开源数据集，为行业提供标准评估基准。尽管在零样本场景下仍存改进空间，但 Spark-TTS 已经开启了语音合成新时代，让个性化、可控的 AI 语音成为可能。

752 5 5

刘大猫.

|

6月前

|

缓存安全 Java

|

博文

Shiro简介及SpringBoot集成Shiro(狂神说视频简易版)

559 7 7

游客wfurz6c6qiy2o

|

7月前

|

博文

AiPy实战：心情&收支日记本

展示了aipy是如何设计记录心情&收支的日记本的过程

149 2 2

刘大猫.

|

7月前

|

前端开发 JavaScript

|

博文

AJax(XHR+Get和Post+AJax的封装)

223 15 16

刘大猫.

|

7月前

|

前端开发

|

博文

前端使用正则表达式提取经纬度度分秒值

208 14 14

1896192610650387

|

7月前

|

人工智能数据可视化 JavaScript

|

博文

颠覆开发效率！国内首个微服务编排框架Juggle开源啦！

Juggle是国内首个开源的微服务编排框架，专注于解决企业微服务进程中接口重复开发、系统对接复杂等问题。它提供零代码、低代码和AI增强功能，通过可视化拖拽快速组装简单API为复杂接口，支持多协议、多语言脚本和流程多版本管理。相比国外框架如Conductor，Juggle更贴合国内需求，具备高效开发、企业级可靠性及信创适配等优势，助力企业实现敏捷创新与数字化转型。

633 0 0

bailiantest1

|

7月前

|

人工智能安全 Android开发

|

博文

手机也能跑通义Qwen3大模型，手把手教你部署！

全球开源模型冠军Qwen3与端到端全模态模型Qwen2.5-Omni现已成功在手机上跑通！借助MNN支持，适配Android、iOS及桌面端，实现低延迟、本地化、高安全的AI体验。用户可通过自定义Sampler设置、System Prompt和Max New Tokens调节模型输出风格与长度。

3776 11 12

bailiantest1

|

7月前

|

机器学习/深度学习人工智能关系型数据库

|

博文

通义 CoGenAV 大模型音画同步感知，重新定义语音理解边界

CoGenAV 是一种创新的多模态语音理解模型，核心理念是实现“音画同步”的深度理解。通过学习 audio-visual-text 的时序对齐关系，构建更鲁棒、更通用的语音表征框架。它在视觉语音识别（VSR）、音视频语音识别（AVSR）、语音增强与分离（AVSE/AVSS）及主动说话人检测（ASD）等任务中表现出色，尤其在嘈杂环境下性能显著提升。仅需 223 小时数据训练即可媲美传统数千小时数据的效果，大幅降低训练成本。CoGenAV 支持主流平台如 GitHub、HuggingFace 和 ModelScope，助力多场景应用开发。

764 10 10

刘大猫.

|

7月前

|

JSON 前端开发 JavaScript

|

博文

前端工具方法整理

192 8 8

1229773385934723

|

7月前

|

弹性计算自然语言处理 Ubuntu

|

博文

从0开始在阿里云上搭建基于通义千问的钉钉智能问答机器人

本文描述在阿里云上从0开始构建一个LLM智能问答钉钉机器人。LLM直接调用了阿里云百炼平台提供的调用服务。

549 4 4

云上的喵酱

|

7月前

|

存储人工智能关系型数据库

|

博文

向量数据库和嵌入模型

本文介绍了向量数据库和嵌入模型的概念及应用，重点探讨了两者在AI技术栈中的协作关系。向量数据库是一种用于存储高维向量数据的解决方案，支持相似性搜索而非传统的关系型数据库精确匹配。文中通过实例展示了如何使用阿里百炼的文本嵌入模型（text-embedding-v3）将文本向量化，并结合Qdrant向量数据库进行存储与检索。代码示例部分详细说明了从文本嵌入到向量存储及查询的完整流程，为开发者提供了实践参考。

980 15 17

刘大猫.

|

7月前

|

前端开发

|

博文

前端使用正则表达式检查是否为十六进制字符串

202 6 6

刘大猫.

|

7月前

|

Java Linux

|

博文

自定义linux脚本用于快速jar包启动、停止、重启

343 29 29

游客wfurz6c6qiy2o

|

7月前

|

数据可视化数据挖掘 Python

|

博文

Aipy实战：分析潜在的糖尿病患者

Aipy是一款本地部署、隐私性强的垂直型Agent，结合LLM与Python能力，可操控局域网设备、调用任意模型且成本低廉。本文介绍其通过分析“训练数据集.csv”学习糖尿病特征，判断“病人数据集.csv”中的潜在患者，并标记风险。过程中，Aipy快速拆解任务，在表格中新增“糖尿病风险”和“概率”列，以0/1直观展示结果，最终生成预测文件，整个流程仅耗时5分钟，高效且实用。

185 11 11

老赵聊算法备案、大模型备案

|

7月前

|

数据采集人工智能算法

|

博文

深度合成算法备案全知道：不同角色审核的重点是什么？

深度合成技术正深刻改变生活，其算法备案对保障技术安全至关重要。目前已有3445款算法通过备案，其中服务提供者占76.78%。本文详解服务提供者与技术支持者的角色差异、审核重点及文件要求，强调两者不可混用且需独立备案。只有严格遵循备案流程，才能让深度合成技术真正造福大众，推动行业健康发展。

320 0 0

刘大猫.

|

7月前

|

消息中间件 Linux Kafka

|

博文

linux命令使用消费kafka的生产者、消费者

340 16 16

刘大猫.

|

7月前

|

Java Linux

|

博文

java的jar后台启动

195 14 14

刘大猫.

|

7月前

|

Linux Shell 数据安全/隐私保护

|

博文

Centos或Linux编写一键式Shell脚本创建用户、组、目录分配权限指导手册

456 3 3

刘大猫.

|

7月前

|

Linux Shell

|

博文

Centos或Linux编写一键式Shell脚本删除用户、组指导手册

231 4 4

刘大猫.

|

7月前

|

Arthas 监控 Java

|

博文

Arthas sysprop（查看和修改JVM的系统属性）

245 9 9

刘大猫.

|

7月前

|

Arthas 存储监控

|

博文

Arthas heapdump（dump java heap, 类似 jmap 命令的 heap dump 功能）

528 8 8

老赵聊算法备案、大模型备案

|

7月前

|

人工智能自然语言处理算法

|

博文

算法及模型合规：刻不容缓的企业行动指南

随着AI技术迅猛发展，算法与模型成为企业数字化转型的核心。然而，国家密集出台多项法规，如《人工智能生成合成内容标识办法》等，并开展“清朗·整治AI技术滥用”专项行动，标志着AI监管进入严格阶段。算法备案从“可选项”变为“必选项”，未合规可能面临罚款甚至刑事责任。同时，多地提供备案奖励政策，合规既是规避风险的需要，也是把握政策红利和市场信任的机遇。企业需系统规划合规工作，从被动应对转向主动引领，以适应AI时代的挑战与机遇。

362 10 10

游客wfurz6c6qiy2o

|

7月前

|

安全 API 数据安全/隐私保护

|

博文

aipy实战：建设PE文件查杀神器，阻止Windows EXE木马！

本工具为小型木马静态特征查杀工具，专用于检测Windows下的EXE文件是否为可疑木马。核心功能包括：扫描恶意字符串（如keylogger、powershell）、检查熵值异常以判断加密/加壳、揪出可疑API组合（如注册表篡改、网络通信链）以及解析PE头分析编译环境与加壳痕迹。通过提示词实现功能开发，并保存为`aipy_kill_rat.py`文件。测试结果显示，工具成功扫描出426个可疑字符串、超高熵值及恶意API组合，确认目标文件为恶意木马。该工具轻量灵活，适合样本初筛与应急响应，是静态分析的高效利器。

233 10 10

刘大猫.

|

7月前

|

Arthas 监控 Java

|

博文

Arthas dashboard（当前系统的实时数据面板）

417 12 12

刘大猫.

|

7月前

|

Arthas 监控 Java

|

博文

Arthas thread（查看当前JVM的线程堆栈信息）

1378 10 10

游客wfurz6c6qiy2o

|

7月前

|

存储 JSON API

|

博文

aipy实战：Deepseek-V3、Hunyuan&Qwen分析618平板攻略

Aipy是一款结合LLM与Python的智能工具，用户通过简单指令即可让LLM分析并生成代码，实时解决问题。本次v0.1.28版本新增联网搜索、案例分享等功能，并引入混元和Qwen模型。测评中，三个模型完成“618平板选购攻略”任务表现各异：deepseek-v3界面精美、信息全面但价格有偏差；hunyuan-turbos-latest信息不全但界面简洁；qwen-plus-latest推荐合理但数据失真。总体而言，Aipy在操作友好性和分析界面上显著提升，适合解决实际问题。

427 24 24

Echo_Wish

|

7月前

|

人工智能 Java API

|

博文

通义灵码 2.5 版深度评测：智能编程的边界在哪里？

291 2 3

阿里云开发者

|

7月前

|

存储人工智能安全

|

博文

自媒体创作场景实践｜通义千问3 + MCP=一切皆有可能

本文介绍了通过MCP（Model Context Protocol）结合通义千问大模型实现跨平台、跨服务的自动化任务处理方案。使用Qwen3-235B-A22B模型，配合ComfyUI生成图像，并通过小红书等社交媒体发布内容，展示了如何打破AI云服务的数据孤岛。具体实践包括接入FileSystem、ComfyUI和第三方媒体Server，完成从本地文件读取到生成图像再到发布的全流程。方案优势在于高可扩展性和易用性，但也存在大模型智能化不足、MCP Server开发难度较大及安全风险等问题。未来需进一步提升模型能力、丰富应用场景并解决安全挑战，推动MCP在更多领域落地。

1798 27 33

1828421023467708

|

7月前

|

开发者

|

博文

qwen3大模型目前的不足与功能建议

这段内容反映了用户在过去半个多月与Qwen3大模型在线服务互动后，发现的功能不足及对未来功能的建议。用户已将所有意见汇总至一个会话，并通过www.tongyi.com页面分享对话链接。希望Qwen开发团队重视这些建议，同时也会发布到阿里云开发者社区讨论。待官方回复后，用户将根据回复决定是否分享给其他云服务厂商和开源社区。

244 0 0

bailiantest1

|

7月前

|

机器学习/深度学习人工智能自然语言处理

|

博文

通义千问推理模型QwQ-32B开源，更小尺寸、更强性能

阿里云发布并开源全新推理模型通义千问QwQ-32B，通过大规模强化学习，在数学、代码及通用能力上实现质的飞跃，性能比肩DeepSeek-R1。该模型大幅降低部署成本，支持消费级显卡本地部署，并集成智能体Agent相关能力。阿里云采用Apache2.0协议全球开源，用户可通过通义APP免费体验。此外，通义团队已开源200多款模型，覆盖全模态和全尺寸。

984 20 20

bailiantest1

|

7月前

|

人工智能编解码搜索推荐

|

博文

通义万相新模型开源，首尾帧图一键生成特效视频！

通义万相首尾帧生视频14B模型正式开源，作为首个百亿级参数规模的开源模型，可依据用户提供的开始与结束图片生成720p高清衔接视频，满足延时摄影、变身等定制化需求。用户上传两张图片或输入提示词即可完成复杂视频生成任务，支持运镜控制和特效变化。该模型基于Wan2.1架构改进，训练数据专门构建，确保高分辨率和流畅性。

721 21 21

3v6hgdrejufea

|

7月前

|

人工智能

|

问答

钉钉群消息内容可以作为知识库内容，通过ai助理实现问答吗

155 0 0

刘大猫.

|

7月前

|

Arthas 监控 Java

|

博文

Arthas jvm（查看当前JVM的信息）

288 17 17

刘大猫.

|

7月前

|

Arthas 监控 Java

|

博文

Arthas vmoption（查看和修改 JVM里诊断相关的option）

180 16 16

刘大猫.

|

7月前

|

Arthas 监控 IDE

|

博文

Arthas 全攻略：让调试变得简单

371 7 7

刘大猫.

|

7月前

|

Arthas 监控 Java

|

博文

Arthas getstatic（查看类的静态属性）

213 7 7

7月前

|

视频

通义灵码智能体直播写代码

阿里云工程师联手「通义灵码」，直播在线接单！需求多如天？bug多到爆？速来直播间拍砖，工程师&AI双倍输出，接不住算我输！

178 0 0

刘大猫.

|

7月前

|

Arthas 监控 Java

|

博文

Arthas logger（查看 logger 信息，更新 logger level）

295 6 6

JustDoIT技术吧

|

7月前

|

机器学习/深度学习人工智能安全

|

博文

AI的万亿商机：红杉资本眼中的人工智能新时代

AI不仅仅是不可避免的趋势，而是已经到来的现实，其市场规模将远超过去的任何一次技术变革。这不是一场可以观望的比赛，而是一场必须全力以赴参与的革命。

403 22 22

1969063399304494

|

7月前

|

问答

JetbrainIDE插件，通义灵码插件，选择代码的时候会出现图标跟随，如何关闭？

112 0 0

小白的大数据之旅

|

7月前

|

SQL 自然语言处理关系型数据库

|

博文

通义灵码2.5来袭！MCP 功能直接让开发效率提升300%（附实战案例）

通义灵码2.5是阿里云推出的AI编码助手，以智能协作为核心，深度融合开发全流程。其三大升级点包括：编程智能体实现任务自主规划、MCP工具生态支持自然语言生成SQL、记忆进化系统个性化适配开发者习惯。通过自然语言即可完成数据库操作、代码生成与优化，大幅提升开发效率。此外，还具备工程级变更管理、多文件协同编辑及版本控制功能，适用于多种IDE环境，为企业提供安全高效的开发解决方案。

2306 9 11

modelscope

|

7月前

|

编解码人工智能

|

博文

通义万相Wan2.1-VACE开源！业内首个视频编辑统一模型！附推理教程

1543 7 7

阿里云

|

7月前

|

人工智能安全自动驾驶

|

博文

通义灵码入职蔚来汽车，AI生成代码30%以上

通义灵码已正式应用于蔚来汽车智能座舱部门，近400名成员使用该工具，AI生成代码占比达30%以上，“天探”项目中甚至高达70%-80%。它通过提升代码开发效率、降低维护成本、智能生成单元测试及问题排查等功能助力研发。蔚来选择通义灵码看重其企业专属版的安全能力和知识管理功能。未来，期望AI编程将研发流程规范化，成为类似自动驾驶的高效指引工具。

340 5 5

刘大猫.

|

7月前

|

Arthas 监控 Java

|

博文

Arthas mbean（查看 Mbean 的信息）

250 17 17

最新

热门文章

产品问答

通义万相首尾帧图模型一键生成特效视频！

TortoiseSVN使用-合并深度介绍

通义灵码生成git commit时描述文件，能否自己定义规则。

我设置了enable_thinking，但是回答时候还是携带了思考。

通义OmniAudio大模型，让 AI 看懂 360° 视频，并“听”出对应的空间音频

Linux下版本控制器(SVN) -命令行客户端

Spark-TTS: AI语音合成的"变声大师"

Shiro简介及SpringBoot集成Shiro(狂神说视频简易版)

AiPy实战 ：心情&收支日记本

AJax(XHR+Get和Post+AJax的封装)

前端使用正则表达式提取经纬度 度分秒值

颠覆开发效率！国内首个微服务编排框架Juggle开源啦！

手机也能跑通义Qwen3大模型，手把手教你部署！

通义 CoGenAV 大模型音画同步感知，重新定义语音理解边界

前端工具方法整理

从0开始在阿里云上搭建基于通义千问的钉钉智能问答机器人

向量数据库和嵌入模型

前端使用正则表达式检查是否为十六进制字符串

自定义linux脚本用于快速jar包启动、停止、重启

Aipy实战：分析潜在的糖尿病患者

深度合成算法备案全知道：不同角色审核的重点是什么？

linux命令使用消费kafka的生产者、消费者

java的jar后台启动

Centos或Linux编写一键式Shell脚本创建用户、组、目录分配权限指导手册

Centos或Linux编写一键式Shell脚本删除用户、组指导手册

Arthas sysprop（查看和修改JVM的系统属性）

Arthas heapdump（dump java heap, 类似 jmap 命令的 heap dump 功能）

算法及模型合规：刻不容缓的企业行动指南

aipy实战：建设PE文件查杀神器，阻止Windows EXE木马！

Arthas dashboard（当前系统的实时数据面板）

Arthas thread（查看当前JVM的线程堆栈信息）

aipy实战：Deepseek-V3、Hunyuan&Qwen分析618平板攻略

通义灵码 2.5 版深度评测：智能编程的边界在哪里？

自媒体创作场景实践｜通义千问3 + MCP=一切皆有可能

qwen3大模型目前的不足与功能建议

通义千问推理模型QwQ-32B开源，更小尺寸、更强性能

通义万相新模型开源，首尾帧图一键生成特效视频！

钉钉群消息内容可以作为知识库内容，通过ai助理实现问答吗

Arthas jvm（查看当前JVM的信息）

Arthas vmoption（查看和修改 JVM里诊断相关的option）

Arthas 全攻略：让调试变得简单

Arthas getstatic（查看类的静态属性 ）

通义灵码智能体直播写代码

Arthas logger（查看 logger 信息，更新 logger level）

AI的万亿商机：红杉资本眼中的人工智能新时代

JetbrainIDE插件，通义灵码插件，选择代码的时候会出现图标跟随，如何关闭？

通义灵码2.5来袭！MCP 功能直接让开发效率提升300%（附实战案例）

通义万相Wan2.1-VACE开源！业内首个视频编辑统一模型！附推理教程

通义灵码入职蔚来汽车，AI生成代码30%以上

Arthas mbean（查看 Mbean 的信息）

通义大模型

活跃用户

相关产品

AiPy实战：心情&收支日记本

前端使用正则表达式提取经纬度度分秒值

Arthas getstatic（查看类的静态属性）