|
6月前
|
机器学习/深度学习 编解码 缓存
|

通义万相首尾帧图模型一键生成特效视频!

本文介绍了阿里通义发布的Wan2.1系列模型及其首尾帧生视频功能。该模型采用先进的DiT架构,通过高效的VAE模型降低运算成本,同时利用Full Attention机制确保生成视频的时间与空间一致性。模型训练分为三个阶段,逐步优化首尾帧生成能力及细节复刻效果。此外,文章展示了具体案例,并详细说明了训练和推理优化方法。目前,该模型已开源。

924 9
|
6月前
|

TortoiseSVN使用-合并深度介绍

TortoiseSVN使用-合并深度介绍

121 1
|
6月前
|
机器学习/深度学习 人工智能 算法
|

通义OmniAudio大模型,让 AI 看懂 360° 视频,并“听”出对应的空间音频

OmniAudio 是一项突破性的空间音频生成技术,能够直接从 360° 视频生成 FOA(First-order Ambisonics)空间音频,为虚拟现实和沉浸式娱乐带来全新可能。通过自监督 coarse-to-fine 预训练和双分支视频表示微调,OmniAudio 在非空间音频质量和空间定位准确性上显著优于现有方法。项目包含超过 103,000 个视频片段的 Sphere360 数据集,支持高质量的模型训练与评估。代码、数据及论文均已开源,助力沉浸式体验技术发展。

851 63
|
6月前
|
Java Linux 开发工具
|

Linux下版本控制器(SVN) -命令行客户端

Linux下版本控制器(SVN) -命令行客户端

199 4
|
6月前
|
人工智能 自然语言处理 搜索推荐
|

Spark-TTS: AI语音合成的"变声大师"

Spark-TTS 是一款革命性的语音合成模型,被誉为“变声大师”。它通过创新的 BiCodec 技术将语音分解为语义和全局两种 Token,实现对音色、性别、语速等属性的精细控制。结合统一的 LLM 架构,Spark-TTS 简化了传统 TTS 的复杂流程,同时提供了前所未有的灵活性。此外,团队还发布了 VoxBox 开源数据集,为行业提供标准评估基准。尽管在零样本场景下仍存改进空间,但 Spark-TTS 已经开启了语音合成新时代,让个性化、可控的 AI 语音成为可能。

752 5
|
6月前
|
缓存 安全 Java
|

Shiro简介及SpringBoot集成Shiro(狂神说视频简易版)

Shiro简介及SpringBoot集成Shiro(狂神说视频简易版)

559 7

AiPy实战 :心情&收支日记本

展示了aipy是如何设计记录心情&收支的日记本的过程

149 2
|
7月前
|
前端开发 JavaScript
|

AJax(XHR+Get和Post+AJax的封装)

AJax(XHR+Get和Post+AJax的封装)

223 15
|
7月前
|
前端开发
|

前端使用正则表达式提取经纬度 度分秒值

前端使用正则表达式提取经纬度 度分秒值

208 14
|
7月前
|
人工智能 数据可视化 JavaScript
|

颠覆开发效率!国内首个微服务编排框架Juggle开源啦!

Juggle是国内首个开源的微服务编排框架,专注于解决企业微服务进程中接口重复开发、系统对接复杂等问题。它提供零代码、低代码和AI增强功能,通过可视化拖拽快速组装简单API为复杂接口,支持多协议、多语言脚本和流程多版本管理。相比国外框架如Conductor,Juggle更贴合国内需求,具备高效开发、企业级可靠性及信创适配等优势,助力企业实现敏捷创新与数字化转型。

633 0
|
7月前
|
人工智能 安全 Android开发
|

手机也能跑通义Qwen3大模型,手把手教你部署!

全球开源模型冠军Qwen3与端到端全模态模型Qwen2.5-Omni现已成功在手机上跑通!借助MNN支持,适配Android、iOS及桌面端,实现低延迟、本地化、高安全的AI体验。用户可通过自定义Sampler设置、System Prompt和Max New Tokens调节模型输出风格与长度。

3776 11
|
7月前
|
机器学习/深度学习 人工智能 关系型数据库
|

通义 CoGenAV 大模型音画同步感知,重新定义语音理解边界

CoGenAV 是一种创新的多模态语音理解模型,核心理念是实现“音画同步”的深度理解。通过学习 audio-visual-text 的时序对齐关系,构建更鲁棒、更通用的语音表征框架。它在视觉语音识别(VSR)、音视频语音识别(AVSR)、语音增强与分离(AVSE/AVSS)及主动说话人检测(ASD)等任务中表现出色,尤其在嘈杂环境下性能显著提升。仅需 223 小时数据训练即可媲美传统数千小时数据的效果,大幅降低训练成本。CoGenAV 支持主流平台如 GitHub、HuggingFace 和 ModelScope,助力多场景应用开发。

764 10
|
7月前
|
JSON 前端开发 JavaScript
|

前端工具方法整理

前端工具方法整理

192 8
|
7月前
|
弹性计算 自然语言处理 Ubuntu
|

从0开始在阿里云上搭建基于通义千问的钉钉智能问答机器人

本文描述在阿里云上从0开始构建一个LLM智能问答钉钉机器人。LLM直接调用了阿里云百炼平台提供的调用服务。

549 4
|
7月前
|
存储 人工智能 关系型数据库
|

向量数据库和嵌入模型

本文介绍了向量数据库和嵌入模型的概念及应用,重点探讨了两者在AI技术栈中的协作关系。向量数据库是一种用于存储高维向量数据的解决方案,支持相似性搜索而非传统的关系型数据库精确匹配。文中通过实例展示了如何使用阿里百炼的文本嵌入模型(text-embedding-v3)将文本向量化,并结合Qdrant向量数据库进行存储与检索。代码示例部分详细说明了从文本嵌入到向量存储及查询的完整流程,为开发者提供了实践参考。

980 15
|
7月前
|
前端开发
|

前端使用正则表达式检查是否为十六进制字符串

前端使用正则表达式检查是否为十六进制字符串

202 6
|
7月前
|
Java Linux
|

自定义linux脚本用于快速jar包启动、停止、重启

自定义linux脚本用于快速jar包启动、停止、重启

343 29
|
7月前
|
数据可视化 数据挖掘 Python
|

Aipy实战:分析潜在的糖尿病患者

Aipy是一款本地部署、隐私性强的垂直型Agent,结合LLM与Python能力,可操控局域网设备、调用任意模型且成本低廉。本文介绍其通过分析“训练数据集.csv”学习糖尿病特征,判断“病人数据集.csv”中的潜在患者,并标记风险。过程中,Aipy快速拆解任务,在表格中新增“糖尿病风险”和“概率”列,以0/1直观展示结果,最终生成预测文件,整个流程仅耗时5分钟,高效且实用。

185 11
|
7月前
|
数据采集 人工智能 算法
|

深度合成算法备案全知道:不同角色审核的重点是什么?

深度合成技术正深刻改变生活,其算法备案对保障技术安全至关重要。目前已有3445款算法通过备案,其中服务提供者占76.78%。本文详解服务提供者与技术支持者的角色差异、审核重点及文件要求,强调两者不可混用且需独立备案。只有严格遵循备案流程,才能让深度合成技术真正造福大众,推动行业健康发展。

320 0
|
7月前
|
消息中间件 Linux Kafka
|

linux命令使用消费kafka的生产者、消费者

linux命令使用消费kafka的生产者、消费者

340 16
|
7月前
|
Java Linux
|

java的jar后台启动

java的jar后台启动

195 14
|
7月前
|
Linux Shell 数据安全/隐私保护
|

Centos或Linux编写一键式Shell脚本创建用户、组、目录分配权限指导手册

Centos或Linux编写一键式Shell脚本创建用户、组、目录分配权限指导手册

456 3
|
7月前
|
Linux Shell
|

Centos或Linux编写一键式Shell脚本删除用户、组指导手册

Centos或Linux编写一键式Shell脚本删除用户、组指导手册

231 4
|
7月前
|
Arthas 监控 Java
|

Arthas sysprop(查看和修改JVM的系统属性)

Arthas sysprop(查看和修改JVM的系统属性)

245 9
|
7月前
|
Arthas 存储 监控
|

Arthas heapdump(dump java heap, 类似 jmap 命令的 heap dump 功能)

Arthas heapdump(dump java heap, 类似 jmap 命令的 heap dump 功能)

528 8
|
7月前
|
人工智能 自然语言处理 算法
|

算法及模型合规:刻不容缓的企业行动指南

随着AI技术迅猛发展,算法与模型成为企业数字化转型的核心。然而,国家密集出台多项法规,如《人工智能生成合成内容标识办法》等,并开展“清朗·整治AI技术滥用”专项行动,标志着AI监管进入严格阶段。算法备案从“可选项”变为“必选项”,未合规可能面临罚款甚至刑事责任。同时,多地提供备案奖励政策,合规既是规避风险的需要,也是把握政策红利和市场信任的机遇。企业需系统规划合规工作,从被动应对转向主动引领,以适应AI时代的挑战与机遇。

362 10
|
7月前
|
安全 API 数据安全/隐私保护
|

aipy实战:建设PE文件查杀神器,阻止Windows EXE木马!

本工具为小型木马静态特征查杀工具,专用于检测Windows下的EXE文件是否为可疑木马。核心功能包括:扫描恶意字符串(如keylogger、powershell)、检查熵值异常以判断加密/加壳、揪出可疑API组合(如注册表篡改、网络通信链)以及解析PE头分析编译环境与加壳痕迹。通过提示词实现功能开发,并保存为`aipy_kill_rat.py`文件。测试结果显示,工具成功扫描出426个可疑字符串、超高熵值及恶意API组合,确认目标文件为恶意木马。该工具轻量灵活,适合样本初筛与应急响应,是静态分析的高效利器。

233 10
|
7月前
|
Arthas 监控 Java
|

Arthas dashboard(当前系统的实时数据面板)

Arthas dashboard(当前系统的实时数据面板)

417 12
|
7月前
|
Arthas 监控 Java
|

Arthas thread(查看当前JVM的线程堆栈信息)

Arthas thread(查看当前JVM的线程堆栈信息)

1378 10
|
7月前
|
存储 JSON API
|

aipy实战:Deepseek-V3、Hunyuan&Qwen分析618平板攻略

Aipy是一款结合LLM与Python的智能工具,用户通过简单指令即可让LLM分析并生成代码,实时解决问题。本次v0.1.28版本新增联网搜索、案例分享等功能,并引入混元和Qwen模型。测评中,三个模型完成“618平板选购攻略”任务表现各异:deepseek-v3界面精美、信息全面但价格有偏差;hunyuan-turbos-latest信息不全但界面简洁;qwen-plus-latest推荐合理但数据失真。总体而言,Aipy在操作友好性和分析界面上显著提升,适合解决实际问题。

427 24
|
7月前
|
人工智能 Java API
|

通义灵码 2.5 版深度评测:智能编程的边界在哪里?

通义灵码 2.5 版深度评测:智能编程的边界在哪里?

291 2
|
7月前
|
存储 人工智能 安全
|

自媒体创作场景实践|通义千问3 + MCP=一切皆有可能

本文介绍了通过MCP(Model Context Protocol)结合通义千问大模型实现跨平台、跨服务的自动化任务处理方案。使用Qwen3-235B-A22B模型,配合ComfyUI生成图像,并通过小红书等社交媒体发布内容,展示了如何打破AI云服务的数据孤岛。具体实践包括接入FileSystem、ComfyUI和第三方媒体Server,完成从本地文件读取到生成图像再到发布的全流程。 方案优势在于高可扩展性和易用性,但也存在大模型智能化不足、MCP Server开发难度较大及安全风险等问题。未来需进一步提升模型能力、丰富应用场景并解决安全挑战,推动MCP在更多领域落地。

1798 27
|
7月前
|
开发者
|

qwen3大模型目前的不足与功能建议

这段内容反映了用户在过去半个多月与Qwen3大模型在线服务互动后,发现的功能不足及对未来功能的建议。用户已将所有意见汇总至一个会话,并通过www.tongyi.com页面分享对话链接。希望Qwen开发团队重视这些建议,同时也会发布到阿里云开发者社区讨论。待官方回复后,用户将根据回复决定是否分享给其他云服务厂商和开源社区。

244 0
|
7月前
|
机器学习/深度学习 人工智能 自然语言处理
|

通义千问推理模型QwQ-32B开源,更小尺寸、更强性能

阿里云发布并开源全新推理模型通义千问QwQ-32B,通过大规模强化学习,在数学、代码及通用能力上实现质的飞跃,性能比肩DeepSeek-R1。该模型大幅降低部署成本,支持消费级显卡本地部署,并集成智能体Agent相关能力。阿里云采用Apache2.0协议全球开源,用户可通过通义APP免费体验。此外,通义团队已开源200多款模型,覆盖全模态和全尺寸。

984 20
|
7月前
|
人工智能 编解码 搜索推荐
|

通义万相新模型开源,首尾帧图一键生成特效视频!

通义万相首尾帧生视频14B模型正式开源,作为首个百亿级参数规模的开源模型,可依据用户提供的开始与结束图片生成720p高清衔接视频,满足延时摄影、变身等定制化需求。用户上传两张图片或输入提示词即可完成复杂视频生成任务,支持运镜控制和特效变化。该模型基于Wan2.1架构改进,训练数据专门构建,确保高分辨率和流畅性。

721 21
|
7月前
|
Arthas 监控 Java
|

Arthas jvm(查看当前JVM的信息)

Arthas jvm(查看当前JVM的信息)

288 17
|
7月前
|
Arthas 监控 Java
|

Arthas vmoption(查看和修改 JVM里诊断相关的option)

Arthas vmoption(查看和修改 JVM里诊断相关的option)

180 16
|
7月前
|
Arthas 监控 IDE
|

Arthas 全攻略:让调试变得简单

Arthas 全攻略:让调试变得简单

371 7
|
7月前
|
Arthas 监控 Java
|

Arthas getstatic(查看类的静态属性 )

Arthas getstatic(查看类的静态属性 )

213 7
7月前
|

通义灵码智能体直播写代码

阿里云工程师联手「通义灵码」,直播在线接单!需求多如天?bug多到爆? 速来直播间拍砖,工程师&AI双倍输出,接不住算我输!

178 0
|
7月前
|
Arthas 监控 Java
|

Arthas logger(查看 logger 信息,更新 logger level)

Arthas logger(查看 logger 信息,更新 logger level)

295 6
|
7月前
|
机器学习/深度学习 人工智能 安全
|

AI的万亿商机:红杉资本眼中的人工智能新时代

AI不仅仅是不可避免的趋势,而是已经到来的现实,其市场规模将远超过去的任何一次技术变革。这不是一场可以观望的比赛,而是一场必须全力以赴参与的革命。

403 22
|
7月前
|
SQL 自然语言处理 关系型数据库
|

通义灵码2.5来袭!MCP 功能直接让开发效率提升300%(附实战案例)

通义灵码2.5是阿里云推出的AI编码助手,以智能协作为核心,深度融合开发全流程。其三大升级点包括:编程智能体实现任务自主规划、MCP工具生态支持自然语言生成SQL、记忆进化系统个性化适配开发者习惯。通过自然语言即可完成数据库操作、代码生成与优化,大幅提升开发效率。此外,还具备工程级变更管理、多文件协同编辑及版本控制功能,适用于多种IDE环境,为企业提供安全高效的开发解决方案。

2306 9
|
7月前
|
编解码 人工智能
|

通义万相Wan2.1-VACE开源!业内首个视频编辑统一模型!附推理教程

通义万相Wan2.1-VACE开源!业内首个视频编辑统一模型!附推理教程

1543 7
|
7月前
|
人工智能 安全 自动驾驶
|

通义灵码入职蔚来汽车,AI生成代码30%以上

通义灵码已正式应用于蔚来汽车智能座舱部门,近400名成员使用该工具,AI生成代码占比达30%以上,“天探”项目中甚至高达70%-80%。它通过提升代码开发效率、降低维护成本、智能生成单元测试及问题排查等功能助力研发。蔚来选择通义灵码看重其企业专属版的安全能力和知识管理功能。未来,期望AI编程将研发流程规范化,成为类似自动驾驶的高效指引工具。

340 5
|
7月前
|
Arthas 监控 Java
|

Arthas mbean(查看 Mbean 的信息)

Arthas mbean(查看 Mbean 的信息)

250 17

通义大模型

阿里云自主研发的通义大模型,凭借万亿级超大规模数据训练和领先的算法框架,实现全模态高效精准的模型服务调用。https://www.aliyun.com/product/tongyi

1
今日
1570
内容
8
活动
1064
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大模型服务平台百炼