|
12月前
|
机器学习/深度学习 人工智能 PyTorch
|

DeepSeek开源周第四弹之一!DualPipe:训练V3/R1的双向流水线并行技术,计算与训练完全重叠,训练效率提升200%

DeepSeek 开源的 DualPipe 技术通过双向流水线并行设计,显著提升大规模深度学习模型的训练效率,优化计算与通信重叠,降低内存峰值需求,适用于推理加速、多模态数据处理等场景。

867 1
来自: 科学计算  版块
|
12月前
|
人工智能 架构师 决策智能
|

转发有奖 | agentUniverse联合浙大太乙开源平台,邀你瓜分3万奖金!

有奖开源共建活动火热进行中,期待各位开发者报名参加。转发有盲盒,提交有礼品,合并有奖金。

263 2
|
12月前
|
机器学习/深度学习 存储 文字识别
|

阿里国际Ovis2系列模型开源:多模态大语言模型的新突破

Ovis是阿里巴巴国际化团队提出的新型多模态大模型架构,通过巧妙地将视觉和文本嵌入进行结构化对齐,为解决模态间嵌入策略差异这一局限性提供了方案。

856 2
|
12月前
|
存储 人工智能 关系型数据库
|

HiveChat:告别模型选择困难!开源ChatGPT聚合神器上线:一键切换10+模型,权限管控全免费

HiveChat 是一款专为中小团队设计的开源 AI 聊天应用,支持多种主流 AI 模型,提供高效的团队沟通和智能辅助功能。

520 9
来自: 自然语言处理  版块
|
25天前
|
存储 人工智能 缓存
|

别再把大脑当成 /dev/null 了!用这套AI指令给记忆装个 "Redis 缓存层"

本文将大脑记忆比作数据库存储,指出传统记忆的"无索引"缺陷。通过一套"记忆架构师AI指令",利用数据预处理、建立索引和持久化策略(遗忘曲线),帮助开发者构建高效、稳固的知识记忆系统,实现认知的"架构升级"。

415 4
|
27天前
|
JSON 人工智能 API
|

从对话到Agent:大模型工具调用能力的量化评测

大模型向Agent进化,工具调用是关键。本文介绍EvalScope评测框架,通过双重验证机制,量化评估模型“会不会用、能不能用好”工具,助力开发者打造可靠AI应用。

217 4
|
28天前
|
机器学习/深度学习 安全 测试技术
|

美团 LongCat-Flash-Thinking-2601 发布,工具调用能力登顶开源 SOTA!

美团LongCat团队发布并开源LongCat-Flash-Thinking-2601,升级支持“重思考模式”,在智能体搜索、工具调用等任务中达开源SOTA。具备强泛化与抗噪能力,支持在线免费体验,助力开发者高效落地复杂应用场景。

176 1
|
1月前
|
人工智能 数据可视化 物联网
|

《显卡 4090 就能跑!小白也能炼出私有大模型》

大模型微调是AI落地的关键技术,通过定向训练让通用模型在特定领域“从会到精”。本文详解微调原理、LoRA/QLoRA等高效方法,并提供评估与实操建议,助力新手快速上手,实现低成本、高精度的模型定制。

355 4
|
2月前
|
Java 数据库连接 微服务
|

Java高效学习指南:从入门到精通的科学路径与实践方法

本文系统梳理Java从入门到精通的科学学习路径,涵盖基础语法、面向对象、集合框架、并发编程、JVM原理、主流框架(Spring/Spring Boot/MyBatis)及项目实战,结合高效学习方法与优质资源推荐,助力开发者构建扎实技术体系,少走弯路,快速进阶。

181 0
|
2月前
|
存储 SQL 关系型数据库
|

MySQL 开发进阶:从初级到数据库工程师的能力提升路径

本文系统梳理MySQL开发从初级到高级工程师的四阶段进阶路径,涵盖数据库设计、高可用架构、性能优化与分库分表等核心能力,结合实操案例与学习原则,助力开发者实现职业跃迁。

121 0
|
2月前
|
存储 Linux 编译器
|

C 语言学习资源精选:从入门到精通的高效资源清单

本文为C语言学习者提供从入门到精通的完整资源指南,涵盖各阶段优质视频、书籍、博客、开源项目及学习社区,并结合高效学习方法,帮助初学者摆脱资源焦虑,系统掌握语法、指针、内存管理等核心知识,进阶嵌入式与底层开发,稳步提升编程能力。

160 0
|
2月前
|
关系型数据库 MySQL 数据库
|

用 Python 实现 MySQL 数据库定时自动备份

本文介绍如何用Python脚本实现MySQL数据库的自动化备份。通过`subprocess`调用`mysqldump`,结合时间戳命名、文件压缩与crontab定时任务,可高效完成无人值守备份,提升数据安全性与运维效率。

108 0
|
2月前
|
数据采集 安全 API
|

Python 实用标准库与工具函数使用指南

本文系统梳理Python高效开发三大利器:标准库(如datetime、pathlib)、第三方库(如requests、Pillow)及自定义工具函数(如空值判断、重试装饰器),结合高频场景与实操代码,助开发者提升效率,避免重复造轮子。

107 0
|
2月前
|
数据采集 数据可视化 数据挖掘
|

Python 高效学习指南:从入门到全场景的科学路径

Python学习应避免贪多求全,遵循“筑基→深化→定向→实战”四阶段路径:先掌握核心语法与编程思维,再深入面向对象与代码质量,随后聚焦Web、数据或自动化方向,最后通过项目整合技能。强调实践闭环与工程化思维,助力从入门迈向实用开发。

170 0
|
2月前
|
数据采集 人工智能 分布式计算
|

只靠国产算力与开源数据,端侧模型预训练行不行?我们做到了全流程开源

鹏城实验室与清华联合发布全流程开源大模型“开元-2B”,基于国产算力实现高效端侧训练。涵盖数据、代码、训练框架与技术报告,推动开放AI生态发展。

214 1
|
2月前
|
负载均衡 应用服务中间件 Nacos
|

Nacos配置中心

本文详细介绍Nacos作为配置中心的实现原理与实战步骤,涵盖配置管理、热更新、共享配置优先级及集群搭建,帮助微服务应用实现配置动态化、高可用部署。

136 4
|
2月前
|
SQL Java 数据库连接
|

持久层框架MyBatisPlus

MyBatisPlus是MyBatis的增强工具,简化单表CRUD操作,无需编写XML即可实现增删改查。通过继承BaseMapper、使用条件构造器(如QueryWrapper)、集成分页插件等,显著提升开发效率,并支持代码生成、逻辑删除、枚举处理器等高级功能。

134 0
|
2月前
|
人工智能 安全
|

一年输送旅客数千万次,浦东国际机场的效率秘密藏在这个智能体里

秋冬旅游高峰,浦东机场迎百万客流挑战。蚂蚁百宝箱推出“浦东国际机场”智能体,集成航班查询、停车导航、交通路线、餐饮酒店等一站式服务,实现“出发—到港”全链路智慧出行,提升旅客体验与机场运营效率。

195 2
来自: 自然语言处理  版块
|
3月前
|
机器学习/深度学习 数据可视化 Apache
|

仅3B激活参数,更强的多模态理解与推理能力,百度文心 ERNIE-4.5-VL-28B-A3B-Thinking正式开源!

11月11日,百度开源文心ERNIE-4.5-VL-28B-A3B-Thinking多模态模型,仅3B激活参数,性能媲美顶级大模型。具备强大视觉语言理解、跨模态推理与“图像思考”等创新功能,支持工具调用与视频分析,适用于复杂图文任务,全面开放商用。

548 17
|
4月前
|
人工智能 物联网
|

Face-to-Photo 模型开源!联名麦橘MERJIC,遇见另一个你!

魔搭 DiffSynth-Studio 团队携手知名创作者麦橘MERJIC,正式开源全新 AI 图像生成模型——Face-to-Photo!该模型基于 Qwen-Image-Edit,采用 LoRA 的模型结构,专为人脸图像生成而优化,将一张普通的人脸照片转化…

740 13
|
4月前
|
机器学习/深度学习 存储 缓存
|

115_LLM基础模型架构设计:从Transformer到稀疏注意力

大型语言模型(LLM)的架构设计是其性能的核心决定因素。从2017年Transformer架构的提出,到如今的稀疏注意力和混合专家模型,LLM架构经历了快速的演进。本文将全面探讨LLM基础架构的设计原理,深入分析Transformer的核心机制,详细介绍稀疏注意力、MoE等创新架构,并展望未来架构发展方向。通过数学推导和实践案例,为构建高效、强大的LLM提供全面指导。

778 0
|
4月前
|
数据采集 人工智能 自然语言处理
|

121_训练评估:困惑度分析 - 分析指标与下游任务关系

在大规模语言模型(LLM)的训练过程中,评估模型性能是一个至关重要但常被简化处理的环节。2025年的研究表明,仅依赖单一指标(如困惑度)来判断模型质量已经无法满足复杂应用场景的需求。困惑度作为语言模型训练中最核心的评估指标,其与下游任务表现之间的关系远比直觉更复杂。本文将深入剖析困惑度的数学原理、计算方法、优化策略,以及其与各类下游任务表现的相关性分析,为大规模语言模型的训练优化提供全面的技术指导。

592 1
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
|

47_历史里程碑:从ELIZA到Transformer

在当今的数字时代,我们已经习惯于与智能助手对话、向大语言模型提问,甚至依赖它们生成创意内容。然而,这看似理所当然的人机对话能力,实际上经历了长达半个多世纪的曲折发展历程。从1966年麻省理工学院的简陋程序,到2017年Google提出的革命性架构,聊天AI的演变不仅是技术的进步,更是人类对自身语言本质探索的缩影。

1013 31
|
4月前
|
数据采集 人工智能 监控
|

61_自定义基准:构建专属评测体系

在大型语言模型(LLM)快速发展的今天,通用基准测试如MMLU、C-Eval等已成为评估模型能力的重要工具。然而,随着LLM在各个行业的深度应用,通用基准往往无法准确反映模型在特定领域、特定任务上的真实表现。2025年,构建企业或组织专属的自定义评测基准已成为大模型落地应用的关键环节。

353 0
|
4月前
|
人工智能 自然语言处理 安全
|

43_PaLM与Gemma:谷歌LLM演进

在人工智能发展的浪潮中,谷歌一直扮演着关键的技术引领者角色。从最初的神经机器翻译到如今的通用人工智能,谷歌通过持续的技术创新推动着自然语言处理领域的边界不断拓展。2022年,谷歌推出了革命性的PaLM(Pathways Language Model),这一模型不仅在规模上达到了前所未有的5400亿参数,更重要的是其采用了创新的Pathways训练方法,为大型语言模型的发展开辟了新路径。随后,谷歌又推出了Gemma系列开源模型,将先进的AI技术普惠给更广泛的开发者社区。

317 2
|
6月前
|
机器学习/深度学习 人工智能 数据处理
|

混元开源又+1:视频音效可以自动生成了

AI生成的视频音效,已经可以用于视频制作了。

453 32
|
6月前
|
传感器 人工智能 自然语言处理
|

当AI学会跑跳抓:来云栖大会,参加一场“具身智能运动会”

一副AI眼镜帮你实时智能识别、一只机器狗陪你跑跨栏、一条机械臂听你指挥、一场与机器人的点球大战——这可不是科幻电影,这是2025云栖大会即将上演的现实。

309 8
|
6月前
|
编解码 人工智能 小程序
|

魔搭社区模型速递(8.17-8.23)

🙋魔搭ModelScope本期社区进展:📟1652个模型,📁216个数据集,🎨54个创新应用,📄 4篇内容

738 8
|
6月前
|
SQL 人工智能 自然语言处理
|

魔搭社区模型速递(8.2-8.8)

🙋魔搭ModelScope本期社区进展:📟2268个模型📁165个数据集;🎨78个创新应用📄 13篇内容

387 0
|
6月前
|
人工智能 大数据 数据库
|

8月23日南京Unstructured Data Meetup 启动

8月23日,南京场Unstructured Data Meetup 将在阿里中心·南京建邺 江苏省南京市建邺区沙洲街道新城科技园科技创新综合体A2栋举办。

146 0
|
8月前
|
人工智能 缓存 搜索推荐
|

手把手基于ModelScope MCP协议实现AI短视频创作:零代码自动化工作流

本文介绍了基于ModelScope MCP协议的AI视频生成解决方案,涵盖核心机制解析、零代码工作流搭建、性能优化策略及全链路异常处理。通过统一上下文描述符抽象异构AI服务,实现图像生成、语音合成与视频剪辑的自动化编排。结合缓存优化与错误重试机制,大幅提升生成效率(如5分镜视频从91.7s降至22.4s)。最后展示《夏日海滩》生成案例,并探讨个性化风格迁移与商业场景集成等进阶方向,揭示零代码本质为服务、流程与资源的三层抽象。

1169 18
|
8月前
|
自然语言处理 数据可视化 测试技术
|

告别‘人海战术’!基于EvalScope 的文生图模型智能评测新方案

生成式模型在文本生成图片等领域的快速发展,为社区带来了日新月异的诸多文生图模型。

857 20
|
10月前
|

支付宝率先接入!魔搭社区上线「MCP广场」与1400款MCP服务

4月15日,中国第一AI开源社区魔搭(ModelScope)推出全新MCP广场,上架千余款热门的MCP服务,包括支付宝、MiniMax等全新MCP服务在魔搭独家首发。魔搭社区为AI开发者提供丰富的MCP服务及调试工具,并支持第三方平台集成和调用,通过开源开放的方式加速Agent及AI应用的创新和落地。

584 0
|
10月前
|
人工智能 编解码 物联网
|

设计师集体破防!UNO:字节跳动创新AI图像生成框架,多个参考主体同框生成,位置/材质/光影完美对齐

UNO是字节跳动开发的AI图像生成框架,通过渐进式跨模态对齐和通用旋转位置嵌入技术,解决了多主体场景下的生成一致性问题。该框架支持单主体特征保持与多主体组合生成,在虚拟试穿、产品设计等领域展现强大泛化能力。

673 4
来自: 多模态  版块
|
10月前
|
机器学习/深度学习 人工智能 数据可视化
|

智谱AI新突破!GLM-Z1-Rumination:新一代沉思模型,推动AI助手进入"高智商+高自主"的新阶段

GLM-Z1-Rumination是智谱推出的新一代沉思模型,通过扩展强化学习训练实现长程推理能力,支持动态工具调用与自我验证机制,显著提升AI自主研究能力。

482 13
来自: 自然语言处理  版块
|
10月前
|
人工智能 编解码 异构计算
|

Neo-1:全球首个原子级生成式AI模型!这个AI模型把10年药物研发周期压缩到1个月

VantAI推出的Neo-1是全球首个统一分子生成与原子级结构预测的AI模型,采用潜在空间扩散技术,结合大规模训练和定制数据集,显著提升药物研发效率。

511 15
来自: 科学计算  版块
|
10月前
|
人工智能 机器人 开发工具
|

Amazon Nova Act:网页操作全自动!亚马逊黑科技把浏览器变AI机器人,请假/订餐/写邮件一键搞定

Amazon Nova Act是亚马逊AGI实验室推出的通用AI代理系统,通过原子化分解网页操作任务并配合Playwright实现高可靠性浏览器自动化,其配套SDK支持开发者快速构建智能体应用原型。

561 13
来自: 多模态  版块
|
11月前
|
人工智能 图形学
|

PhysGen3D:清华等高校联合推出,单图秒变交互式3D场景

PhysGen3D是清华等高校联合开发的创新框架,通过单张图像重建3D场景并模拟物理行为,实现从静态图像到动态交互的突破性转换。

350 15
来自: 计算机视觉  版块
|
11月前
|
人工智能 自然语言处理
|

TxGemma:谷歌DeepMind革命药物研发!270亿参数AI药理学家24小时在线

谷歌推出专为药物研发设计的TxGemma大模型,具备药物特性预测、生物文献筛选、多步推理等核心能力,提供20亿至270亿参数版本,显著提升治疗开发效率。

373 7
来自: 自然语言处理  版块
|
11月前
|
小程序 Java 关系型数据库
|

weixin116大学生就业平台微信小程序+ssm(文档+源码)_kaic

本文介绍了一款大学生就业平台微信小程序的开发过程,涵盖开发环境、系统设计、实现与测试等方面。该小程序基于微信平台特性,采用MYSQL数据库存储数据,确保系统稳定与安全,同时满足学生、企业和管理员不同权限用户的功能需求。通过简化操作流程,实现了招聘信息查看、简历投递等实用功能,旨在为用户提供便捷高效的求职体验,符合“操作简单,功能实用”的设计理念。

503 13
|
11月前
|
XML 人工智能 数据可视化
|

ReasonGraph:别让AI成黑箱!这个开源工具把大模型的脑回路画给你看

ReasonGraph是一款开源的可视化分析工具,能将大语言模型的复杂推理过程转化为直观图表,支持50+主流模型和多种推理方法,帮助开发者快速理解AI思考逻辑并优化模型表现。

726 0
来自: 自然语言处理  版块
|
11月前
|
机器学习/深度学习 人工智能 数据处理
|

OpenBioMed:开源生物医学AI革命!20+工具链破解药物研发「死亡谷」

OpenBioMed 是清华大学智能产业研究院(AIR)和水木分子共同推出的开源平台,专注于 AI 驱动的生物医学研究,提供多模态数据处理、丰富的预训练模型和多样化的计算工具,助力药物研发、精准医疗和多模态理解。

549 1
来自: 多模态  版块
|
11月前
|
机器学习/深度学习 人工智能 算法
|

MIDI-3D:单图秒变3D场景!40秒生成360度空间,多实例扩散黑科技

MIDI-3D 是一种先进的 AI 3D 场景生成技术,能够将单张图像快速转化为高保真度的 360 度 3D 场景,具有强大的全局感知能力和细节表现力,适用于游戏开发、虚拟现实、室内设计等多个领域。

473 18
来自: 计算机视觉  版块

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉答疑群:44837352

0
今日
15090
内容
6
活动
3970
关注
你好!
登录掌握更多精彩内容

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 智能语音交互