|
7月前
|
人工智能 物联网
|

Face-to-Photo 模型开源!联名麦橘MERJIC,遇见另一个你!

魔搭 DiffSynth-Studio 团队携手知名创作者麦橘MERJIC,正式开源全新 AI 图像生成模型——Face-to-Photo!该模型基于 Qwen-Image-Edit,采用 LoRA 的模型结构,专为人脸图像生成而优化,将一张普通的人脸照片转化…

951 13
|
7月前
|
缓存 自然语言处理 PyTorch
|

114_预训练:Masked LM优化与动态掩码效率深度解析

在大型语言模型(LLM)的预训练阶段,训练目标函数的设计直接影响模型的学习效率和最终性能。Masked Language Modeling(MLM)作为BERT等模型采用的核心预训练任务,通过随机掩盖文本中的部分token并让模型预测这些被掩盖的token,有效地训练了模型的双向表示能力。然而,传统的静态掩码策略存在重复率高、训练效率低等问题。动态掩码技术的引入显著提升了预训练效率和模型性能。本文将全面探讨MLM优化策略,深入推导动态掩码的效率提升原理,并介绍2025年最新的MLM优化技术,为高效预训练LLM提供理论和实践指导。

766 0
|
7月前
|
数据采集 人工智能 自然语言处理
|

121_训练评估:困惑度分析 - 分析指标与下游任务关系

在大规模语言模型(LLM)的训练过程中,评估模型性能是一个至关重要但常被简化处理的环节。2025年的研究表明,仅依赖单一指标(如困惑度)来判断模型质量已经无法满足复杂应用场景的需求。困惑度作为语言模型训练中最核心的评估指标,其与下游任务表现之间的关系远比直觉更复杂。本文将深入剖析困惑度的数学原理、计算方法、优化策略,以及其与各类下游任务表现的相关性分析,为大规模语言模型的训练优化提供全面的技术指导。

794 1
|
7月前
|
机器学习/深度学习 监控 PyTorch
|

126_自定义损失:多目标训练 - 设计加权损失的独特平衡策略

在2025年的大型语言模型(LLM)训练领域,多目标学习已成为提升模型综合性能的关键技术之一。传统的单一损失函数训练方法逐渐显现出局限性,尤其在处理复杂的语言理解、生成和推理任务时。多目标训练通过同时优化多个互补的学习目标,能够显著提升模型的泛化能力、知识保留和任务适应性。

431 3
|
7月前
|
缓存 边缘计算 监控
|

89_批量推理:异步API调用

在当今数据密集型应用和大模型部署的时代,批量推理已成为提升系统性能和资源利用率的关键技术。随着深度学习模型规模的不断扩大和应用场景的日益复杂,如何高效地处理大量推理请求成为技术团队面临的重要挑战。传统的同步API调用方式在面对高并发、大规模数据处理时,往往会遇到响应延迟高、资源利用不充分等问题。异步API调用作为一种更高效的处理模式,通过非阻塞操作和并发处理能力,为批量推理场景提供了理想的解决方案。

611 0
|
7月前
|
机器学习/深度学习 人工智能 监控
|

93_安全提示:过滤有害内容

随着大型语言模型(LLM)在各个领域的广泛应用,确保其安全性和可靠性已成为技术社区关注的焦点。2024-2025年,随着LLM能力的不断增强,其潜在风险也日益凸显。有害内容的生成和传播不仅可能造成社会危害,还会对企业和用户带来严重的法律和声誉风险。因此,构建强健的内容过滤机制已成为LLM应用部署的必要条件。

816 0
|
7月前
|
人工智能 缓存 自然语言处理
|

95_跨任务提示:一次提示完成多种任务

在大语言模型(LLM)应用开发中,我们常常面临需要处理多个相关任务的场景。传统方法是为每个任务单独设计提示并调用API,这不仅增加了开发复杂度,还会导致token消耗增加和响应延迟累积。跨任务提示(Multi-Task Prompting)作为一种高效的提示工程技术,能够在单个提示中集成多个相关任务,让LLM一次调用完成多种处理需求。

240 0
|
9月前
|
编解码 人工智能 小程序
|

魔搭社区模型速递(8.17-8.23)

🙋魔搭ModelScope本期社区进展:📟1652个模型,📁216个数据集,🎨54个创新应用,📄 4篇内容

958 8
|
9月前
|
边缘计算 测试技术 数据格式
|

小体积,大潜力 - 腾讯混元Dense模型多尺寸正式开源

混元是腾讯开源的高效大型语言模型系列,旨在在各种计算环境中灵活部署。从边缘设备到高并发生产系统,这些模型通过先进的量化支持和超长上下文能力提供了最佳性能。

510 0

这个怎么搭建呢

299 1
来自:多模态 版块
|
9月前
|
人工智能 机器人 测试技术
|

从支撑英伟达GR00T到登陆魔搭社区,智元AgiBot World打通具身智能全球数据生态

备受关注的 AgiBot World 百万真机数据集正式登陆国内顶级 AI开源社区——魔搭社区。该数据集由智元机器人开发,此前已在GitHub 和 Hugging Face 等国际平台开源并获得了业界的积极反响。此举是智元机器人布局国内AI生态的重要一步,国内开发者和研究者将能够更加顺畅地接入AgiBot World全套资源,降低数据获取和工具使用门槛,推动具身智能及机器人技术在国内的普及与发展。

338 0
|
10月前
|
小程序 Java 关系型数据库
|

圈子系统公众号app小程序系统源码圈子系统带即时通讯 多级圈子系统源码 兴趣小组系统开源 私密圈子系统代码 会员制社区系统

本圈子系统解决方案提供即时通讯、多级圈子、兴趣小组、私密社区及会员制管理功能。支持开源与商业方案,推荐ThinkSNS+、EasyClub及OpenFire等系统,并提供前后端技术选型建议,助力快速搭建社交平台。

579 0
|
10月前
|
人工智能 JSON 小程序
|

【AI编程】AI+高德MCP不到10分钟搞定上海三日游

本文介绍了小白如何通过AI编程工具(如Trae)快速开发应用并实现技术变现。内容涵盖AI编程用途、工具准备、高德地图开发者权限获取、AI工具配置及实战生成旅游攻略与打印页面,帮助零基础用户轻松入门AI编程。

523 0
|
11月前
|
缓存 API Android开发
|

【HarmonyOS next】ArkUI-X新闻热搜聚合App【进阶】

本项目基于ArkUI-X框架,将鸿蒙(HarmonyOS)下的新闻热搜聚合App无缝迁移至iOS平台。采用ArkUI开发,结合@kit.NetworkKit实现网络请求,利用@ObservedV2与@Trace装饰器进行数据绑定,适配iOS界面布局与权限配置,完成跨平台热榜应用构建。

379 0
|
1月前
|
大数据 弹性计算 固态存储
|

ECS下载魔搭大数据集卡住

144 0
来自:计算机视觉 版块
|
1月前
|
数据采集 人工智能 自然语言处理
|

人机共享技能库为基础的可控本地安全助理平台

**摘要:** 即使零token也能手机多平台联动电脑运行脚本自由安全地运行各种技能工具脚本,通过"自行预设"的关键词来触发运行脚本的方法达到绝对安全、高效、和自由完全掌控平台的碾压核心优势!打造十分适合机关单位、内网环境、私有部署场景的安全助理,选择不走云端ai通道!当然也可以自由选择本地部署的人工智能ai,即使没有ai照样能跑!比沙箱模式更加安全高效和极其节省成本的终极理想设定! **关键词:** 本地化助手;人机协作;技能共享;隐私计算;自动化办公

168 2
|
4月前
|
人工智能 测试技术 API
|

外包项目提效的另一种路径:多模型 AI 的工程价值

外包行业提效困局日益凸显:需求多变、人员流动、周期压缩。单模型AI仅局部优化,难破系统瓶颈。多模型AI以工程化协同替代“人海战术”,通过任务分派、异常降级、流程固化,提升交付稳定性与可扩展性,正成为外包效能升级新路径。

229 2
|
5月前
|
安全 Java 大数据
|

Java为何能稳居企业级开发主流语言宝座

Java自1995年诞生以来,凭借跨平台、强生态、高安全、稳定可靠等优势,持续领跑企业级开发。JVM实现“一次编写,到处运行”,Spring等框架提升开发效率,GC机制保障稳定性,庞大开发者社区与持续技术迭代(如Java 8/11/17)助力其在金融、电商、大数据等领域长盛不衰。

206 0
|
5月前
|
持续交付 项目管理
|

阿里巴巴-云效

本文介绍了如何开通并使用云效平台进行项目管理与自动化部署。涵盖服务开通、需求管理、代码托管及流水线构建等步骤,帮助团队高效协作,实现代码自动发布流程的搭建与体验。

219 0
|
5月前
|
存储 JSON NoSQL
|

3-MongoDB常用命令

本文介绍如何使用MongoDB存储文章评论数据,涵盖数据库与集合的创建、删除,以及文档的增删改查操作。内容包括:使用`use`创建articledb数据库,通过`insert()`插入评论文档,利用`find()`查询数据并支持投影与排序,结合`limit()`和`skip()`实现分页,以及使用`update()`和`remove()`进行更新与删除操作,全面讲解MongoDB基本CRUD语法及注意事项。

130 0
|
5月前
|
存储 Java 数据库连接
|

2. 整合切面,参数拦截+过滤

111

121 0
|
5月前
|
安全 Linux 应用服务中间件
|

Linux 初学者常见 10 大误区与避坑指南

本文总结Linux初学者易犯的10大误区,涵盖误删文件、滥用root、权限混乱、路径迷失等问题,深入剖析原因并提供实用避坑方案,帮助新手建立良好操作习惯,高效安全入门Linux系统。

379 0
|
5月前
|
存储 消息中间件 开发框架
|

应用架构图

11

211 0
|
5月前
|
JSON NoSQL MongoDB
|

文档的基本查询

本文介绍了MongoDB中查询文档的基本操作。通过`find()`和`findOne()`方法可实现全集合查询及条件查询,如按`userid`筛选;支持投影查询,指定返回字段,控制是否显示`_id`,灵活获取所需数据。

303 0
|
5月前
|
架构师 Java 数据库
|

Java开发进阶:从初级工程师到架构师的能力提升路径

本文梳理Java开发者从初级到架构师的成长路径,涵盖各阶段技术要求与能力提升方向,强调技术深度、业务理解与软实力的综合发展,为职业进阶提供清晰指引。

136 0
|
5月前
|
存储 NoSQL 关系型数据库
|

Python 持久层开发:从文件到数据库的实践指南

Python持久层开发覆盖全场景需求,从文件存储到分布式数据库。依据业务复杂度,可选TXT/JSON、SQLite、MySQL/PostgreSQL或MongoDB、Redis等方案,核心在于“按需选型”,匹配数据规模与性能要求,兼顾效率与可靠性。(239字)

142 0
|
5月前
|
IDE 开发工具 C++
|

Python 初学者常见 10 大误区与避坑指南

本文总结Python初学者易犯的10大编码误区,如缩进错误、混淆“==”与“is”、修改迭代列表等,结合实例解析错误原因并提供实用解决方案,帮助新手避开常见陷阱,建立正确的Python编程思维。

207 0
|
5月前
|
存储 算法 安全
|

C 语言初学者常见 10 大误区与避坑指南

本文总结了C语言初学者常见的10类错误,涵盖语法死记、内存泄漏、指针误用、全局变量滥用等问题,结合案例分析成因,并提供针对性解决方案,帮助学习者理解底层原理,培养正确编程思维,提升项目实战能力,少走弯路,夯实C语言基础。

214 0
|
5月前
|
NoSQL Linux 调度
|

C 语言高效学习:从入门到嵌入式的科学路径

C语言是底层与嵌入式开发的基石。科学学习路径分四阶:入门打基础,深化攻指针内存,实战练项目,进阶接硬件。掌握GCC、GDB、Makefile,拓展至STM32、FreeRTOS与SQLite,实现从语法到工程、从初级到资深的跃迁,筑牢“软件-硬件”桥梁。

238 0
|
5月前
|
存储 NoSQL 调度
|

C 语言开发进阶:从初级开发者到嵌入式工程师的能力提升路径

C语言是嵌入式开发的基石。从初级到资深,需逐步构建“工程化编程—硬件交互—系统优化”能力体系:掌握代码规范、调试与Makefile;理解寄存器、位操作与驱动开发;深入内存管理、RTOS调度与源码阅读,实现从“写对代码”到“落地运行”的全链路进阶。(239字)

184 0
|
5月前
|
开发者
|

业务架构图

本文介绍了业务架构图的核心概念与绘制方法,涵盖业务定义、架构域分类,强调业务架构是技术、应用与数据架构的基础。通过分层、分模块、分功能三步法,梳理业务逻辑,明确模块边界与信息流,帮助客户与开发者清晰理解系统结构,提升协作效率。

182 0
|
5月前
|
Java 测试技术 API
|

从Google线上故障,谈灰度发布的重要性

2025年6月12日,Google Cloud因未灰度发布的新配置引发空指针异常,导致全球服务中断超7小时。本文分析其根因,并详解基于Nacos的配置灰度发布方案,包括IP与标签灰度实践,强调灰度发布对系统稳定性的重要意义。

110 0
|
5月前
|
敏捷开发 Java 测试技术
|

为什么要单元测试

本文探讨单元测试在软件开发中的核心价值,打破“写单测费时误事”的误区。通过解析测试体系演进、测试金字塔模型,阐明单元测试如何提升代码质量、调试效率与团队协作,并揭示常见反模式与认知误区,倡导研发自测、夯实基础,让软件开发从“爬行”迈向“奔跑”。

122 0
|
5月前
|
消息中间件 人工智能 NoSQL
|

RocketMQ:A2A协议实现多智能体优化

Apache RocketMQ推出专为AI场景设计的轻量级通信模型LiteTopic,通过百万级队列支持海量会话,并结合A2A协议与AgentScope框架,实现多智能体高效、可靠的异步协作,重塑企业级AI应用通信架构。

209 0
|
5月前
|
架构师 Java 数据库
|

Java开发进阶:从初级工程师到架构师的能力提升路径

本文系统梳理Java开发者从初级工程师到架构师的成长路径,涵盖各阶段技术能力要求与提升方向,强调基础夯实、架构设计、业务理解及软实力培养,为职业进阶提供清晰指引。

313 2
|
5月前
|
敏捷开发 Dubbo Java
|

需求开发人日评估

本文介绍了敏捷开发中工时评估的关键方法,重点讲解“人日”概念及开发周期的粗略估算规则。涵盖开发、自测、联调、测试与发布各阶段的时间分配,并提供常见需求如Excel导入导出、单表操作、跨服务调用等的人日参考标准,助力团队更科学地进行项目规划与排期。

134 0
|
5月前
|
缓存 Java 关系型数据库
|

微服务原理篇(XXLJOB-幂等-MySQL)

本课程深入讲解微服务架构下的任务调度与数据一致性方案,涵盖XXL-JOB分布式调度原理、幂等性设计、MySQL存储引擎对比、索引优化及SQL调优策略。通过实战掌握热点数据缓存预热、分片广播任务处理、避免重复执行等核心技能,提升系统性能与可靠性。(238字)

356 0
|
5月前
|
人工智能 前端开发 JavaScript
|

告别"玄学调试":用这份指令让AI成为你的"赛博华佗"

调试占用了开发者50%的时间?本文提供一套专业的AI调试指令,将大模型转化为"拥有10年经验的代码医生"。通过结构化的诊断-修复-预防流程,告别低效的"玄学调试",实现从"修好Bug"到"根治隐患"的质变。

505 6
|
7月前
|
机器学习/深度学习 数据采集 人工智能
|

112_跨模态微调:文本与图像联合优化

跨模态微调是指在预训练的多模态模型(如CLIP)基础上,针对特定任务进行的参数调整过程。与单一模态微调不同,跨模态微调需要同时考虑文本和图像两种模态之间的交互与对齐,这使得整个优化过程更加复杂但也更具潜力。

638 0
|
7月前
|
机器学习/深度学习 缓存 并行计算
|

90_推理优化:性能调优技术

随着大型语言模型(LLM)规模的不断扩大和应用场景的日益复杂,推理性能已成为制约模型实际部署和应用的关键因素。尽管大模型在各项任务上展现出了令人惊艳的能力,但其庞大的参数量和计算需求也带来了严峻的性能挑战。在资源受限的环境中,如何在保持模型效果的同时,最大化推理性能,成为了研究人员和工程师们亟待解决的核心问题。

545 0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉答疑群:44837352

0
今日
15229
内容
6
活动
4194
关注
你好!
登录掌握更多精彩内容

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 智能语音交互