|
7月前
|
机器学习/深度学习 人工智能 监控
|

143_成本优化:Spot实例与预留实例云资源节省计算详解与最佳实践

在云原生时代,成本优化已成为企业IT基础设施管理的核心挑战之一。随着AI和机器学习工作负载的激增,云资源成本占企业IT预算的比例持续上升,如何在保证服务质量的同时实现显著的成本节约,成为技术团队面临的紧迫问题。根据最新的Datadog云成本报告显示,截至2025年,平均有83%的容器支出被闲置资源浪费,而GPU实例支出在过去一年中增长了40%,已占计算成本的14%。在这样的背景下,深入理解和应用Spot实例和预留实例等成本优化策略,对于任何使用云服务的组织都具有重大的经济意义。

709 9
|
7月前
|
机器学习/深度学习 人工智能 安全
|

60_隐私保护模型:联邦学习变体

在当今数字化时代,数据隐私保护已成为人工智能发展中不可忽视的核心议题。随着大型语言模型(LLM)规模的不断扩大,其对训练数据的需求也呈指数级增长,这使得数据隐私与模型性能之间的矛盾日益凸显。2025年,联邦学习作为一种创新的分布式学习范式,正在重塑LLM的训练和部署方式,允许多方在保护数据隐私的前提下共同构建高性能模型。

329 0
|
7月前
|
存储 机器学习/深度学习 监控
|

69_云端开发:SageMaker与Colab

在2025年的大模型开发环境中,云端开发平台已经成为开发者的首选。随着大模型规模的不断扩大,本地开发环境往往难以满足训练和推理的需求,而云端平台提供了强大的计算资源、灵活的扩展能力和便捷的协作功能。在众多云端开发平台中,Amazon SageMaker和Google Colab凭借各自的优势,成为了大模型开发者最常用的两个选择。

526 0
|
8月前
|
机器学习/深度学习 并行计算 小程序
|

DeepSeek-V3.2-Exp 发布,训练推理提效,API 同步降价

今天,我们正式发布 DeepSeek-V3.2-Exp 模型,这是一个实验性( Experimental)的版本。作为迈向新一代架构的中间步骤,V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek Sparse Attention(一种稀疏注意力机制…

978 0
|
8月前
|
人工智能 关系型数据库 数据库
|

公募REITs专属AI多智能体查询分析项目

公募REITs专属AI多智能体查询分析项目。本项目是基于 OpenAI Agent 框架的多智能体项目,提供二级市场数据查询分析、招募说明书内容检索、公告信息检索、政策检索等多板块查询服务。支持图标绘制、文件生成。

374 2
|
9月前
|
机器人 容器 Docker
|

100%由Qwen3-Coder独立编程!工业级RAGFlow聊天机器人实战,故障诊断提速300%

RAGFlow Chatbot 是一个集成了 RAGFlow 技术的智能问答系统,专注于 LCD 彩膜制造领域的专业知识。该系统能够回答关于工艺诊断、缺陷分析、材料验证和设备优化等方面的问题,为工程师和技术人员提供快速准确的知识支持。 功能特性 🤖 基于 RAGFlow 的智能问答系统 💬 实时流式响应,支持思考过程展示 📚 对话历史记录与管理 🔍 搜索历史对话 📤 导出对话记录 🧠 深度思考模式 🌐 响应式设计,支持移动端 🌙 深色主题支持

873 0
|
11月前
|
Python 语音技术 Windows
|

IndexTTS 部署报错:No module named 'tn'

1625 1
|
11月前
|
存储 人工智能 文字识别
|

Nanonets-OCR-s开源!复杂文档转Markdown SoTA,颠覆复杂文档工作流

Nanonets团队开源了 Nanonets-OCR-s,该模型基于Qwen2.5-VL-3B微调,9G显存就能跑。

1108 2
|
11月前
|
自然语言处理 数据可视化 测试技术
|

告别‘人海战术’!基于EvalScope 的文生图模型智能评测新方案

生成式模型在文本生成图片等领域的快速发展,为社区带来了日新月异的诸多文生图模型。

1064 20
|
2月前
|
机器学习/深度学习 算法 安全
|

打破真题依赖!微软、清华联合开源 X-Coder:全合成数据激发代码大模型推理潜力

微软与清华联合推出X-Coder系列模型,首创纯合成数据训练范式,在不使用任何真实竞赛题的前提下,仅用7B参数即在LiveCodeBench v5上达62.9%准确率,超越更大规模依赖真实数据的模型。项目已开源模型与数据集。(239字)

326 11
|
3月前
|
机器学习/深度学习 人工智能 算法
|

自进化≠自我刷题,Agent 真正的突破口是「自己造环境」?——6 位领域学者 · 7 大议题 · 2 万字圆桌观点实录

AI AMA首期聚焦“Agent自进化”,由魔搭等联合发起,邀请翟云鹏主持及5位顶会作者深度对谈。围绕定义、泛化能力、反馈信号、评估体系等7大议题,探讨Agent如何突破“从零开始”瓶颈,实现类人经验积累与策略优化。(239字)

405 6
|
3月前
|
人工智能 JSON 监控
|

基于 AgentScope x AI Agent A2Z部署平台的生产级别Agent上线Live实战分享

本文分享如何用AgentScope框架+AI Agent A2Z平台,一键完成AI Agent生产级部署:解决“开发易、上线难”痛点,快速生成标准/chat接口(如https://agentscope.aiagenta2z.com/deep_research_agent/chat),支持高并发、实时监控与冷启动。

523 5
|
3月前
|
存储 人工智能 资源调度
|

迈向AI4S 2.0,上海AI实验室开源书生1T Moe 科学大模型Intern-S1-Pro!

2月4日,上海AI实验室开源万亿参数科学多模态大模型Intern-S1-Pro,全球开源社区中规模最大的AI4S模型。基于SAGE“通专融合”架构与MoE设计,融合傅里叶位置编码与创新路由机制,科学推理达奥赛金牌水平,综合能力稳居国际第一梯队,赋能AGI for Science范式革命。(239字)

494 4
|
4月前
|
安全 测试技术 API
|

MiniMax 开源新评测集:定义Coding Agent 的生产级标准

Coding Agent常因“过程违规”遭诟病,如无视指令、破坏规范。MiniMax推出OctoCodingBench,首创面向工程可靠性的过程评估体系,揭示当前模型在多规则协同下成功率极低,呼吁行业关注“过程正确性”,推动Agent从能用走向可用。

692 5

什么是幂等

幂等性指操作执行一次或多次结果一致。读操作(如HTTP GET)不改变数据,天然幂等;写操作(如POST、PUT、DELETE)可能改变状态,需额外机制保障幂等。

359 1
|
5月前
|
传感器 网络协议 编译器
|

C 语言为何能稳居底层开发主流语言宝座

自1972年诞生以来,C语言凭借极致性能、直接操控硬件的能力及完善的生态,在嵌入式系统、操作系统等底层开发领域始终占据核心地位,成为近半个世纪不可替代的编程基石。

257 0
|
5月前
|
存储 算法 BI
|

xxljob本地运行

本文介绍XXL-JOB分布式任务调度框架的部署与使用,涵盖源码获取、服务端数据库配置、客户端注册及任务调度配置,支持多种路由策略与分片广播,助力高效实现定时任务管理。

188 0
|
5月前
|
JavaScript 前端开发 小程序
|

Vue为何能稳居前端框架主流宝座

自2014年发布以来,Vue凭借“低门槛、渐进式、生态完善、持续进化”四大优势,迅速崛起为前端主流框架。其简洁语法利于新手入门,灵活架构适配各类项目,配合Vue Router、Pinia、Vite等官方工具及丰富社区资源,大幅提升开发效率。Vue3采用Proxy响应式机制,性能飞跃,并通过Uni-app等支持多端部署,被字节、阿里等大厂广泛采用。无论是中小企业快速开发,还是大型复杂系统构建,Vue均展现出强大适应力与竞争力,成为前端技术栈的首选之一。

274 0
|
5月前
|
设计模式 算法 Java
|

Java 学习进阶书单:从基础到架构,循序渐进提升技术栈

一份涵盖Java基础、并发、JVM、算法、数据库、框架、架构等12大方向的精选书单,每本书均附精准定位与阅读建议,助力Java程序员高效进阶,少走弯路。

662 0
|
5月前
|
安全 Java 微服务
|

SpringBoot使用汇总

本课程系统讲解Spring Boot 2.0.3核心技能,涵盖配置、MVC、持久化、安全认证、缓存等实战内容,分为基础与进阶两篇,助你快速掌握微服务开发,附真实项目架构与源码。

290 0
|
6月前
|
人工智能 测试技术
|

NeurlPS 2025!多伦多大学TIRE助力3D/4D 生成精准保留主体身份

TIRE提出“追踪-补全-重投影”三阶段方法,实现主体驱动的3D/4D生成。通过视频跟踪识别缺失区域,定制2D模型补全纹理,并重投影至3D空间,提升生成一致性与质量,推动动态场景生成新进展。

379 8
来自: 计算机视觉  版块
|
6月前
|
人工智能 前端开发 关系型数据库
|

MajorRAG 概述(1/3)

一个RAG项目,全文共三个部分:MajorRAG概述、MajorRAG文件内容提取实现分析、MajorRAG聊天问答系统实现分析。 1)第一次做RAG,欢迎带着指导意见评论 2)希望指出不足时可以附带替换方法

321 1
来自: 自然语言处理  版块
|
6月前
|
JavaScript 搜索推荐 开发者
|

ChatPPT+魔搭社区:MCP 2.0全面升级!

ChatPPT MCP2.0正式发布,联合魔搭ModelScope推出云端智能体服务,支持生成、编辑、演讲、动画等全链路功能,开放Streamable HTTP协议与本地Stdio双模式,已接入20+平台,服务300+开发者。

1002 11
|
7月前
|
机器学习/深度学习 人工智能 文字识别
|

全新框架 Glyph 开源:用视觉理解文本,3–4 倍上下文压缩,近 5 倍推理提速!

清华CoAI与智谱AI提出Glyph新范式,将长文本渲染为图像,通过视觉语言模型实现高效长上下文处理。3-4倍压缩比,性能媲美主流大模型,显存占用降2/3,低成本支持百万token任务,开源可商用。

992 26
|
7月前
|
边缘计算 人工智能 PyTorch
|

130_知识蒸馏技术:温度参数与损失函数设计 - 教师-学生模型的优化策略与PyTorch实现

随着大型语言模型(LLM)的规模不断增长,部署这些模型面临着巨大的计算和资源挑战。以DeepSeek-R1为例,其671B参数的规模即使经过INT4量化后,仍需要至少6张高端GPU才能运行,这对于大多数中小型企业和研究机构来说成本过高。知识蒸馏作为一种有效的模型压缩技术,通过将大型教师模型的知识迁移到小型学生模型中,在显著降低模型复杂度的同时保留核心性能,成为解决这一问题的关键技术之一。

654 6
|
7月前
|
机器学习/深度学习 人工智能 自然语言处理
|

84_负提示:控制hallucination

在大语言模型(LLM)应用的浪潮中,我们常常惊叹于这些模型展现出的强大能力——它们能够进行复杂推理、生成高质量内容、回答专业问题,甚至进行创意写作。然而,与此同时,LLM也面临着一个显著的挑战:幻觉(hallucination)问题。这些"胡言乱语"或"无中生有"的内容不仅可能误导用户,还可能在关键应用场景中造成严重后果。

803 0
|
7月前
|
人工智能 自然语言处理 监控
|

83_角色提示:赋予模型特定身份

在大语言模型(LLM)时代,与AI系统的交互方式正经历着一场深刻变革。从简单的指令式对话到复杂的角色扮演,人类与AI的互动边界不断拓展。其中,角色提示(Role Prompting)作为一种强大的提示工程技术,正逐渐成为释放LLM潜能的关键方法。通过为模型赋予特定身份,我们能够引导其以更符合预期的风格和专业度生成内容,显著提升交互体验和任务完成质量。

558 0
|
7月前
|
机器学习/深度学习 数据采集 人工智能
|

100_RLHF(人类反馈强化学习)原理与实践

在大型语言模型(LLM)的发展历程中,我们见证了模型从简单的文本生成工具,逐渐演变为能够理解复杂指令、进行多轮对话、甚至展示创造性思维的智能系统。然而,这一进化并非仅仅依靠模型规模的增大和数据量的增加,更重要的是训练方法的创新。其中,人类反馈强化学习(Reinforcement Learning from Human Feedback, RLHF)作为一种革命性的训练范式,在2022年随着ChatGPT的问世而广受关注,并在随后的GPT-4、Claude、Gemini等先进模型中得到广泛应用。

916 3
|
7月前
|
存储 数据采集 人工智能
|

97_微调基础:全参数 vs LoRA

在2025年的大模型时代,微调技术已经成为将通用大语言模型(LLM)适配到特定领域和任务的核心技术手段。随着模型规模的不断膨胀——从早期的数十亿参数到如今的数千亿甚至万亿参数,如何在有限的计算资源下高效地微调大模型,成为AI工程师面临的关键挑战。本文将深入探讨两种主流的微调方法:全参数微调和LoRA(Low-Rank Adaptation)低秩适应微调,从原理、技术实现、资源需求、性能表现等多个维度进行全面对比分析,帮助读者在实际项目中做出最优的技术选择。

1024 0
|
8月前
|
机器学习/深度学习 数据采集 人工智能
|

Tongyi DeepResearch的技术报告探秘

引言阿里通义实验室悄悄(其实动静不小)发布了一个叫 Tongyi DeepResearch 的 Agent 项目。它没有开发布会,没请明星站台,甚至没发通稿——但它在 GitHub 上架当天,就登顶了“每日趋势榜”。这速度,比人类发现…

1131 2
|
8月前
|
缓存 自然语言处理 并行计算
|

腾讯自研 FastMTP 重磅开源:推理速度暴涨 203%,消费级显卡也能跑出无损速度翻倍!

腾讯自研 FastMTP 重磅开源:推理速度暴涨 203%,消费级显卡也能跑出无损速度翻倍!

786 2
|
8月前
|
人工智能 物联网 API
|

ModelScope魔搭25年9月发布月报

ModelScope魔搭25年9月发布月报

744 10
|
9月前
|
传感器 人工智能 自然语言处理
|

魔搭社区模型速递(7.26-8.2)

🙋魔搭ModelScope本期社区进展:1498个模型,130个数据集,85个创新应用, 7 篇内容

976 0
|
10月前
|
Web App开发 人工智能 Linux
|

TEN VAD 与 Turn Detection 让 Voice Agent 对话更拟人

GPT-4o 所展示对话式 AI 的新高度,正一步步把我们在电影《Her》中看到的 AI 语音体验变成现实。AI 的语音交互正在变得更丰富、更流畅、更易用,成为构建多模态智能体的重要组成部分。

1033 19
|
11月前
|
机器学习/深度学习 自然语言处理 安全
|

ACL 2025 | GALLa:用图结构增强代码大模型,让代码理解更精准!

通过级联多模态架构将代码结构图对齐到大模型表征中

839 69
来自: 自然语言处理  版块
|
11月前
|
机器学习/深度学习 人工智能 文字识别
|

UGPhysics:本科物理推理评估基准发布,助力AI+Physics交叉研究

近年来,人工智能快速发展,大语言模型(LLM)在数学、代码等领域展现出强大的推理和生成能力,正在被广泛应用于各种场景。

424 0
|
3月前
|
人工智能 自然语言处理 数据可视化
|

OoderAI BridgeCode 产品白皮书——全方位赋能企业编程升级

ooderAI BridgeCode 是面向企业的AI确定性代码框架解决方案,通过自学习能力生成专属代码、无缝衔接新旧系统、优化AI时代工作流,并提供128个开源可视化组件。开源无绑定、Web化易用,助力企业降本增效、灵活转型。(239字)

592 1
|
4月前
|
机器学习/深度学习 自然语言处理 算法
|

大模型对齐实战:PPO算法的原理与应用实践

本文深入浅出讲解PPO算法在大模型偏好对齐中的应用,涵盖核心原理、三大环节(SFT、RM、PPO)、实操步骤与效果评估。结合LLaMA-Factory工具,手把手带新手完成智能客服模型微调,助力打造贴合人类偏好的AI应用,是入门强化学习对齐的实用指南。

563 17
|
4月前
|
人工智能 开发框架 安全
|

LLM驱使智能体:从概念、原理到落地实践的完整技术科普指南

随着大语言模型发展,AI正从被动响应迈向主动执行。LLM驱使智能体以大模型为核心决策引擎,通过“推理—行动—反馈”闭环,实现目标导向的自主任务执行,具备动态决策、持续运行与复杂环境适应能力。其在办公自动化、软件开发、知识工作等场景广泛应用,正成为连接大模型能力与现实任务的关键桥梁,推动智能系统向更高阶形态演进。

358 5
|
4月前
|
运维 安全 API
|

内网系统IP离线数据库搭建与维护完整方案

本方案面向无外网内网环境,提供IP离线数据库全生命周期部署指南,涵盖规划、搭建、维护与应急,支持内网IP自定义映射、高并发查询与安全合规,实现数据自主可控、运维闭环,适配多规模企业架构。

452 1
|
4月前
|
数据采集 自然语言处理 算法
|

重塑虚实边界:智元机器人发布首个大语言模型驱动的开源仿真平台Genie Sim 3.0

智元机器人发布全球首个大语言模型驱动的开源仿真平台Genie Sim 3.0,基于NVIDIA Isaac Sim,实现高保真数字孪生环境,支持自然语言生成万级场景,分钟级构建与泛化。平台开源上万小时真实机器人作业数据集,覆盖200+任务,构建10万+场景评估体系,推动具身智能从研发到落地的全链路创新,助力开发者零硬件部署、高效训练与评测。

535 4
|
5月前
|
存储 算法 安全
|

C 语言初学者常见 10 大误区与避坑指南

本文总结C语言初学者常见的10类错误,涵盖语法、内存管理、指针、字符串等方面,结合案例分析成因,提供实用解决方案,帮助新手建立正确编程思维,提升学习效率,夯实基础,少走弯路,顺利迈向嵌入式与底层开发。

310 0
|
5月前
|
SQL 监控 机器人
|

钉钉通知

11

320 0
|
5月前
|
Dubbo 应用服务中间件 Apache
|

WebService

基于 Apache CXF 实现的 Dubbo WebService 协议,支持多连接、短连接、HTTP 同步传输,采用 SOAP 文本序列化,适用于系统集成与跨语言调用。兼容标准 WebService 服务,可实现双向互操作。需配置 Jetty 或 Servlet 容器,支持 WSDL 访问与直连调用。

272 0
|
5月前
|
SQL Dubbo Java
|

线程池:故障梳理总结

本文从故障与技术双重视角,总结线程池满导致服务不可用的典型案例与根因,涵盖数据库慢查询、连接池配置不当、超时设置缺失等问题,分享fast-fail理念、流控背压、谨慎重试等最佳实践,助力开发者提升系统稳定性。

160 0
|
5月前
|
敏捷开发 Dubbo Java
|

需求开发人日评估

本文介绍敏捷开发中工时评估方法,以“人日”为单位,针对开发、自测、联调、测试及发布各阶段提供参考周期,并列举常见需求如Excel导入导出、单表增删改查、跨服务调用等的典型人日估算,助力团队科学规划迭代进度。

198 1
|
5月前
|
SpringCloudAlibaba Java Nacos
|

SpringCloud概述

Spring Cloud是微服务一站式解决方案,具备注约大于配置、组件丰富、开箱即用等特点。其版本以地铁站命名,避免与子项目冲突。Spring Cloud Alibaba融合Nacos、Sentinel、Seata等阿里开源组件,提供更完整、经生产验证的微服务生态,成为当前主流技术选型。

427 0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉答疑群:44837352

0
今日
15229
内容
6
活动
4195
关注
你好!
登录掌握更多精彩内容

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 智能语音交互