|
11月前
|
人工智能 数据可视化 C++
|

Math24o:SuperCLUE开源的高中奥数推理测评基准,85.71分屠榜

Math24o是首个针对高中奥林匹克数学竞赛的中文大模型测评基准,采用2024年预赛真题实现自动化评估,为模型数学推理能力提供客观衡量标准。

376 48
来自: 科学计算  版块
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
|

Reve Image:设计师失业警告!AI秒出海报级神图,排版自动搞定

Reve Image 是 Reve 推出的全新 AI 图像生成模型,专注于提升美学表现、精确的提示遵循能力以及出色的排版设计,能生成高质量的视觉作品。

639 29
来自: 计算机视觉  版块
|
11月前
|
机器学习/深度学习 人工智能 Rust
|

MoshiVis:语音视觉实时交互开源!7B模型秒懂图像,无障碍革命来袭

MoshiVis 是 Kyutai 推出的开源多模态语音模型,结合视觉与语音输入,支持实时交互,适用于无障碍应用、智能家居控制等多个场景。

534 28
来自: 语音  版块
|
11月前
|
机器学习/深度学习 人工智能 缓存
|

BlockDance:扩散模型加速革命!复旦字节联手实现50%无损提速

BlockDance 是复旦大学与字节跳动联合推出的扩散模型加速方法,通过识别重用相邻时间步中的结构相似特征,减少冗余计算,最高可加速50%,同时保持生成质量。

327 27
来自: 科学计算  版块
|
11月前
|
人工智能 数据库 决策智能
|

Archon – 开源 AI 智能体框架,自主生成代码构建 AI 智能体

Archon 是一个开源的 AI 智能体框架,能够自主生成代码并优化智能体性能,支持多智能体协作、领域知识集成和文档爬取等功能,适用于企业、教育、智能家居等多个领域。

1066 10
来自: 自然语言处理  版块
|
11月前
|
人工智能 Java API
|

ai-api-union项目,适配各AI厂商api

本项目旨在实现兼容各大模型厂商API的流式对话和同步对话接口,现已支持智谱、豆包、通义、通义版DeepSeek。项目地址:[https://gitee.com/alpbeta/ai-api-union](https://gitee.com/alpbeta/ai-api-union)。通过`ChatController`类暴露两个接口,入参为`ChatRequest`,包含会话ID、大模型标识符和聊天消息列表。流式对话返回`Flux<String>`,同步调用返回`String`

458 2
|
11月前
|
人工智能 前端开发 API
|

人人都是应用开发者:AI时代的全栈产品经理实践

本文试图最短路径、最轻模式来做一个应用,实现一个需求!仅需三大步+9小步,以下为手把手教学流程。

734 10
|
12月前
|
存储 人工智能 缓存
|

DeepSeek 开源周第三弹!DeepGEMM:FP8矩阵计算神器!JIT编译+Hopper架构优化,MoE性能飙升

DeepGEMM 是 DeepSeek 开源的专为 FP8 矩阵乘法设计的高效库,支持普通和混合专家(MoE)分组的 GEMM 操作,基于即时编译技术,动态优化矩阵运算,显著提升计算性能。

1113 3
来自: 科学计算  版块
|
12月前
|
人工智能 机器人 开发工具
|

LazyLLM:还在为AI应用开发掉头发?商汤开源智能体低代码开发工具,三行代码部署聊天机器人

LazyLLM 是一个低代码开发平台,可帮助开发者快速构建多智能体大语言模型应用,支持一键部署、跨平台操作和多种复杂功能。

669 3
来自: 多模态  版块
|
12月前
|
存储 人工智能 搜索推荐
|

HealthGPT:你的AI医疗助手上线了:支持X光到病理切片,诊断建议+报告生成全自动

HealthGPT 是浙江大学联合阿里巴巴等机构开发的先进医学视觉语言模型,具备医学图像分析、诊断辅助和个性化治疗方案建议等功能。

1478 5
来自: 多模态  版块
|
12月前
|
人工智能 小程序 机器人
|

GDC2025 | DeepSeek-Qwen 模型蒸馏极限挑战赛,来了!(预赛报名)

欢迎您关注由魔搭社区 x SwanLab平台联合举办的 DeepSeek-Qwen 模型蒸馏极限挑战赛!本赛事将作为2025全球开发者先锋大会(GDC)的活动之一,欢迎具备大模型训练/微调实战经验的独立开发者前来挑战!详细报名规则见后文。

395 3
|
23天前
|
JavaScript 前端开发
|

前端新手练习纯js原生做轮播图的感悟

做轮播的要点

108 4
|
2月前
|
缓存 Java Nacos
|

Java微服务架构实践:从搭建到优化的全流程指南

本文介绍Java微服务架构的搭建与优化,涵盖服务拆分、Spring Cloud生态、注册发现、配置中心、容错机制及性能提升策略,助力构建高效、稳定、可扩展的分布式系统。

192 1
|
2月前
|
数据采集 存储 物联网
|

C 语言微服务架构实践:从模块化到轻量级分布式的探索

本文探讨C语言在微服务架构中的实践路径,通过“模块化拆分+进程通信”实现轻量级分布式系统,适用于嵌入式与物联网等资源受限场景,结合MQTT协议支持跨设备协作,虽缺乏高级特性,但凭借高效、低耗优势,可作为特定场景下微服务的有力补充。

101 2
|
2月前
|
存储 SQL 关系型数据库
|

MySQL 开发进阶:从初级到数据库工程师的能力提升路径

本文系统梳理MySQL开发从初级到高级工程师的四阶段进阶路径,涵盖数据库设计、高可用架构、性能优化与分库分表等核心能力,结合实操案例与学习原则,助力开发者实现职业跃迁。

119 0
|
2月前
|
SQL 关系型数据库 MySQL
|

MySQL 实用语句与工具使用指南

本文系统梳理MySQL开发运维中的核心实用语句与必备工具,涵盖备份恢复、性能分析、索引管理、数据治理等场景,结合Navicat、DataGrip、Prometheus等工具,提升工作效率与系统稳定性。

106 0
|
2月前
|
存储 安全 算法
|

Java学习避坑指南:初学者常犯错误与解决方案

本文总结Java初学者常见的10大误区,涵盖语法死记、思维固化、异常处理缺失、static滥用、集合误用、JVM知识薄弱、框架依赖复制粘贴、代码不规范、缺乏实战及盲目刷题等问题,结合案例分析成因并提供解决方案,助力新手建立正确编程思维,提升学习效率,少走弯路。

130 0
|
2月前
|
应用服务中间件 测试技术 数据库
|

0-1教程 ChatGPT Apps Store应用提交教程——和MCP开发部署

本文以“A2Z Bill Agent”为例,详细介绍如何提交应用至ChatGPT App Store。涵盖准备App图标、MCP服务器配置、域名验证、测试用例编写、截图要求等全流程,助开发者高效完成上架。

182 3
|
3月前
|
人工智能 自然语言处理 搜索推荐
|

贝聿铭的 “数字续作”:蚂蚁百宝箱 × 苏州博物馆,用 AI 重构文化地标

苏州博物馆携手蚂蚁百宝箱推出AI助手“小苏苏”,集成展讯、导览、文创推荐等功能,打造“咨询—导览—消费”闭环,以智能服务提升参观体验,助力文博场馆数字化升级。

318 3
来自: 自然语言处理  版块
|
3月前
|
搜索推荐 API Python
|

DeepSeek-V3.1 发布,迈向 Agent 时代的第一步

今日发布DeepSeek-V3.1,支持混合推理架构,提升思考效率与Agent能力。编程与搜索智能体表现显著增强,API已升级并支持Anthropic格式,模型开源,上下文扩展至128K。

726 5
|
3月前
|
安全 Java 数据库连接
|

如何在Java代码中处理数据库连接异常

在Java中,合理处理数据库连接异常对程序稳定性至关重要。需捕获`ClassNotFoundException`和`SQLException`等具体异常,使用`try-with-resources`自动释放资源,结合日志记录与用户友好提示,并可引入重试机制应对网络波动,提升系统容错能力。

291 1
|
4月前
|
机器学习/深度学习 存储 人工智能
|

106_模型合并:Task Arithmetic

在大语言模型(LLM)时代,模型合并技术正在成为高效整合不同模型能力的关键方法。随着开源模型的爆发式增长,如何在不进行昂贵的重新训练的情况下,将多个专用模型的知识整合到一个统一模型中,成为了研究和工业界的重要课题。Task Arithmetic作为一种新兴的模型合并方法,通过向量操作实现权重融合,为这一挑战提供了创新解决方案。

362 24
|
4月前
|
存储 人工智能 数据中心
|

138_绿色计算:碳排放优化 - 估算部署的碳足迹与LLM环境友好型部署最佳实践

随着大语言模型(LLM)在各个行业的广泛应用,其计算需求和环境影响正日益受到关注。根据最新研究,训练一个大型LLM模型可能产生数百吨二氧化碳当量的排放,这相当于普通家庭几十年的碳足迹。在全球气候变化和可持续发展的背景下,如何优化LLM部署的碳足迹,实现环境友好型AI应用,已成为行业面临的重要挑战。

341 2
|
4月前
|
存储 机器学习/深度学习 自然语言处理
|

108_连续微调:链式任务适应

在大模型时代,如何让预训练模型高效地适应多个相关任务,同时保持知识的连贯性和完整性,成为了一个重要的研究方向。连续微调(Continual Fine-tuning)作为一种新兴的微调范式,通过链式任务适应(Sequential Task Adaptation)机制,实现了模型在顺序学习多个任务时的知识保留和迁移。本文将深入探讨连续微调的核心原理、实现方法、关键技术挑战以及2025年的最新研究进展,为读者提供全面的技术指导和实践指南。

189 1
|
4月前
|
Kubernetes Cloud Native 异构计算
|

133_云端扩展:Kubernetes scaling - 设置自动缩放的阈值与LLM部署最佳实践

在大语言模型(LLM)部署的时代,如何高效地管理计算资源、应对动态负载并优化成本,成为了每个AI工程师必须面对的挑战。随着LLM应用的普及,用户请求模式变得日益复杂且难以预测,传统的静态资源配置方式已无法满足需求。Kubernetes作为云原生时代的容器编排平台,其强大的自动扩展能力为LLM部署提供了理想的解决方案。

381 2
|
4月前
|
数据采集 人工智能 自然语言处理
|

121_训练评估:困惑度分析 - 分析指标与下游任务关系

在大规模语言模型(LLM)的训练过程中,评估模型性能是一个至关重要但常被简化处理的环节。2025年的研究表明,仅依赖单一指标(如困惑度)来判断模型质量已经无法满足复杂应用场景的需求。困惑度作为语言模型训练中最核心的评估指标,其与下游任务表现之间的关系远比直觉更复杂。本文将深入剖析困惑度的数学原理、计算方法、优化策略,以及其与各类下游任务表现的相关性分析,为大规模语言模型的训练优化提供全面的技术指导。

591 1
|
4月前
|
数据采集 自然语言处理 并行计算
|

128_自我监督变体:SimCLR for Text - 推导对比学习的文本应用,代码实现无标注预训练的独特目标

在大型语言模型快速发展的今天,自我监督学习已成为训练高质量模型的核心技术。然而,传统的掩码语言建模(MLM)和因果语言建模(CLM)方法存在一些局限性,如计算效率低下和上下文利用不充分等问题。对比学习作为一种新兴的自我监督学习范式,通过学习相似性和差异性来提取数据的内在表示,为语言模型预训练提供了新的思路。

261 2
|
4月前
|
机器学习/深度学习 人工智能 并行计算
|

124_数据并行扩展:Megatron框架 - 分析模型分片的独特通信开销

2025年,大型语言模型的规模已达到数千亿甚至数万亿参数,单GPU训练已成为不可能的任务。高效的分布式训练技术成为训练超大模型的关键。Megatron框架作为业界领先的分布式训练解决方案,通过创新性的并行策略,实现了对超大语言模型的高效训练。

543 3
|
4月前
|
缓存 人工智能 并行计算
|

59_实时性模型:选择低延迟LLM

在当今快速发展的人工智能领域,大型语言模型(LLM)的应用正迅速渗透到各个行业。随着企业对AI响应速度的要求不断提高,低延迟LLM的选择与优化已成为技术团队面临的关键挑战。实时聊天机器人、智能客服、自动驾驶辅助系统等场景对响应时间提出了极高的要求,毫秒级的延迟差异可能直接影响用户体验和业务效率。2025年,随着推理优化技术的突破性进展,低延迟LLM已不再是难以企及的目标,而是成为实际生产环境中的标准配置。

330 0
|
4月前
|
机器学习/深度学习 人工智能 算法
|

62_模型融合:ensemble LLM技巧

在2025年的AI生态中,大语言模型(LLM)已成为技术创新的核心引擎,但单一模型在面对复杂任务时往往表现出局限性。不同模型由于训练数据、架构设计和优化目标的差异,在各领域展现出独特优势:模型A可能擅长逻辑推理,模型B在创意写作上更出色,而模型C则在事实性问答中准确率更高。

271 0
|
4月前
|
Prometheus 监控 Cloud Native
|

78_资源监控:NVIDIA-SMI进阶

在大语言模型(LLM)训练和推理过程中,GPU资源的高效监控和管理至关重要。随着模型规模的不断增长和计算需求的提升,如何精确监控GPU利用率、及时发现性能瓶颈并进行优化,成为AI研究人员和工程师面临的重要挑战。NVIDIA-SMI作为NVIDIA官方提供的GPU监控工具,提供了丰富的功能来监控和管理GPU资源。本文将深入探讨NVIDIA-SMI的进阶使用方法,以及如何利用其与其他工具结合构建高效的GPU利用率可视化监控系统。

916 0
|
5月前
|
机器学习/深度学习 并行计算 小程序
|

DeepSeek-V3.2-Exp 发布,训练推理提效,API 同步降价

今天,我们正式发布 DeepSeek-V3.2-Exp 模型,这是一个实验性( Experimental)的版本。作为迈向新一代架构的中间步骤,V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek Sparse Attention(一种稀疏注意力机制…

784 0
|
5月前
|
API 网络安全
|

调用Dashscope接口时报错

450 1
|
5月前
|
调度 开发者 异构计算
|

冠军10万美金!AMD 2025 分布式推理算子优化挑战赛来了

冠军10万美金!AMD 2025 分布式推理算子优化挑战赛来了

434 13
|
5月前
|
存储 数据处理 数据库
|

公募REITs公告PDF文档处理项目

本项目是一个专门用于处理基础设施公募REITs(Real Estate Investment Trusts)公告PDF文件的完整RAG数据处理管道,也适用于其他公告PDF文件,应用多模态大模型,可高效提升文本提取内容。系统能够自动化地将PDF公告文档转换为结构化数据,能够检测表格、实现跨页表格拼接,并将表格内容还原为便于检索的文本信息。并构建向量数据库和 Elasticsearch 以支持智能检索与问答系统。

219 8
|
5月前
|
Kubernetes Devops API
|

从零到面试高手:每个 DevOps 专业人士都必须知道的 20 个 Kubernetes 架构问答

Kubernetes 是当前 DevOps、云原生和 SRE 领域的关键技能。本文总结了 20 个高频面试问题,涵盖架构组件、工作原理及核心概念,助你轻松掌握 Kubernetes 基础,提升面试与实战能力。

317 2
|
6月前
|
物联网 开发者
|

LoRA 模型的全新玩法——AutoLoRA 带你体验 LoRA 检索与融合的魔法

为了充分挖掘魔搭社区 Diffusion LoRA 模型的潜力,我们开发了一个自动 LoRA 检索与融合框架:AutoLoRA。他可以根据输入的文本提示,从 LoRA 候选池中检索到 个与提示词相关的LoRA,然后通过集成一个门控融合模块在生成图片的时候促进多个 LoRA 协同工作,充分发挥各个 LoRA 的能力。

277 0
|
6月前
|
人工智能 算法 安全
|

IROS 2025 |从数字智能走向物理智能,“桃源”与真实世界机器人学习挑战赛启动,2大赛道等你来战

2025年10月,IROS (智能机器人与系统国际会议)期间,上海人工智能实验室(上海AI实验室)将举办物理世界中的多模态机器人学习研讨会,IROS 2025“桃源”与真实世界机器人学习挑战赛(机器人学习挑战赛)现已启动报名,欢迎全球创新者与挑战者参加。

770 0
|
7月前
|
机器学习/深度学习 自然语言处理 API
|

RM-Gallery: 一站式奖励模型平台

近年来,大型语言模型(LLMs)发展迅速,比如 ChatGPT、Qwen、Claude、 Llama。这些模型最初的能力来自预训练规模的扩展(pre-training scaling),即通过 “next-token prediction” 的任务,在海量语料上训练,从而获得通用能力。但是面对具体场景,由于场景任务目标不一定和通用能力匹配(比如对齐场景),所以预训练模型表现会有一些不足。为了在预训练之后进一步优化大型语言模型,近年来的研究开始转向训练后和测试时的规模扩展,其中奖励模型起着关键作用。

406 2
|
8月前
|
JSON API 数据格式
|

国内主流电商淘宝+京东+1688api数据接口实操

这是一套用于获取淘宝、京东和1688电商平台数据的Python实现方案。通过定义统一的API基类,封装了请求流程与异常处理机制,包括请求超时、频率限制及认证失败等。针对各平台特性,分别实现了签名生成、参数准备与接口调用功能,如商品搜索、详情查询和订单列表获取等。使用前需申请各平台开发者账号以获取AppKey和AppSecret,并根据实际需求调整代码配置与业务逻辑,同时注意控制请求频率避免限流。

275 3
|
9月前
|
传感器 人工智能 算法
|

聚焦“以技术集成支撑单亩价值创造”与“增加值分配机制区块链存证确权”两大核心本质

“振兴链-技术集成科技小院”以技术集成与区块链为核心,推动农业现代化。通过多维度技术整合(如精准农业、物联网等),突破资源约束,最大化单亩产值;同时利用区块链确权存证,建立透明分配机制,解决传统农业中收益不均问题。技术赋能生产,制度重塑分配,实现效率与公平的平衡,助力乡村振兴与产业升级。典型场景显示,该模式可显著提升单亩价值并确保增值公平分配。

355 10

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉答疑群:44837352

0
今日
15090
内容
6
活动
3970
关注
你好!
登录掌握更多精彩内容

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 智能语音交互