|
7月前
|
机器学习/深度学习 人工智能 自然语言处理
|

B站开源IndexTTS2,用极致表现力颠覆听觉体验

在语音合成技术不断演进的背景下,早期版本的IndexTTS虽然在多场景应用中展现出良好的表现,但在情感表达的细腻度与时长控制的精准性方面仍存在提升空间。为了解决这些问题,并进一步推动零样本语音合成在实际场景中的落地能力,B站语音团队对模型架构与训练策略进行了深度优化,推出了全新一代语音合成模型——IndexTTS2 。

3483 62
|
2月前
|
人工智能 语音技术 芯片
|

MiniCPM-o 4.5 CookBook:9B 参数玩转多模态全双工交互

MiniCPM-o 4.5是9B参数多模态大模型,支持图像、视频、音频、文本输入与高质量文/语音输出。具备领先视觉理解(OpenCompass平均77.6分)、实时中英双语语音对话、全双工流式交互、高精度OCR及30+语言能力,适配CPU/GPU/国产芯片,支持本地部署与微调。(239字)

662 5
|
2月前
|
机器学习/深度学习 自然语言处理 算法
|

RAG 文档切分攻略:做好这步,检索精度提升 50%

本文深度解析RAG系统中易被忽视却至关重要的文档切分环节,系统拆解固定长度、语义结构化、混合切分三大方法,结合片段长度、重叠率、元数据标注等5大实操技巧与典型场景案例,助你避开常见陷阱,显著提升检索精度与大模型回答质量。

602 4
|
4月前
|
关系型数据库 应用服务中间件 Linux
|

Linux 实用命令与工具使用指南

本文详解在CentOS 7上搭建LNMP环境的完整流程,涵盖网络配置、组件安装、Nginx与PHP联动设置、网站部署及常见问题排查,帮助新手从零掌握Web服务器搭建核心技能。

473 0
|
6月前
|
机器学习/深度学习 数据采集 监控
|

107_DPO:直接偏好优化

在大型语言模型(LLM)的发展历程中,如何让模型输出与人类偏好保持一致一直是研究的核心挑战。从早期的监督微调(SFT)到基于人类反馈的强化学习(RLHF),再到如今的直接偏好优化(DPO),对齐技术经历了显著的迭代与创新。

1204 1
|
4月前
|
NoSQL 关系型数据库 MySQL
|

MySQL 并发控制核心原理与实践技巧

本文深入解析MySQL高并发场景下的数据一致性难题,涵盖事务隔离级别、锁机制与乐观锁原理,结合电商秒杀、订单重复等真实案例,提供隔离级别选择、悲观锁/乐观锁应用及Redis分流等实战策略,助力开发者平衡性能与一致性。

580 0
|
4月前
|
存储 缓存 安全
|

One Trick Per Day

本文介绍Java开发中的6条关键规范:初始化Map应避免直接指定容量,推荐Guava工具;禁用Executors创建线程池,防止OOM;Arrays.asList返回不可变列表,禁止修改操作;遍历Map优先使用entrySet提升性能;SimpleDateFormat非线程安全,避免定义为static;并发修改记录需加锁,推荐乐观锁配合version机制。

117 0
|
7月前
|
机器学习/深度学习 编解码 人工智能
|

InternVL3.5多模态大模型开源发布,1B-241B九种尺寸,支持跨平台GUI自动化与矢量图生成

近日,上海人工智能实验室(上海AI实验室)重磅开源发布了多模态大模型书生·万象 InternVL3.5,通过创新的级联式强化学习(Cascade RL)、动态视觉分辨率路由与解耦部署架构,实现推理能力、部署效率与通用能力的全面升级。

2235 7
|
7月前
|
算法 测试技术 决策智能
|

美团开源发布 LongCat-Flash-Chat:专为高效智能体任务设计,推理速度超100 tokens/s

9月1日,美团正式发布 LongCat-Flash-Chat,并同步开源。LongCat-Flash 采用创新性混合专家模型(Mixture-of-Experts, MoE)架构,总参数 560 B,激活参数 18.6B~31.3B(平均 27B),实现了计算效率与性能的双重优化。

597 1
|
11月前
|
边缘计算 弹性计算 人工智能
|

魔搭社区大模型一键部署到阿里云边缘云(ENS)

随着大模型技术的快速发展,业界的关注点正逐步从模型训练往模型推理 转变。这一转变不仅反映了大模型在实际业务中的广泛应用需求,也体现了技术优化和工程化落地的趋势。

1207 7
|
1月前
|
缓存 JSON API
|

玩转纳斯达克与纽交所:美股数据 API 对接全指南

本文手把手教你用StockTV API对接美股(NYSE/NASDAQ)实时行情、专业K线及IPO数据,支持WebSocket极速推送、多维技术指标与全交易所覆盖,助你快速构建低延迟量化交易或金融App。(239字)

337 7
|
2月前
|
数据采集 人工智能 达摩院
|

达摩院开源RynnBrain:首个支持移动操作的具身大脑基础模型

达摩院发布首个可移动操作的具身基础模型RynnBrain,首创时空记忆与物理空间推理能力,支持视频/图像/文本多模态输入及区域、轨迹等具身输出。开源MOE架构RynnBrain-30B-A3B(仅3B激活参数),在16项基准全面SOTA,并推出全新评测集RynnBrain-Bench。

537 8
|
5月前
|
人工智能 前端开发 JavaScript
|

新的LLM交互模式!大模型终于能自己生成交互式 UI 了

Google Research推出的Generative UI,让大模型不仅能生成内容,还能一键创建含地图、图表、小游戏等交互功能的完整网页。告别“文字墙”,迈向“内容即应用”的新时代,82.8%用户偏爱此创新体验。

1388 8
|
5月前
|
存储 数据采集 人工智能
|

最佳实践丨让苏东坡“复活”!我用Qwen3-8B实现了与千古文豪的跨时空对话

随着人工智能技术的不断发展,虚拟角色不再只是冰冷的对话机器,而是能够承载历史人物的气质、知识体系乃至精神风貌的“数字化身”。今天,我们将完整揭秘如何基于Qwen3-8B大模型,借助LLaMA-Factory Online平台,打造一个沉浸式的“苏东坡数字分身”,让前沿技术为文化传承注入新的活力。

1000 10
来自: 自然语言处理  版块
|
9月前
|
编解码 物联网 开发者
|

FLUX.1 Kontext 的全生态教程来啦!AIGC专区在线试玩!

Flux.1 Kontext [dev] 开源模型大家都用上了吗?小编汇总了3个使用教程,打包送上!

3384 1
|
1月前
|
人工智能 自然语言处理 监控
|

AI生成内容幻觉检测技术难点:从事实核查到逻辑溯源的深层挑战

幻觉检测面临知识边界模糊、推理链条黑箱及实时性滞后三大核心难题。百搜科技、哈耶普斯广告、智擎营销、DOUBAOMKT及doubaoAD等服务商正通过构建权威知识库与自研监测系统,尝试在GEO服务中突破这一技术瓶颈,确保品牌信息的准确呈现。

335 7
来自: 自然语言处理  版块
|
2月前
|
机器学习/深度学习 存储 人工智能
|

[大模型实战 03] 拆解 Transformers:从原理图解到 HuggingFace Transformers 实战

本文图解Transformer核心原理(注意力机制+位置编码),在Kaggle双T4 GPU环境下实战拆解Hugging Face“铁三角”(Config/Tokenizer/Model),并详解Temperature与Top_p两大生成调控参数,助你真正理解并掌控大模型推理。

827 12
来自: 自然语言处理  版块
|
6月前
|
存储 运维 监控
|

57_大模型监控与运维:构建稳定可靠的服务体系

随着大语言模型(LLM)技术的快速发展和广泛应用,如何确保模型在生产环境中的稳定运行、高效服务和安全合规已成为企业和开发者面临的关键挑战。2025年,大模型服务已从实验室走向各行各业的核心业务流程,其运维复杂度也随之呈指数级增长。与传统软件系统不同,大模型服务具有参数规模庞大、计算密集、行为不确定性高等特点,这使得传统的运维监控体系难以满足需求。

1230 0
|
1月前
|
数据采集 人工智能 数据可视化
|

《基于 DeepSeek 百万token上下文的实证研究:全窗口真实工程压力测试与统计分析》

本项目基于 DeepSeek 于 2026 年 2 月推出的 “新长文本模型”(上下文窗口扩展至1,000,000 tokens,API 端仍保持 V3.2 版本),通过构建非AI/IT领域的完整项目流程,进行了全程、全负载实证工程测试。在单一连续上下文中实现了端到端的闭环。

643 11
|
2月前
|
缓存 自然语言处理 API
|

美团开源 LongCat-Flash-Lite:实现轻量化 MoE 高效推理

美团LongCat团队开源68.5B MoE大模型LongCat-Flash-Lite,创新采用N-gram Embedding架构,推理仅激活2.9B–4.5B参数,却在Agent工具调用、代码生成等任务上大幅领先;支持256K长上下文,API生成速度达500–700 token/s,MIT协议开源。

663 6
|
3月前
|
测试技术 API
|

小而强,GLM-4.7-Flash开源

GLM-4.7-Flash正式开源,30B总参、3B激活参数,兼顾性能与效率,支持免费调用。在编程、中文写作、翻译等多场景表现优异,已上线智谱平台,替代GLM-4.5-Flash,提供全新轻量化部署选择。

1588 1
|
4月前
|
人工智能 Java 关系型数据库
|

[舍弃,后续需调整][Blog]JPA实现分页需求(☆☆)

简介:本任务要求在原有博客系统中实现分页查询功能,涉及SpringBoot、MySQL、Maven及JPA技术。建议使用AI辅助开发,预计耗时1-4小时。需自行补充数据以展示分页效果,注重实践而非标准答案,适合通过动手提升技能。

447 0
|
1月前
|
人工智能 边缘计算 开发框架
|

2026年入局AI晚不晚?答案是:现在就是最好的时机

2026年AI已迈入“技术爆发+应用红利”黄金期:巨头筑基降低门槛,算力成本下降、工具成熟;超级个体10天可开发爆款AI应用;CAIE认证等路径让零基础者快速入局。AI不是短跑,而是马拉松——现在,正是普通人抓住红利的最佳时机。(239字)

766 10
|
2月前
|
JSON 文字识别 API
|

百度文心开源0.9B参数 PaddleOCR-VL-1.5,全球首个支持异形框定位的文档解析模型!

百度文心开源新一代文档解析模型PaddleOCR-VL-1.5:仅0.9B参数,在OmniDocBench v1.5达94.5%精度,全球首个支持异形框定位,精准识别倾斜、弯折、反光等“歪文档”,集成印章识别、多语种(含藏语/孟加拉语)及古籍解析能力,推理速度超MinerU2.5达43%。(239字)

751 2
|
11月前
|
人工智能 测试技术 API
|

通义灵码 + 魔搭MCP:全流程构建创空间应用

最近,通义灵码上线 MCP(ModelScope Cloud Platform)功能,从之前代码生成及修改的基础功能,到可以使用MCP服务连接更多功能,开发者可以实现从 代码爬取、模型推理到应用部署

2840 27
|
11月前
|
编解码 人工智能
|

通义万相Wan2.1-VACE开源!业内首个视频编辑统一模型!附推理教程

通义万相Wan2.1-VACE开源!业内首个视频编辑统一模型!附推理教程

2333 7
|
2月前
|
人工智能 算法 测试技术
|

Boss直聘开源Nanbeige4.1-3B:小模型全能新标杆

Boss直聘南北阁实验室发布Nanbeige4.1-3B:一款仅3B参数的“小而全”统一模型,首次在同规模中系统整合强推理、人类偏好对齐与深度搜索Agent能力,性能超越Qwen3-32B等大模型,已开源权重、技术报告及合成数据。

875 4
|
2月前
|
数据采集 监控 物联网
|

大模型微调实战——从数据准备到落地部署全流程

本文以7B大模型为例,手把手教你零代码完成办公场景微调:从数据清洗、LoRA轻量训练到效果验证与一键部署,全程无需GPU和编程基础,30分钟快速上手,解决“通用模型不精准、输出不可控”痛点,让大模型真正落地业务。

1182 13
|
3月前
|
机器学习/深度学习 安全 测试技术
|

美团 LongCat-Flash-Thinking-2601 发布,工具调用能力登顶开源 SOTA!

美团LongCat团队发布并开源LongCat-Flash-Thinking-2601,升级支持“重思考模式”,在智能体搜索、工具调用等任务中达开源SOTA。具备强泛化与抗噪能力,支持在线免费体验,助力开发者高效落地复杂应用场景。

671 1
|
4月前
|
存储 安全 前端开发
|

1.RememberMe简介及用法

RememberMe是一种服务器端会话保持机制,用户勾选后关闭浏览器再打开无需重新登录。其通过Cookie存储令牌实现自动认证,避免频繁输入账号密码,提升用户体验,同时需注意安全风险与优化策略。

246 0
|
4月前
|
机器学习/深度学习 测试技术 API
|

DeepSeek V3.2 正式版:强化 Agent 能力,融入思考推理

DeepSeek发布正式版V3.2与高性能Speciale版本,支持思考模式下工具调用,推理能力达全球领先水平。V3.2平衡效率与性能,适用于通用任务;Speciale专注复杂推理,在数学与编程竞赛中表现卓越,已开源并上线API。

1188 9
|
12月前
|
API 开发者 异构计算
|

实战 | Intel OpenVINO™ Day0 实现 Qwen3 快速部署

实战 | Intel OpenVINO™ Day0 实现 Qwen3 快速部署

1149 10
|
3月前
|
传感器 边缘计算 自动驾驶
|

蚂蚁正式开源 LingBot-Depth,基于掩码深度建模的新一代空间感知模型

蚂蚁灵波科技开源LingBot-Depth空间感知模型,首创“掩码深度建模”技术,显著提升消费级双目相机对透明、反光物体的深度补全能力。实测精度与覆盖率超越顶级工业相机,支持机器人稳定抓取、4D场景理解,已轻量化部署。

543 3
|
6月前
|
自然语言处理 搜索推荐 数据可视化
|

49_选择框架:任务类型与模型匹配

在大语言模型(LLM)应用开发的早期阶段,选择合适的模型架构和框架往往是项目成功的关键第一步。随着2025年LLM技术的快速发展,市场上可用的模型和框架数量激增,如何基于特定任务类型选择最匹配的解决方案成为开发者面临的重要挑战。本文将深入探讨任务类型与LLM模型匹配的方法论,重点介绍基于决策树的模型选择框架,并通过实际代码示例演示如何构建和应用这一框架。

516 0
|
9月前
|
监控 安全 NoSQL
|

【SpringBoot】OAuth 2.0 授权码模式 + JWT 令牌自动续签 的终极落地指南,包含 深度技术细节、生产环境配置、安全加固方案 和 全链路监控

【SpringBoot】OAuth 2.0 授权码模式 + JWT 令牌自动续签 的终极落地指南,包含 深度技术细节、生产环境配置、安全加固方案 和 全链路监控

3208 1
|
1月前
|
机器学习/深度学习 开发者 内存技术
|

阶跃星辰 Step 3.5 Flash 预训练/中训练/训练框架全部开源!

阶跃星辰开源Step 3.5 Flash——迄今最强开源Agent基座模型,含Base/Midtrain权重及Steptron全栈训练框架,支持预训练、SFT与强化学习,专为智能体设计。已登OpenRouter榜首,获社区广泛好评。(239字)

515 22
|
2月前
|
机器学习/深度学习 并行计算 算法
|

LLaDA2.1 正式开源,可纠错编辑机制让 100B 扩散模型突破 892 TPS 速度极限

蚂蚁研究院发布LLaDA2.1,首创“可纠错编辑(ECE)”机制,突破扩散语言模型(dLLM)速度与质量瓶颈:推理达892 TPS,支持极速/质量双模式,并集成业界首个dLLM强化学习框架EBPO。开源即用,迈向真正可用的下一代大模型。

378 6
|
2月前
|
人工智能 自然语言处理 前端开发
|

写了10万行代码,却毁在配色上?这套指令让后端直男秒变设计总监

这是一篇专为后端及全栈开发者定制的实用指南,旨在解决开发者“代码强但审美弱”的痛点。文章提供了一套核心AI指令,能将DeepSeek等AI变成专业UI设计顾问,快速生成符合大厂规范(Design Token)的配色体系。通过一个后台管理系统的实战案例,演示了如何用AI将“土味”界面瞬间升级为专业级UI,让开发者无需学习设计理论也能搞定高颜值配色。

371 4
|
4月前
|
JSON NoSQL MongoDB
|

文档的基本查询

本文介绍了MongoDB中查询文档的基本操作。通过`find()`和`findOne()`方法可实现全集合查询及条件查询,如按`userid`筛选;支持投影查询,指定返回字段,控制是否显示`_id`,灵活获取所需数据。

180 0
|
4月前
|
Java 开发工具 数据安全/隐私保护
|

项目《中州养老》

《中州养老》是一个面向养老院的后台管理系统,涵盖预约、入住、健康监测等核心功能。系统分为员工管理端与家属小程序端,采用Vue3、SpringBoot等技术栈,集成阿里云IOT实现智能设备数据采集与异常报警,并通过RBAC权限模型保障系统安全。

296 0
|
6月前
|
传感器 人工智能 API
|

仅100多元,他给视障人群装上AI“眼睛”

上海两名开发者为验证AI助盲实效,亲手打造百元AI眼镜,蒙眼实测过马路、识盲道,并开源项目鼓励更多人参与。技术导航,人心照亮。

1484 6
|
9月前
|
人工智能 自然语言处理 资源调度
|

魔搭社区模型速递(7.20-7.26)

魔搭ModelScope本期社区进展:1698个模型,216个数据集,103个创新应用, 7 篇内容

763 0
|
12月前
|
机器学习/深度学习 人工智能 JSON
|

这个AI把arXiv变成代码工厂,快速复现顶会算法!Paper2Code:AI论文自动转代码神器,多智能体框架颠覆科研复现

Paper2Code是由韩国科学技术院与DeepAuto.ai联合开发的多智能体框架,通过规划、分析和代码生成三阶段流程,将机器学习论文自动转化为可执行代码仓库,显著提升科研复现效率。

1596 19
来自: 自然语言处理  版块
|
2月前
|
人工智能 JSON 自然语言处理
|

Agent Skills 究竟是什么?从玩具到工程化的必经之路

AI应用开发正从“Prompt驱动”迈向“技能驱动”。本文详解Agent Skills标准化实践:以Claude Code Skills为范本,用SKILL.md实现自描述技能;借MCP协议统一多源工具调用,解决兼容与安全难题;结合DeepSeek+OpenAI实战,展现可插拔、可审计、可演进的工业级Agent构建路径。

1101 0
|
2月前
|
存储 API 数据库
|

投稿 | Zvec: 开箱即用、高性能的嵌入式向量数据库

Zvec 是一款开源(Apache 2.0)轻量级嵌入式向量数据库,专为终端侧设计,具备开箱即用、资源可控、极致性能与完整向量能力四大优势,支持标量-向量混合查询、CRUD、崩溃恢复等生产级特性,让端侧RAG如SQLite般简单可靠。(239字)

536 7
|
4月前
|
SQL 关系型数据库 MySQL
|

MySQL 实用语句与工具使用指南

本文系统梳理MySQL开发运维中的核心实用语句与必备工具,涵盖备份恢复、性能分析、索引管理、数据治理等场景,结合Navicat、DataGrip、Prometheus等工具,提升工作效率与系统稳定性。

330 0
|
4月前
|
数据采集 数据可视化 数据挖掘
|

Python 高效学习指南:从入门到全场景的科学路径

Python学习应避免贪多求全,遵循“筑基→深化→定向→实战”四阶段路径:先掌握核心语法与编程思维,再深入面向对象与代码质量,随后聚焦Web、数据或自动化方向,最后通过项目整合技能。强调实践闭环与工程化思维,助力从入门迈向实用开发。

375 0
|
5月前
|
人工智能 JavaScript API
|

AI Agent Registry and Growth 对比各种AI Agent注册和发布的渠道生态 OpenAI Google Claude 开源工具 agtm等

本文对比了OpenAI、Google、Claude及开源平台如agtm 的AI Agent注册与发布方法,重点介绍AI Agent Registry API、社区和Marketplace三种方式,帮助开发者和产品经理提升智能体的可见性与分发渠道。

1061 0
|
5月前
|
人工智能 Cloud Native 前端开发
|

详细教程 PhpStorm 2025.1 安装+ 激活中文配置,附安装包

PhpStorm 2025.1 全新升级,深度支持 PHP 8.3+/8.4,强化 AI 助手、Xdebug 调试与 .env 嵌套变量,提升全栈开发效率,打造现代化 PHP 开发利器。

974 0
|
6月前
|
监控 Cloud Native 网络性能优化
|

122_集群管理:Slurm配置 - 优化大规模训练调度

在2025年,大规模语言模型(LLM)的训练已经进入到超大规模时代,模型参数量达到数千亿甚至万亿级别,训练过程需要动用数百甚至数千个GPU/TPU。在这种情况下,高效的集群管理系统成为训练成功的关键基础设施。Slurm(Simple Linux Utility for Resource Management)作为目前最流行的开源作业调度系统,广泛应用于科研机构和大型科技公司的超级计算集群中。

1173 3

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉答疑群:44837352

0
今日
15197
内容
6
活动
4134
关注
你好!
登录掌握更多精彩内容

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 智能语音交互