|
2月前
|
人工智能 搜索推荐 API
|

FlashLabs 正式发布 Chroma 1.0 - 全球首个开源、端到端、实时语音到语音 AI 模型 → 支持个性化语音克隆

FlashLabs 发布全球首个开源、端到端、实时语音到语音 AI 模型 Chroma 1.0,支持低延迟(TTFT \x26lt; 150ms)、高保真语音克隆与强对话能力,旨在成为 OpenAI Realtime API 的开源替代方案。

321 3
|
2月前
|
JavaScript 前端开发
|

前端新手练习纯js原生做轮播图的感悟

做轮播的要点

119 4
|
2月前
|
机器学习/深度学习 人工智能 JSON
|

大模型微调实战:从原理到落地的完整指南

本文系统讲解大模型微调的原理与实战,涵盖LoRA等高效方法,手把手教你用少量数据定制专属模型,结合数据准备、训练策略与效果评估,助力开发者低成本实现AI应用落地。

413 11
|
2月前
|
机器学习/深度学习 文字识别 测试技术
|

10B击败200B!阶跃星辰10B视觉语言SOTA模型开源

阶跃星辰发布开源多模态小模型Step3-VL-10B,仅10B参数却媲美百亿级大模型,在视觉感知、逻辑推理、数学竞赛等任务中达同规模SOTA,支持端侧部署,推动智能终端交互革新。

260 6
|
2月前
|
存储 人工智能 缓存
|

别再把大脑当成 /dev/null 了!用这套AI指令给记忆装个 "Redis 缓存层"

本文将大脑记忆比作数据库存储,指出传统记忆的"无索引"缺陷。通过一套"记忆架构师AI指令",利用数据预处理、建立索引和持久化策略(遗忘曲线),帮助开发者构建高效、稳固的知识记忆系统,实现认知的"架构升级"。

443 4
|
2月前
|
机器学习/深度学习 自然语言处理 算法
|

大模型对齐实战:PPO算法的原理与应用实践

本文深入浅出讲解PPO算法在大模型偏好对齐中的应用,涵盖核心原理、三大环节(SFT、RM、PPO)、实操步骤与效果评估。结合LLaMA-Factory工具,手把手带新手完成智能客服模型微调,助力打造贴合人类偏好的AI应用,是入门强化学习对齐的实用指南。

350 17
|
2月前
|
测试技术 API
|

小而强,GLM-4.7-Flash开源

GLM-4.7-Flash正式开源,30B总参、3B激活参数,兼顾性能与效率,支持免费调用。在编程、中文写作、翻译等多场景表现优异,已上线智谱平台,替代GLM-4.5-Flash,提供全新轻量化部署选择。

1165 1
|
2月前
|
人工智能 决策智能
|

多智能体军事协同系统:智能化防务体系中的关键技术框架

多智能体军事协同系统是智能化防务的重要理论方向,通过分布式感知、决策一致与协同控制,构建高效、鲁棒的系统协同模型。本文从概念、技术基础到发展趋势进行系统解析,探讨其在提升整体作战效能、推动系统智能演进中的理论价值,为相关研究提供参考。(238字)

207 2
|
2月前
|
异构计算
|

魔塔GPU平台挂起

87 1
|
2月前
|
存储 人工智能 安全
|

深度揭秘 ooderAgent MIT 开源框架

在人工智能技术快速发展的今天,AI Agent系统已成为实现复杂任务协作的重要架构。ooderAgent(全称ooder SuperAgent)作为一套基于MIT协议的开源企业级AI能力分发与自动化协作框架,通过创新的Agent架构和SKILL管理机制,为企业提供了从简单任务到复杂流程的全场景自动化解决方案。该框架由ooder团队开发,采用SpringCloud分布式架构,于2026年1月发布最新版本v0.6.2,目前已在企业级AI应用领域展现出重要的技术价值。 本研究旨在全面剖析ooderAgent框架的技术特点与技术价值,重点关注其在技术架构设计、应用能力边界、技术创新突破以及商业价值创造

456 0
|
2月前
|
人工智能 开发框架 安全
|

LLM驱使智能体:从概念、原理到落地实践的完整技术科普指南

随着大语言模型发展,AI正从被动响应迈向主动执行。LLM驱使智能体以大模型为核心决策引擎,通过“推理—行动—反馈”闭环,实现目标导向的自主任务执行,具备动态决策、持续运行与复杂环境适应能力。其在办公自动化、软件开发、知识工作等场景广泛应用,正成为连接大模型能力与现实任务的关键桥梁,推动智能系统向更高阶形态演进。

206 5
|
2月前
|
JSON 人工智能 API
|

从对话到Agent:大模型工具调用能力的量化评测

大模型向Agent进化,工具调用是关键。本文介绍EvalScope评测框架,通过双重验证机制,量化评估模型“会不会用、能不能用好”工具,助力开发者打造可靠AI应用。

299 4
|
2月前
|
人工智能 安全 搜索推荐
|

你的错题本里藏着金矿,但你却只把它当成了回收站——用AI给大脑做一次深度Debug

把学习比作软件开发,错题就是Bug。大多数人只改答案(打补丁),却忽略了底层的逻辑漏洞。本文分享一套"错题分析AI指令",利用Root Cause Analysis(根因分析)思维,帮助你用AI深度Debug大脑,将每一个错误转化为认知的核心资产。

244 2
|
2月前
|
机器学习/深度学习 存储 人工智能
|

国内首个全国产化千亿参数细粒度 MoE:开源!

TeleChat3-105B-A4.7-Thinking,国内首个全国产化千亿参数细粒度MoE大模型,开源!代码、数学、Agent等多能力比肩头部,支持高效任务拆解与代码生成。

246 2
|
2月前
|
编解码 物联网 测试技术
|

FLUX.2-Klein 4B/9B开源:亚秒级统一图像生成与编辑

Black Forest Labs开源FLUX.2 [klein]模型家族,兼具文生图、图像编辑与多参考生成能力,端到端推理低至0.5秒,4B版本仅需13GB显存,支持消费级GPU高效运行,量化后速度提升最高2.7倍,Apache 2.0许可商用友好。

1454 1
|
2月前
|
机器学习/深度学习 安全 测试技术
|

美团 LongCat-Flash-Thinking-2601 发布,工具调用能力登顶开源 SOTA!

美团LongCat团队发布并开源LongCat-Flash-Thinking-2601,升级支持“重思考模式”,在智能体搜索、工具调用等任务中达开源SOTA。具备强泛化与抗噪能力,支持在线免费体验,助力开发者高效落地复杂应用场景。

293 1
|
2月前
|
API 语音技术
|

阶跃星辰原生语音推理模型登顶全球权威语音模型榜!开源!

阶跃星辰开源语音推理模型Step-Audio-R1.1登顶全球权威榜单,以96.4%准确率超越Grok、Gemini等,支持“边说边思考”,实现高智能实时交互,现已开放体验。

226 1
|
2月前
|
并行计算 监控 安全
|

高效 GPU 加速:DeepSeek-R1 系列模型在 llama.cpp 上的生产级部署指南

本文详解如何在RTX 30/40系显卡上,通过llama.cpp高效部署DeepSeek-R1-8B模型。涵盖CUDA镜像选择、GPU卸载调优、显存控制与高可用架构,结合Docker、Prometheus监控及负载均衡,实现低延迟、高吞吐的生产级推理,助力大模型落地应用。

643 6
|
2月前
|
人工智能 机器人 程序员
|

去年我用一张Excel表"规划"学习,结果把自己逼进了ICU——直到我学会让AI帮我排兵布阵

本文以作者因"完美计划表"累倒入院的亲身经历切入,分享了一套让AI担任私人学习规划师的完整指令模板。通过"目标拆解""遗忘曲线复习""弹性时间"三大机制,解决目标模糊、复习逃避、计划崩溃等常见学习痛点,并提供上班族、学生、转行者三种典型场景的实战案例。

366 18
|
2月前
|
安全 测试技术 API
|

MiniMax 开源新评测集:定义Coding Agent 的生产级标准

Coding Agent常因“过程违规”遭诟病,如无视指令、破坏规范。MiniMax推出OctoCodingBench,首创面向工程可靠性的过程评估体系,揭示当前模型在多规则协同下成功率极低,呼吁行业关注“过程正确性”,推动Agent从能用走向可用。

431 5
|
2月前
|
人工智能 自然语言处理 PyTorch
|

构建AI智能体:九十四、Hugging Face 与 Transformers 完全指南:解锁现代 NLP 的强大力量

Hugging Face 是领先的自然语言处理开源平台,提供 Transformers 等核心库,支持数千种预训练模型,涵盖文本分类、生成、问答等任务。其 Pipeline 工具简化了模型调用,AutoClass 实现架构自动识别,助力开发者高效构建 AI 应用。

667 10
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
|

AgentCPM-Explore开源,4B 参数突破端侧智能体模型性能壁垒

清华、人大、面壁智能与OpenBMB联合推出4B参数智能体模型AgentCPM-Explore,在8大长程任务上实现同尺寸SOTA,性能比肩30B+大模型。支持百轮稳定交互、全流程开源,重塑端侧AI潜能。

354 7
|
2月前
|
人工智能 定位技术
|

不读完这3000篇文献就没法写论文?你的"穷举法"正在拖垮你的科研生涯

针对科研人员面临的"文献海量增长"困境,本文提出了一种基于系统性综述方法论的AI指令方案。通过"认知跃迁"和"三种实战模式",帮助研究者从机械阅读转向精密过滤,利用AI构建高质量的学术综述框架。

207 8
|
2月前
|
人工智能 JavaScript 搜索推荐
|

AI Agent MCP 源代码部署Deployment 获得子域名Live URL的0-1教程

本文介绍如何将AI Agent或MCP服务部署上线,获取免费二级域名(如*.aiagenta2z.com),并在ChatGPT、Claude等客户端中直接使用。涵盖代码准备、入口命令配置、GitHub部署及调试全流程,支持Python/Node.js项目,助力开发者快速实现服务托管与集成。

289 2
|
2月前
|
运维 安全 API
|

内网系统IP离线数据库搭建与维护完整方案

本方案面向无外网内网环境,提供IP离线数据库全生命周期部署指南,涵盖规划、搭建、维护与应急,支持内网IP自定义映射、高并发查询与安全合规,实现数据自主可控、运维闭环,适配多规模企业架构。

235 1
|
2月前
|
监控 搜索推荐 物联网
|

一文读懂LoRA微调原理:大模型高效适配的核心逻辑

通过冻结大模型参数、仅训练少量低秩矩阵,实现高效微调:成本低、周期短、不破坏通用能力。适配医疗、金融等垂直场景,支持多任务复用与边缘部署,成为大模型落地首选技术。

680 9
|
2月前
|
人工智能 数据可视化 物联网
|

《显卡 4090 就能跑!小白也能炼出私有大模型》

大模型微调是AI落地的关键技术,通过定向训练让通用模型在特定领域“从会到精”。本文详解微调原理、LoRA/QLoRA等高效方法,并提供评估与实操建议,助力新手快速上手,实现低成本、高精度的模型定制。

406 4
|
2月前
|
自然语言处理 物联网 计算机视觉
|

从 Image-to-LoRA 到 In-Context Edit

阿里发布Qwen-Image-Edit-2511-ICEdit-LoRA模型,通过上下文内编辑技术,利用“编辑前后图像对”实现图像编辑能力迁移。该模型仅需少量样本即可训练,支持风格、光照、表情等复杂编辑,并可拓展至图像分割等视觉任务,未来将持续优化与应用探索。

435 6
|
2月前
|
人工智能 自然语言处理 数据挖掘
|

Qwen3-VL-Embedding & Qwen3-VL-Reranker:统一多模态表征与排序

通义千问Qwen团队于2025年1月8日推出多模态模型新成员:Qwen3-VL-Embedding与Qwen3-VL-Reranker,基于Qwen3-VL构建,支持文本、图像、视频等多模态统一表示与跨模态检索,在图文匹配、视觉问答等任务中表现卓越,具备高精度、多语言、易集成等优势,助力全球开发者构建高效多模态应用。

1589 4
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
|

构建AI智能体:九十、图解大模型核心三大件 — 输入编码、注意力机制与前馈网络层

本文深入解析了大模型三大核心技术:输入编码、多头自注意力机制和前馈网络层,从应用视角阐述了它们的工作原理和协同效应。输入编码负责将文本转换为富含语义和位置信息的数学表示;多头自注意力机制通过多专家团队模式建立全局依赖关系,解决长距离依赖问题;前馈网络层则通过非线性变换进行深度语义消歧。文章通过可视化示例展示了词向量的语义关系建模、注意力权重的分布模式以及前馈网络的语义过滤功能,形象地说明了大模型如何通过这三层架构实现"广泛联系-深度加工"的认知过程。

188 5
|
2月前
|
数据采集 自然语言处理 算法
|

重塑虚实边界:智元机器人发布首个大语言模型驱动的开源仿真平台Genie Sim 3.0

智元机器人发布全球首个大语言模型驱动的开源仿真平台Genie Sim 3.0,基于NVIDIA Isaac Sim,实现高保真数字孪生环境,支持自然语言生成万级场景,分钟级构建与泛化。平台开源上万小时真实机器人作业数据集,覆盖200+任务,构建10万+场景评估体系,推动具身智能从研发到落地的全链路创新,助力开发者零硬件部署、高效训练与评测。

286 4
|
2月前
|
数据可视化 定位技术 开发工具
|

榜单不盲从:用 EvalScope 打造你的专属场景评测

本文介绍如何通过EvalScope构建自定义评测指数,突破通用榜单局限,结合业务需求定义权重,实现模型在真实场景中的价值评估,助力选出真正适配业务的“最佳模型”。

425 6
|
2月前
|
机器学习/深度学习 测试技术 数据中心
|

九坤量化开源IQuest-Coder-V1,代码大模型进入“流式”训练时代

2026年首日,九坤创始团队成立的至知创新研究院开源IQuest-Coder-V1系列代码大模型,涵盖7B至40B参数,支持128K上下文与GQA架构,提供Base、Instruct、Thinking及Loop版本。采用创新Code-Flow训练范式,模拟代码演化全过程,提升复杂任务推理能力,在SWE-Bench、LiveCodeBench等基准领先。全阶段checkpoint开放,支持本地部署与微调,助力研究与应用落地。

1014 2
|
2月前
|
人工智能 自然语言处理 运维
|

业内首发泛娱乐底座大模型!元象开源XVERSE-Ent中英双模型,单卡部署超低门槛

元象开源首款聚焦泛娱乐场景的大模型XVERSE-Ent,含中英双版本,专精角色一致性、长剧情理解与多元语境适配,支持轻量化部署,助力开发者低成本打造AI社交、游戏与创意内容应用。

247 3
|
2月前
|
供应链 安全 区块链
|

生态协同发力!DAN仲裁网络筑牢Web3商业闭环,让信任贯穿交易全流程

OmniPact DAN仲裁网络重构Web3信任体系,打破争议解决孤岛,首创与跨链、零知识证明、SBT声誉系统深度协同的生态闭环。实现多链资产自动赔付、隐私保护下证据验证、信誉可沉淀变现,让信任贯穿交易全流程,推动Web3商业迈向无摩擦、高可信的全球协作新时代。(238字)

160 7
|
3月前
|
Java 调度
|

什么是分片广播任务

本文介绍XXL-JOB的分片广播机制,通过集群执行器动态分片处理任务。调度中心为每个执行器分配分片参数,实现任务并行处理,提升效率。适用于大数据量分布式场景,支持动态扩容,每台机器处理部分数据,显著降低耗时。开发时可通过`getShardIndex()`和`getShardTotal()`获取分片信息,灵活控制业务逻辑。

225 3

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉答疑群:44837352

0
今日
15156
内容
6
活动
4044
关注
你好!
登录掌握更多精彩内容

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 智能语音交互