开发者社区> ModelScope模型即服务> 自然语言处理

自然语言处理

关注

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

0
今日
2730
内容
0
活动
403
关注
|
19天前
|
机器学习/深度学习 人工智能 算法
|

小米7B参数推理大模型首次开源!Xiaomi MiMo:数学代码双杀,超越32B巨头

小米开源的MiMo推理大模型通过联动预训练与强化学习算法,在7B参数规模下实现数学推理与代码生成能力的突破性提升,技术报告显示其性能超越部分32B级模型。

361 74
|
19天前
|
机器学习/深度学习 人工智能 API
|

阿里通义开源新一代混合推理模型 Qwen3:创新双模式推理,支持"思考模式"和"非思考模式"

Qwen3是阿里巴巴推出的新一代大型语言模型,支持119种语言和两种推理模式,采用四阶段训练流程和Apache 2.0协议开源,提供从0.6B到235B的多种模型配置。

242 19
|
19天前
|
机器学习/深度学习 人工智能 JSON
|

这个AI把arXiv变成代码工厂,快速复现顶会算法!Paper2Code:AI论文自动转代码神器,多智能体框架颠覆科研复现

Paper2Code是由韩国科学技术院与DeepAuto.ai联合开发的多智能体框架,通过规划、分析和代码生成三阶段流程,将机器学习论文自动转化为可执行代码仓库,显著提升科研复现效率。

161 18
|
24天前
|
人工智能 自然语言处理 监控
|

Cooragent:清华 LeapLab 开源 AI Agent 协作框架,一句话召唤AI军团!

Cooragent 是清华大学 LeapLab 团队推出的开源 AI Agent 协作框架,支持基于简单描述快速创建 Agent 并实现多 Agent 协作,具备 Prompt-Free 设计和本地部署能力。

206 6
|
24天前
|
人工智能 自然语言处理 监控
|

LongPort MCP:证券业首个券商MCP,AI赋能智能投资新时代,散户也能玩转机构级交易

LongPort MCP是长桥集团推出的证券行业首个券商模型上下文协议,通过标准化接口实现AI与金融服务的无缝对接,支持自然语言交互的智能投资服务。

258 8
|
26天前
|
人工智能 自然语言处理 数据可视化
|

让AI单次生成4万字!WriteHERE:开源AI长文写作框架,单次生成超长文本,小说报告一键搞定!

WriteHERE是基于异质递归规划技术的开源AI写作框架,能动态分解写作任务并管理任务依赖关系,支持单次生成超过4万字的专业报告。

105 2
|
26天前
|
人工智能 缓存 自然语言处理
|

全球首款开源通用型AI智能体上线!Suna:自动处理Excel/爬数据/写报告等复杂任务一句话搞定

Suna是由Kortix推出的开源通用型AI智能体项目,通过自然语言交互实现浏览器自动化、文件管理、数据分析等复杂任务处理,支持自托管部署,为研究分析和日常工作提供智能辅助。

307 1
|
26天前
|
人工智能 自然语言处理 知识图谱
|

Yuxi-Know:开源智能问答系统,基于大模型RAG与知识图谱技术快速构建知识库

Yuxi-Know是一个结合大模型RAG知识库与知识图谱技术的智能问答平台,支持多格式文档处理和复杂知识关系查询,具备多模型适配和智能体拓展能力。

150 0
|
26天前
|
人工智能 自然语言处理 运维
|

让AI读懂K线图!ChatTS-14B:字节开源的时间序列理解和推理大模型,自然语言提问秒解趋势密码!

ChatTS-14B是字节跳动开源的时间序列专用大模型,基于Qwen2.5-14B微调优化,通过合成数据对齐技术显著提升分析能力,支持自然语言交互完成预测推理等复杂任务。

113 1
|
26天前
|
机器学习/深度学习 人工智能 自然语言处理
|

还在想开题报告?SurveyGO卷姬:清华开源学术论文AI写作神器,一键生成文献综述

SurveyGO是清华与面壁智能联合开源的AI论文写作工具,采用LLMxMapReduce-V2技术实现文献智能聚合,能根据用户输入主题快速生成结构严谨、引用可靠的学术综述。

264 1
|
26天前
|
人工智能 搜索推荐
|

「社会实验室」成真!SocioVerse:复旦联合小红书开源社会模拟世界模型,用AI预演群体行为

SocioVerse是由复旦大学联合小红书等机构开源的社会模拟框架,基于大语言模型和千万级真实用户数据构建,能精准模拟群体行为并预测社会事件演化趋势。

117 2
|
26天前
|
人工智能 IDE API
|

白板秒变IDE,草图直接生成可运行代码!Pad.ws:白板+代码编辑器深度结合,创意到实现无缝衔接

Pad.ws是一款创新的在线开发环境,将交互式白板与完整IDE工具深度结合,支持多人实时协作和多种编程语言,无需安装即可通过浏览器访问。

72 1
|
28天前
|
机器学习/深度学习 人工智能 缓存
|

谷歌开源量化模型 Gemma 3 QAT:显存需求直降75%,消费级GPU轻松跑大模型!

Gemma 3 QAT是谷歌最新推出的量化优化开源模型,通过量化感知训练技术显著降低显存需求,同时保持高性能,使大模型能在消费级硬件上高效运行。

170 21
|
29天前
|
人工智能 API 开发者
|

FastAPI开发者福音!FastAPI-MCP:将FastAPI秒变MCP服务器的开源神器,无需配置自动转换!

FastAPI-MCP是一款能将FastAPI应用端点自动转换为符合模型上下文协议(MCP)的开源工具,支持零配置自动发现接口并保留完整文档和模式定义。

713 71
|
29天前
|
机器学习/深度学习 算法 NoSQL
|

记录转大模型—InitCommit

嗯,写点东西记录一下转大模型的经历。

73 14
|
1月前
|
人工智能 自然语言处理 监控
|

基于DeepSeek R1改进的AI安全模型!MAI-DS-R1:微软开源AI安全卫士,敏感话题响应率高达99.3%

微软开源的MAI-DS-R1是基于DeepSeek R1改进的AI模型,通过后训练优化将敏感话题响应率提升至99.3%,同时将有害内容风险降低50%,保持原版推理能力并增强多语言支持。

198 3
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
|

这个AI模型证明数学定理比人类快10倍!Kimina-Prover:月之暗面联合Numina推出数学定理证明黑科技

Kimina-Prover是由月之暗面与Numina团队合作开发的大型数学定理证明模型,采用强化学习训练,在Lean 4语言中严谨证明数学定理,在miniF2F基准测试中创下80.7%的新高成绩。

64 1
|
1月前
|
人工智能 JSON 自然语言处理
|

让AI听懂你的建模需求!BlenderMCP:自然语言指令直接操控 Blender,一句话生成复杂3D场景

BlenderMCP通过MCP协议实现Blender与Claude AI的无缝集成,支持通过自然语言指令完成3D建模、材质调整等复杂操作,显著提升创作效率。

114 0
|
1月前
|
人工智能 自然语言处理 测试技术
|

自然语言生成代码一键搞定!Codex CLI:OpenAI开源终端AI编程助手,代码重构+测试全自动

Codex CLI是OpenAI推出的轻量级AI编程智能体,基于自然语言指令帮助开发者高效生成代码、执行文件操作和进行版本控制,支持代码生成、重构、测试及数据库迁移等功能。

154 0
|
1月前
|
人工智能 自然语言处理 JavaScript
|

测试工程师要失业?Magnitude:开源AI Agent驱动的端到端测试框架,让Web测试更智能,自动完善测试用例!

Magnitude是一个基于视觉AI代理的开源端到端测试框架,通过自然语言构建测试用例,结合推理代理和视觉代理实现智能化的Web应用测试,支持本地运行和CI/CD集成。

229 15
|
1月前
|
机器学习/深度学习 人工智能 前端开发
|

GLM-4-32B:智谱开源新一代基座模型,代码生成与推理能力全面升级

GLM-4-32B是智谱公司推出的320亿参数开源基座模型,基于15T高质量数据训练,在代码生成、逻辑推理和多模态处理方面表现优异,支持多种编程语言实时交互。

96 13
|
1月前
|
机器学习/深度学习 人工智能 算法
|

医学AI推理新突破!MedReason:这个AI把医学论文变「会诊专家」,8B模型登顶临床问答基准

MedReason是由多国顶尖学术机构联合开发的医学推理框架,通过知识图谱增强大模型在医疗领域的逻辑推理能力,其8B参数模型在复杂临床场景中达到最先进水平。

160 18
|
1月前
|
机器学习/深度学习 人工智能 Python
|

32B参数碾压千亿模型?GLM-Z1-32B:智谱开源新一代推理模型,数学代码逻辑全制霸

GLM-Z1-32B是智谱开源的32B参数推理模型,基于GLM-4-32B深度优化,在数学、代码和逻辑任务上表现卓越,推理速度高达200 tokens/s,支持轻量化部署和商用场景。

116 12
|
1月前
|
机器学习/深度学习 人工智能 算法
|

GPT-4.5 竟成小丑!OpenAI 推出 GPT-4.1:百万级上下文多模态语言模型,性价比远超 GPT-4o mini

OpenAI最新发布的GPT-4.1系列语言模型通过混合专家架构与上下文优化,实现百万级token处理能力,在编码任务中准确率提升21.4%,推理成本降低83%,支持多模态内容理解与低延迟响应。

120 27
|
1月前
|
人工智能 数据可视化 数据挖掘
|

AI竟能独立完成顶会论文!The AI Scientist-v2:开源端到端AI自主科研系统,自动探索科学假设生成论文

The AI Scientist-v2 是由 Sakana AI 等机构开发的端到端自主科研系统,通过树搜索算法与视觉语言模型反馈实现科学假设生成、实验执行及论文撰写全流程自动化,其生成论文已通过国际顶会同行评审。

124 34
|
1月前
|
人工智能 开发框架 决策智能
|

谷歌开源多智能体开发框架 Agent Development Kit:百行代码构建复杂AI代理,覆盖整个开发周期!

谷歌开源的Agent Development Kit(ADK)是首个代码优先的Python工具包,通过多智能体架构和灵活编排系统,支持开发者在百行代码内构建复杂AI代理,提供预置工具库与动态工作流定义能力。

208 3
|
1月前
|
机器学习/深度学习 人工智能 算法
|

超越 DeepSeek-R1!Seed-Thinking-v1.5:字节跳动开源MoE架构推理模型,200B总参数仅激活20B,推理效率提升5倍

字节跳动推出的200B参数混合专家模型,在AIME/Codeforces/GPQA等基准测试中实现多项突破,采用强化学习框架与流式推理系统,支持7大领域复杂推理任务。

154 13
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
|

32B模型性能直逼671B的DeepSeek-R1!Skywork-OR1:昆仑万维开源推理模型,突破数学与代码双极限

Skywork-OR1系列模型通过强化学习框架与多阶段训练策略,在数学推理与代码生成领域实现突破性进展,其7B参数版本在AIME数学数据集上超越同规模模型,32B版本性能接近671B参数竞品。

168 10
|
1月前
|
人工智能 开发框架 安全
|

AgentPrune:开源多智能体通信优化框架,无缝兼容AutoGen,让对话成本直降95%!

同济大学与香港中文大学联合研发的AgentPrune框架,通过时空图建模与低秩稀疏剪枝技术,显著优化多智能体系统的通信效率。该框架在保持性能的同时减少72.8%的通信量,并具备防御对抗攻击能力。

80 7
|
1月前
|
人工智能 自然语言处理 数据处理
|

还在手动验证文献引用?ScholarCopilot:开源AI学术写作工具,生成时实时插入文献引用

基于 Qwen-2.5-7B 模型的 ScholarCopilot 通过动态检索标记和联合优化技术,实现学术文本生成与文献引用的精准匹配,在 50 万篇论文库中实现 40.1% 的检索准确率,生成文本的学术严谨性评分达 16.2/25。

99 5
|
1月前
|
人工智能 搜索推荐 开发者
|

GPT-4o测评准确率竟不到1%!BrowseComp:OpenAI开源AI代理评测新基准,1266道高难度网络检索问题

OpenAI最新开源的BrowseComp基准包含1266个高难度网络检索问题,覆盖影视、科技、艺术等九大领域,其最新Deep Research模型以51.5%准确率展现复杂信息整合能力,为AI代理的浏览能力评估建立新标准。

101 4
|
1月前
|
数据采集 人工智能 Java
|

1天消化完Spring全家桶文档!DevDocs:一键深度解析开发文档,自动发现子URL并建立图谱

DevDocs是一款基于智能爬虫技术的开源工具,支持1-5层深度网站结构解析,能将技术文档处理时间从数周缩短至几小时,并提供Markdown/JSON格式输出与AI工具无缝集成。

105 1
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
|

用AI精准定位问题代码,调试时间直接砍半!LocAgent:斯坦福开源代码调试神器,多跳推理锁定问题代码

LocAgent是由斯坦福大学、耶鲁大学等顶尖机构联合开发的代码定位框架,通过将代码库转化为图结构并利用大语言模型的多跳推理能力,实现精准的问题代码定位。

130 1
|
1月前
|
人工智能 自然语言处理 Rust
|

【内附榜单】评估AI大模型的代码修复能力!Multi-SWE-bench:字节开源代码修复能力评估基准,覆盖7大主流编程语言

Multi-SWE-bench是首个覆盖Python外7种主流编程语言的代码修复基准,包含1632个真实GitHub问题样本,通过严格筛选与人工验证确保数据质量。

82 0
|
1月前
|
机器学习/深度学习 人工智能 决策智能
|

推理速度开挂!谷歌推出 Gemini 2.5 Flash:在保持Gemini 2.5精度的同时,延迟降低到竞品的1/3

谷歌最新推出的Gemini 2.5 Flash AI模型在保持低延迟和成本效益的同时,通过引入思考能力为开发者解锁了智能代理构建、代码辅助等新应用场景。

121 1
|
1月前
|
机器学习/深度学习 人工智能 文件存储
|

Llama Nemotron:英伟达开源基于Llama架构优化的推理模型,253B参数持平DeepSeek R1!

NVIDIA推出的Llama Nemotron系列推理模型,基于Llama架构优化,包含Nano/Super/Ultra三款,在数学推理、编程和工具调用等任务中展现卓越性能。

75 5
|
1月前
|
人工智能 自然语言处理 测试技术
|

能够双向推理的LLM!Dream-7B:港大联合华为开源的扩散推理模型,能够同时考虑前后文信息

Dream-7B是由香港大学与华为诺亚方舟实验室联合研发的开源扩散大语言模型,采用独特的掩码扩散范式,在文本生成、数学推理和代码编写等任务中展现出卓越性能。

112 3
|
1月前
|
机器学习/深度学习 人工智能 IDE
|

14B小模型代码成绩紧逼O3-Mini!DeepCoder-14B-Preview:基于Deepseek-R1蒸馏优化的开源代码生成模型

DeepCoder-14B-Preview是基于Deepseek-R1蒸馏优化的140亿参数模型,通过强化学习微调在LiveCodeBench达到60.6%准确率,开源训练数据与系统优化方案。

167 3
|
1月前
|
数据采集 人工智能 安全
|

32.7K Star!Awesome MCP Servers:开源MCP资源聚合平台,覆盖20+垂直领域

Awesome MCP Servers 是一个开源项目,汇集了3000多个基于Model Context Protocol的服务器实现,支持本地和云端部署,为AI大模型提供丰富的外部数据访问和工具调用能力。

426 2
|
1月前
|
人工智能 自然语言处理 算法
|

科研论文翻译神器!BabelDOC:开源AI工具让PDF论文秒变双语对照,公式图表全保留

BabelDOC 是一款专为科学论文设计的开源AI翻译工具,采用先进的无损解析技术和智能布局识别算法,能完美保留原文格式并生成双语对照翻译。

900 67
|
1月前
|
机器学习/深度学习 数据采集 人工智能
|

清华联合DeepSeek推出奖励模型新标杆!DeepSeek-GRM:让AI学会自我批评,推理性能越跑越强

DeepSeek-GRM是由DeepSeek与清华大学联合研发的通用奖励模型,采用点式生成式奖励建模和自我原则点评调优技术,显著提升了模型质量和推理扩展性。

197 13
|
1月前
|
人工智能 测试技术 API
|

PaperBench:OpenAI开源AI智能体评测基准,8316节点精准考核复现能力

PaperBench是OpenAI推出的开源评测框架,通过8316个评分节点系统评估AI智能体复现学术论文的能力,涵盖理论理解、代码实现到实验执行全流程。

124 30
|
1月前
|
机器学习/深度学习 人工智能 前端开发
|

SWEET-RL:8B小模型暴打GPT-4?Meta开源强化学习黑科技,多轮任务成功率飙升6%

Meta最新开源的SWEET-RL框架通过优化多轮交互任务的信用分配机制,使Llama-3.1-8B模型在协作推理任务中的表现提升6%,性能达到顶尖大模型水平。

121 33
|
1月前
|
人工智能 自然语言处理 前端开发
|

DeepSite:基于DeepSeek的开源AI前端开发神器,一键生成游戏/网页代码

DeepSite是基于DeepSeek-V3模型的在线开发工具,无需配置环境即可通过自然语言描述快速生成游戏、网页和应用代码,并支持实时预览效果,显著降低开发门槛。

417 93
|
1月前
|
人工智能 安全 虚拟化
|

Cua:Mac用户狂喜!这个开源框架让AI直接接管你的电脑,快速实现AI自动化办公

Cua是一个结合高性能虚拟化与AI代理能力的开源框架,能在Apple Silicon上以接近原生性能运行虚拟机,并让AI直接操作系统应用。

195 17
|
1月前
|
人工智能 自然语言处理 API
|

AutoAgent:无需编程!接入DeepSeek用自然语言创建和部署AI智能体!港大开源框架让AI智能体开发变成填空题

香港大学推出的AutoAgent框架通过自然语言交互实现零代码创建AI智能体,支持多模型接入与自动化工作流编排,在GAIA基准测试中表现优异。

215 16
|
1月前
|
机器学习/深度学习 存储 人工智能
|

Qlib:华尔街颤抖!微软开源金融AI量化投资神器,助力智能投研

Qlib是微软亚洲研究院推出的开源AI量化投资平台,提供从数据处理、模型训练到组合管理的全流程支持,内置高性能数据基础设施和多种机器学习模型。

311 19
|
1月前
|
机器学习/深度学习 人工智能 数据可视化
|

智谱AI新突破!GLM-Z1-Rumination:新一代沉思模型,推动AI助手进入"高智商+高自主"的新阶段

GLM-Z1-Rumination是智谱推出的新一代沉思模型,通过扩展强化学习训练实现长程推理能力,支持动态工具调用与自我验证机制,显著提升AI自主研究能力。

171 13
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
|

FinGPT:华尔街颤抖!用股价训练AI,开源金融大模型预测股价准确率碾压分析师,量化交易新利器

FinGPT是基于Transformer架构的开源金融大模型,通过RLHF技术和实时数据处理能力,支持情感分析、市场预测等核心功能,其LoRA微调技术大幅降低训练成本。

148 12
|
1月前
|
人工智能 API
|

智谱推出深度思考模型 GLM-Z1-Air:推理速度相较DeepSeek-R1提升8倍,成本降低至1/30

GLM-Z1-Air是智谱公司基于GLM-4-Air-0414开发的深度思考模型,通过推理数据增强和对齐优化,在数理推理性能上达到顶尖水平,同时大幅提升推理效率并降低运行成本。

151 19
我要发布