自然语言处理-推荐-第2页-阿里云开发者社区-阿里云

开发者社区> ModelScope模型即服务> 自然语言处理

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

今日

2744

内容

活动

427

关注

来自： ModelScope模型即服务

文章

视频

问答

精华

蚝油菜花

11月前

数据采集人工智能 Java

博文

1天消化完Spring全家桶文档！DevDocs：一键深度解析开发文档，自动发现子URL并建立图谱

DevDocs是一款基于智能爬虫技术的开源工具，支持1-5层深度网站结构解析，能将技术文档处理时间从数周缩短至几小时，并提供Markdown/JSON格式输出与AI工具无缝集成。

506 1 1

游客matpicq467xsy

1月前

问答

通义灵码2.7.2版本智能体功能是不是用不了了，为何每次涉及到操作文件的问题都卡在那里不动了

139 0 0

1238188867416902

3月前

问答

vllm部署模型，参数如何指定

511 0 0

蚝油菜花

11月前

人工智能自然语言处理监控

博文

基于DeepSeek R1改进的AI安全模型！MAI-DS-R1：微软开源AI安全卫士，敏感话题响应率高达99.3%

微软开源的MAI-DS-R1是基于DeepSeek R1改进的AI模型，通过后训练优化将敏感话题响应率提升至99.3%，同时将有害内容风险降低50%，保持原版推理能力并增强多语言支持。

1310 3 3

1504110813821446

4月前

Shell

问答

部署funasr-sdk-cpu-0.4.7，无法切换vad为8k模型，提示不存在v2.0.6版本

303 1 0

蚝油菜花

11月前

人工智能自然语言处理前端开发

博文

DeepSite：基于DeepSeek的开源AI前端开发神器，一键生成游戏/网页代码

DeepSite是基于DeepSeek-V3模型的在线开发工具，无需配置环境即可通过自然语言描述快速生成游戏、网页和应用代码，并支持实时预览效果，显著降低开发门槛。

1821 93 93

蚝油菜花

12月前

人工智能程序员 API

博文

Motia：程序员福音！AI智能体三语言混编，零基础秒级部署

Motia 是一款专为软件工程师设计的 AI Agent 开发框架，支持多种编程语言，提供零基础设施部署、模块化设计和内置可观测性功能，帮助开发者快速构建和部署智能体。

1092 15 15

蚝油菜花

12月前

设计模式人工智能 API

博文

Cursor 上线最新 AI 模型 Claude 3.7 Max：200k上下文+200次工具调用！史上最强代码助手硬核上线

Claude 3.7 Max 是 Cursor 推出的最新 AI 模型，支持 200k 上下文窗口和 200 次工具调用，专为复杂代码任务设计，适合硬核开发者和大型项目。

1064 6 6

蚝油菜花

11月前

机器学习/深度学习人工智能文件存储

博文

Llama Nemotron：英伟达开源基于Llama架构优化的推理模型，253B参数持平DeepSeek R1！

NVIDIA推出的Llama Nemotron系列推理模型，基于Llama架构优化，包含Nano/Super/Ultra三款，在数学推理、编程和工具调用等任务中展现卓越性能。

428 5 5

蚝油菜花

12月前

人工智能监控 JavaScript

博文

Crack Coder：在线面试“AI外挂”！编程问题秒出答案，完全绕过屏幕监控，连录屏都抓不到痕迹！

Crack Coder 是一款开源的隐形 AI 辅助工具，专为技术面试设计，支持多种编程语言，提供实时编程问题解决方案，帮助面试者高效解决问题。

731 14 14

robet

4月前

问答

请检查下这个嵌入式模型， Qwen/Qwen3-Embedding-8B

205 0 0

pklim101

8月前

问答

加载Qwen/Qwen-7B-Chat模型报错

308 0 0

蚝油菜花

11月前

人工智能开发框架安全

博文

AgentPrune：开源多智能体通信优化框架，无缝兼容AutoGen，让对话成本直降95%！

同济大学与香港中文大学联合研发的AgentPrune框架，通过时空图建模与低秩稀疏剪枝技术，显著优化多智能体系统的通信效率。该框架在保持性能的同时减少72.8%的通信量，并具备防御对抗攻击能力。

651 7 7

蚝油菜花

11月前

机器学习/深度学习人工智能决策智能

博文

推理速度开挂！谷歌推出 Gemini 2.5 Flash：在保持Gemini 2.5精度的同时，延迟降低到竞品的1/3

谷歌最新推出的Gemini 2.5 Flash AI模型在保持低延迟和成本效益的同时，通过引入思考能力为开发者解锁了智能代理构建、代码辅助等新应用场景。

456 1 1

蚝油菜花

11月前

机器学习/深度学习人工智能数据可视化

博文

智谱AI新突破！GLM-Z1-Rumination：新一代沉思模型，推动AI助手进入"高智商+高自主"的新阶段

GLM-Z1-Rumination是智谱推出的新一代沉思模型，通过扩展强化学习训练实现长程推理能力，支持动态工具调用与自我验证机制，显著提升AI自主研究能力。

507 13 14

蚝油菜花

12月前

人工智能自然语言处理

博文

TxGemma：谷歌DeepMind革命药物研发！270亿参数AI药理学家24小时在线

谷歌推出专为药物研发设计的TxGemma大模型，具备药物特性预测、生物文献筛选、多步推理等核心能力，提供20亿至270亿参数版本，显著提升治疗开发效率。

408 7 7

22r2esrjmupyy

12月前

问答

您好，我在使用ModelScope的训练服务的时候，总是出现这个异常，请问这是什么问题？

254 0 0

robotliu0327_nwhel

4月前

索引 API

问答

embedding模型部署调用出现接口调用不一致

166 0 0

游客obapqouyazly6

5月前

数据挖掘数据库供应链

问答

数据分析模型

230 0 0

nick2599460199

7月前

问答

在ModelScope中，notebook的终端运行一段时间之后自动关闭

207 0 0

kntulkscg2mn4

9月前

Swift 物联网 Shell

问答

请问如何使用ms-swift工具验证模型微调的效果？

373 0 0

蚝油菜花

11月前

机器学习/深度学习人工智能 IDE

博文

14B小模型代码成绩紧逼O3-Mini！DeepCoder-14B-Preview：基于Deepseek-R1蒸馏优化的开源代码生成模型

DeepCoder-14B-Preview是基于Deepseek-R1蒸馏优化的140亿参数模型，通过强化学习微调在LiveCodeBench达到60.6%准确率，开源训练数据与系统优化方案。

546 3 3

游客lztrts5drmmq4

4月前

异构计算并行计算 Python

问答

本地部署Qwen3-4B 模型，无法调用GPU

252 0 0

cryrobot

8月前

问答

funasr微调问题，训练paraformer模型的时候，text的标注文本是否需要加上标点符号

208 0 0

蚝油菜花

11月前

机器学习/深度学习人工智能算法

博文

超越 DeepSeek-R1！Seed-Thinking-v1.5：字节跳动开源MoE架构推理模型，200B总参数仅激活20B，推理效率提升5倍

字节跳动推出的200B参数混合专家模型，在AIME/Codeforces/GPQA等基准测试中实现多项突破，采用强化学习框架与流式推理系统，支持7大领域复杂推理任务。

755 13 13

蚝油菜花

12月前

人工智能边缘计算自然语言处理

博文

DistilQwen2.5-R1：蒸馏黑科技！32B推理能力塞进3B小模型，推理速度狂飙300%

阿里巴巴最新发布的DistilQwen2.5-R1系列模型通过知识蒸馏技术，在保持高性能的同时大幅降低计算资源需求，7B模型性能甚至可媲美32B大模型。

372 11 11

蚝油菜花

12月前

人工智能自然语言处理 PyTorch

博文

Instella：AMD开源30亿参数语言模型！训练效率碾压同级选手

Instella是AMD推出的30亿参数开源语言模型，基于自回归Transformer架构，支持多轮对话、指令跟随和自然语言理解，适用于智能客服、内容创作和教育辅导等多个领域。

269 1 1

蚝油菜花

11月前

机器学习/深度学习人工智能前端开发

博文

SWEET-RL：8B小模型暴打GPT-4？Meta开源强化学习黑科技，多轮任务成功率飙升6%

Meta最新开源的SWEET-RL框架通过优化多轮交互任务的信用分配机制，使Llama-3.1-8B模型在协作推理任务中的表现提升6%，性能达到顶尖大模型水平。

584 33 33

蚝油菜花

12月前

人工智能监控数据可视化

博文

Manus再遭复刻！开源多智能体协作工具，实时查看每个AI员工的"脑回路"

LangManus 是一个基于分层多智能体系统的 AI 自动化框架，支持多种语言模型和工具集成，能够高效完成复杂任务，适用于人力资源、房产决策、旅行规划等多个场景。

1163 0 0

游客vujhlk2thpfvm

3月前

问答

在modelscope-funasr想自己训练一种low resource 该怎么做？

105 0 0

游客y2etiigytptbm

9月前

Java Spring 人工智能

问答

关于MCP在业务场景的使用，如何让大模型懂得业务逻辑，可以按照业务逻辑调用多个tools来完成对话。

405 0 0

pklim101

8月前

编解码

问答

使用modelscope、Qwen1.8B-chat 模型推理时报错编码错误

208 0 0

XiaoPenYou

11月前

机器学习/深度学习算法 NoSQL

博文

记录转大模型—InitCommit

嗯，写点东西记录一下转大模型的经历。

235 14 14

你好！

登录掌握更多精彩内容

账号登录

我的内容

我的收藏

模型库

数据集

创空间

文档

更多版块

计算机视觉语音多模态科学计算

活跃用户

自然语言处理

最新

文章

视频

问答

推荐

精华

1天消化完Spring全家桶文档！DevDocs：一键深度解析开发文档，自动发现子URL并建立图谱

通义灵码2.7.2版本智能体功能是不是用不了了，为何每次涉及到操作文件的问题都卡在那里不动了

vllm部署模型，参数如何指定

基于DeepSeek R1改进的AI安全模型！MAI-DS-R1：微软开源AI安全卫士，敏感话题响应率高达99.3%

部署funasr-sdk-cpu-0.4.7，无法切换vad为8k模型，提示不存在v2.0.6版本

DeepSite：基于DeepSeek的开源AI前端开发神器，一键生成游戏/网页代码

Motia：程序员福音！AI智能体三语言混编，零基础秒级部署

Cursor 上线最新 AI 模型 Claude 3.7 Max：200k上下文+200次工具调用！史上最强代码助手硬核上线

Llama Nemotron：英伟达开源基于Llama架构优化的推理模型，253B参数持平DeepSeek R1！

Crack Coder：在线面试“AI外挂”！编程问题秒出答案，完全绕过屏幕监控，连录屏都抓不到痕迹！

请检查下这个嵌入式模型， Qwen/Qwen3-Embedding-8B

加载Qwen/Qwen-7B-Chat模型报错

AgentPrune：开源多智能体通信优化框架，无缝兼容AutoGen，让对话成本直降95%！

推理速度开挂！谷歌推出 Gemini 2.5 Flash：在保持Gemini 2.5精度的同时，延迟降低到竞品的1/3

智谱AI新突破！GLM-Z1-Rumination：新一代沉思模型，推动AI助手进入"高智商+高自主"的新阶段

TxGemma：谷歌DeepMind革命药物研发！270亿参数AI药理学家24小时在线

您好，我在使用ModelScope的训练服务的时候，总是出现这个异常，请问这是什么问题？

embedding模型部署调用出现接口调用不一致

数据分析模型

在ModelScope中，notebook的终端运行一段时间之后自动关闭

请问如何使用ms-swift工具验证模型微调的效果？

14B小模型代码成绩紧逼O3-Mini！DeepCoder-14B-Preview：基于Deepseek-R1蒸馏优化的开源代码生成模型

本地部署Qwen3-4B 模型，无法调用GPU

funasr微调问题，训练paraformer模型的时候，text的标注文本是否需要加上标点符号

超越 DeepSeek-R1！Seed-Thinking-v1.5：字节跳动开源MoE架构推理模型，200B总参数仅激活20B，推理效率提升5倍

DistilQwen2.5-R1：蒸馏黑科技！32B推理能力塞进3B小模型，推理速度狂飙300%

Instella：AMD开源30亿参数语言模型！训练效率碾压同级选手

SWEET-RL：8B小模型暴打GPT-4？Meta开源强化学习黑科技，多轮任务成功率飙升6%

Manus再遭复刻！开源多智能体协作工具，实时查看每个AI员工的"脑回路"

在modelscope-funasr想自己训练一种low resource 该怎么做？

关于MCP在业务场景的使用，如何让大模型懂得业务逻辑，可以按照业务逻辑调用多个tools来完成对话。

使用modelscope、Qwen1.8B-chat 模型推理时报错编码错误

记录转大模型—InitCommit

活跃用户

相关产品