开发者社区> ModelScope模型即服务> 自然语言处理

自然语言处理

关注

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

0
今日
2744
内容
0
活动
429
关注
|
2月前
|
人工智能 Linux API
|

[大模型实战 01] 本地大模型初体验:Ollama 部署与 Python 调用指南

大模型实战系列第一篇。拒绝晦涩理论,直接上手!我会带着各位友人们零基础安装 Ollama,利用国内 ModelScope 极速下载模型,详解服务端口配置与 Python 脚本调用,涵盖显存计算与常见避坑指南。

4656 3
|
2月前
|
人工智能 缓存 Java
|

[大模型实战 03预备] 云端炼丹房 1:Google Colab 上手指南

本文教你用免费Google Colab(Tesla T4 GPU)解决本地显存不足、无法运行7B+大模型的痛点;通过挂载Google Drive持久化保存模型,避免运行时重置丢失;手把手配置云端环境,为后续RAG实战打下坚实基础。(239字)

663 6
|
2月前
|
人工智能 数据可视化 物联网
|

[大模型实战 06] 我的模型我做主:在 Kaggle 上用 Unsloth 极速微调 Qwen3

本文介绍如何用Unsloth+QLoRA高效微调Qwen3-4B模型,仅需Kaggle免费T4显卡,速度提升2–5倍、显存节省60%;三步实现“灵魂认主”,让模型自认“AlgiebaLLM AI”,全程代码简洁,零基础可上手。

796 7
|
3月前
|
人工智能 自然语言处理 C++
|

写小说时,Claude 4.0 和 4.5 的差别在哪里?

本文对比Claude Sonnet 4.0与4.5在小说创作中的实际表现,聚焦人物一致性、剧情连续性与长期可控性。基于Anthropic官方能力说明及多轮实测,指出4.5在多阶段续写、逻辑连贯性与风格稳定性上显著提升,更适配中长篇连载场景,助力AI写作从“能写”迈向“能长期写”。(239字)

1068 9
|
5月前
|
存储 数据采集 人工智能
|

最佳实践丨让苏东坡“复活”!我用Qwen3-8B实现了与千古文豪的跨时空对话

随着人工智能技术的不断发展,虚拟角色不再只是冰冷的对话机器,而是能够承载历史人物的气质、知识体系乃至精神风貌的“数字化身”。今天,我们将完整揭秘如何基于Qwen3-8B大模型,借助LLaMA-Factory Online平台,打造一个沉浸式的“苏东坡数字分身”,让前沿技术为文化传承注入新的活力。

1036 10
|
12月前
|
机器学习/深度学习 人工智能 算法
|

小米7B参数推理大模型首次开源!Xiaomi MiMo:数学代码双杀,超越32B巨头

小米开源的MiMo推理大模型通过联动预训练与强化学习算法,在7B参数规模下实现数学推理与代码生成能力的突破性提升,技术报告显示其性能超越部分32B级模型。

1751 74
|
2月前
|
机器学习/深度学习 存储 人工智能
|

[大模型实战 03] 拆解 Transformers:从原理图解到 HuggingFace Transformers 实战

本文图解Transformer核心原理(注意力机制+位置编码),在Kaggle双T4 GPU环境下实战拆解Hugging Face“铁三角”(Config/Tokenizer/Model),并详解Temperature与Top_p两大生成调控参数,助你真正理解并掌控大模型推理。

858 12
|
16天前
|
人工智能 自然语言处理 测试技术
|

【开源】IntentOrch:意图驱动的MCP编排引擎 - 自然语言描述需求,AI自动编排MCP工具链执行

IntentOrch 是开源的意图驱动MCP编排引擎,让开发者用自然语言表达“要什么”,自动完成工具选择、流程规划与执行。支持多AI/多Server,5分钟上手,大幅提升MCP开发效率。

258 8
|
12月前
|
机器学习/深度学习 人工智能 JSON
|

这个AI把arXiv变成代码工厂,快速复现顶会算法!Paper2Code:AI论文自动转代码神器,多智能体框架颠覆科研复现

Paper2Code是由韩国科学技术院与DeepAuto.ai联合开发的多智能体框架,通过规划、分析和代码生成三阶段流程,将机器学习论文自动转化为可执行代码仓库,显著提升科研复现效率。

1617 19
|
2月前
|
JSON 人工智能 自然语言处理
|

[大模型实战 05] 大模型实战的杀手锏: 模型微调

本文通过Kaggle实操对比Base与Instruct模型,图解大模型预训练→指令微调→人类对齐三阶段演进,并厘清Prompt工程、RAG(注知识)与微调(塑性格)的技术边界与选型策略,助你科学决策模型优化路径。

416 5
|
10月前
|
机器学习/深度学习 自然语言处理 安全
|

ACL 2025 | GALLa:用图结构增强代码大模型,让代码理解更精准!

通过级联多模态架构将代码结构图对齐到大模型表征中

776 69
|
6月前
|
数据挖掘 数据库 供应链
|

数据分析模型

279 0
|
5月前
|
异构计算 并行计算 Python
|

本地部署Qwen3-4B 模型,无法调用GPU

321 0
|
5月前
|
人工智能 前端开发 关系型数据库
|

MajorRAG 概述(1/3)

一个RAG项目,全文共三个部分:MajorRAG概述、MajorRAG文件内容提取实现分析、MajorRAG聊天问答系统实现分析。 1)第一次做RAG,欢迎带着指导意见评论 2)希望指出不足时可以附带替换方法

273 1
|
3月前
|
JSON 人工智能 自然语言处理
|

基于Qwen-3B-Raw的本地化SD Prompt生成器研究

本项目用NLP技术把人类的模糊美学意图,蒸馏成可重复、可微调、可部署的图像生成指令引擎。

309 13
我要发布