ModelScope模型即服务-推荐-第4页-阿里云开发者社区

游客ogm6hgopdrgay

|

5月前

|

人工智能自然语言处理 C++

|

博文

写小说时，Claude 4.0 和 4.5 的差别在哪里？

本文对比Claude Sonnet 4.0与4.5在小说创作中的实际表现，聚焦人物一致性、剧情连续性与长期可控性。基于Anthropic官方能力说明及多轮实测，指出4.5在多阶段续写、逻辑连贯性与风格稳定性上显著提升，更适配中长篇连载场景，助力AI写作从“能写”迈向“能长期写”。（239字）

1375 9 10

来自：自然语言处理版块

modelscope

|

6月前

|

人工智能自然语言处理 API

|

博文

MiniMax M2.1开源：多语言编程SOTA，为真实世界复杂任务而生

MiniMax正式开源M2.1模型，全面提升多语言编程、办公自动化与原生App开发能力，支持WebDev、3D渲染、Agent工具链等复杂任务，性能媲美Claude Opus，免费开放体验。

1627 3 3

安全风信子

|

8月前

|

机器学习/深度学习人工智能自然语言处理

|

博文

在大语言模型（LLM）应用中，提示工程已成为提升模型性能和控制输出的关键技术。然而，随着模型能力的增强和应用场景的复杂化，提示文本往往变得冗长，导致token消耗急剧增加。这不仅直接影响到API调用成本，还可能超出模型的上下文窗口限制，特别是在使用GPT-4、Claude 3等大模型时，每1000个token的成本可能高达数美分。对于需要频繁交互或批量处理的应用场景，如客服系统、内容生成平台或自动化工作流，token消耗的优化就显得尤为重要。

1422 0 0

秦水一时了-20385

|

9月前

|

问答

qwen3-32b和qwen-2.5-32b-Instruct有什么区别

2438 1 0

1743526492487791

|

10月前

|

API

|

问答

modelscope显示每天有2000次的API免费额度，在500次的时候，就提示限流了

2139 7 0

大熊计算机

|

12月前

|

人工智能缓存搜索推荐

|

博文

手把手基于ModelScope MCP协议实现AI短视频创作：零代码自动化工作流

本文介绍了基于ModelScope MCP协议的AI视频生成解决方案，涵盖核心机制解析、零代码工作流搭建、性能优化策略及全链路异常处理。通过统一上下文描述符抽象异构AI服务，实现图像生成、语音合成与视频剪辑的自动化编排。结合缓存优化与错误重试机制，大幅提升生成效率（如5分镜视频从91.7s降至22.4s）。最后展示《夏日海滩》生成案例，并探讨个性化风格迁移与商业场景集成等进阶方向，揭示零代码本质为服务、流程与资源的三层抽象。

1717 18 19

百变小樱11111

|

1月前

|

人工智能自然语言处理算法

|

博文

2026年运营岗正在分层：懂AI应用的运营和只会排期的运营差距有多大

2026年运营岗加速分层：一类陷于排期催单，另一类借AI做用户洞察、内容生成、活动复盘与工作流提效。效率、价值与晋升差距显著拉大。真正稀缺的是“AI协作力”——懂Prompt、会搭工作流、能落地RAG/Agent。推荐考取CAIE注册人工智能工程师（Level I），零基础友好、企业认可度高，助运营从执行者跃升为业务增长关键接口人。

318 1 1

贝锐

|

3月前

|

人工智能数据安全/隐私保护

|

博文

五分钟配好向日葵 MCP，让 AI 替你远程安装 OpenClaw！

本文详解向日葵MCP的实战配置与应用：将远程控制能力接入AI，实现“一句话操作另一台电脑”。支持截图查看桌面、自动打开浏览器搜索、远程执行命令等，无需写脚本，配置简单，即刻上手。

1044 13 14

Kevosky

|

5月前

|

存储人工智能安全

|

博文

MySQL 实用语句与工具使用指南

本文系统梳理MySQL开发运维中的核心实用语句与必备工具，涵盖备份恢复、性能分析、索引管理、数据治理等场景，结合Navicat、DataGrip、Prometheus等工具，提升工作效率与系统稳定性。

576 0 0

游客vtcv2hujaeyjs

|

6月前

|

存储缓存安全

|

博文

One Trick Per Day

初始化Map应避免直接指定大小，建议使用Guava的newHashMapWithExpectedSize或手动计算容量。禁止使用Executors创建线程池，易导致OOM，推荐通过ThreadPoolExecutor或Guava方式，明确设置队列与线程数。Arrays.asList返回不可变集合，禁用增删操作。遍历Map优先使用entrySet或JDK8的forEach。SimpleDateFormat非线程安全，避免static共享，可使用ThreadLocal或Java 8新时间API。并发修改记录时，建议采用乐观锁（如version）或加锁机制，冲突概率低时优选乐观锁且重试不少于3次。

499 0 0

游客ak35f7cs4gw4c

|

7月前

|

Apache 自然语言处理

|

问答

通过ollama 编写modelfile的形式创建翻译模型，输出全是思考，老是超限，翻译不出来。

483 0 0

来自：多模态版块

modelscope

|

9月前

|

机器学习/深度学习人工智能自然语言处理

|

博文

B站开源IndexTTS2，用极致表现力颠覆听觉体验

在语音合成技术不断演进的背景下，早期版本的IndexTTS虽然在多场景应用中展现出良好的表现，但在情感表达的细腻度与时长控制的精准性方面仍存在提升空间。为了解决这些问题，并进一步推动零样本语音合成在实际场景中的落地能力，B站语音团队对模型架构与训练策略进行了深度优化，推出了全新一代语音合成模型——IndexTTS2 。

3843 62 72

modelscope

|

11月前

|

缓存物联网异构计算

|

博文

智谱发布新一代旗舰模型 GLM-4.5，面向推理、代码与智能体的开源SOTA模型！

7月28日晚，智谱带来新一代旗舰模型——GLM-4.5！GLM-4.5 系列模型是专为智能体设计的基础模型。GLM-4.5拥有 3550 亿总参数量，其中 320 亿活跃参数；GLM-4.5-Air 采用更紧凑的设计，拥有 1060 亿总参数量，其中 120 亿活跃参数。GLM-4.5模型统一了推理、编码和智能体能力，以满足智能体应用的复杂需求。

1413 0 0

探索云世界

|

11月前

|

人工智能数据可视化前端开发

|

博文

蚂蚁的可视化图表 MCP 首发上线！支持超过 25 种的可视化图表生成，也支持生成路书！

蚂蚁 AntV 团队推出可视化图表 MCP 插件，支持 25+ 种图表类型，涵盖统计图、关系图及地图标注、路径地图等，用户只需输入文本即可生成炫酷图表，大幅简化数据可视化流程，提升数据展示效率。

1724 23 23

七牛开发者

|

25天前

|

人工智能前端开发数据可视化

|

博文

HTML is the new Markdown：来自 Claude Code 团队的实践

AI Agent兴起后，Markdown因简洁易编辑成为默认输出格式。但Anthropic工程师Thariq提出：HTML正成为“新Markdown”——它通过CSS、交互元素、图表与响应式布局，显著提升信息密度与可读性，更适合PR评审、设计原型、技术报告等复杂场景。业界共识渐明：Markdown适合作为AI与开发者的轻量底稿，HTML则担当面向人类的展示与协作层。

365 3 4

1233720155854565

|

28天前

|

人工智能搜索推荐云计算

|

博文

阿里云算力加持书尖 AI 打造智能高效阅读学习新方案

书尖AI是依托阿里云算力的智能阅读平台，聚合1.2亿册正版书籍，提供AI精读、双人对话播客、自定义创作与音频生成等创新功能，3分钟提炼全书精华，破解读得慢、记不住、没时间等痛点，打造轻量、沉浸、高效的一站式学习体验。（239字）

255 0 0

modelscope

|

4月前

|

JSON 文字识别 API

|

博文

百度文心开源0.9B参数 PaddleOCR-VL-1.5，全球首个支持异形框定位的文档解析模型！

百度文心开源新一代文档解析模型PaddleOCR-VL-1.5：仅0.9B参数，在OmniDocBench v1.5达94.5%精度，全球首个支持异形框定位，精准识别倾斜、弯折、反光等“歪文档”，集成印章识别、多语种（含藏语/孟加拉语）及古籍解析能力，推理速度超MinerU2.5达43%。（239字）

1101 2 2

小刘的大模型笔记

|

5月前

|

监控搜索推荐物联网

|

博文

一文读懂LoRA微调原理：大模型高效适配的核心逻辑

通过冻结大模型参数、仅训练少量低秩矩阵，实现高效微调：成本低、周期短、不破坏通用能力。适配医疗、金融等垂直场景，支持多任务复用与边缘部署，成为大模型落地首选技术。

1193 9 9

huizhudev

|

6月前

|

设计模式人工智能架构师

|

博文

面对"祖传代码"不敢动？用这条指令让AI做你的首席重构架构师

面对"屎山"代码不敢动？本文介绍了一套专业的AI重构指令，化身拥有15年经验的首席架构师。它能精准识别代码异味，提供基于设计模式的重构方案，并生成验证清单，帮助开发者安全高效地偿还技术债务。

643 7 7

游客77ikadlqxugne

|

7月前

|

人工智能 JavaScript API

|

博文

AI Agent Registry and Growth 对比各种AI Agent注册和发布的渠道生态 OpenAI Google Claude 开源工具 agtm等

本文对比了OpenAI、Google、Claude及开源平台如agtm 的AI Agent注册与发布方法，重点介绍AI Agent Registry API、社区和Marketplace三种方式，帮助开发者和产品经理提升智能体的可见性与分发渠道。

1320 0 0

modelscope

|

9月前

|

人工智能数据处理云栖大会

|

博文

WeaveFox 是一款免费的 AI 驱动应用创作平台，2个月全新重构升级。无需代码，用自然语言即可生成可运行、可部署的全栈应用。支持灵感澄清、AI建站、技能扩展、云服务集成与团队协作，助力个人、OPC及非技术人员快速实现创意变现。

188 3 3

七牛开发者

|

21天前

|

人工智能机器人测试技术

|

博文

用 Bub 和飞书搭一个更懂群聊上下文的小机器人

手把手教你搭建 Bub：一个懂群聊上下文、无“班味”的轻量化 AI 助理。

241 1 2

LucaJu

|

2月前

|

人工智能 Java 数据库

|

博文

DeepAgents 人工介入实战｜LangGraph 实现 Agent 高危工具人工审批

本文详解基于 LangChain+LangGraph+DeepAgents 实现 Python 智能体人工介入实战，配置高风险工具中断审批、状态检查点保存与恢复，支持同意 / 拒绝 / 参数编辑，对比 Spring AI Alibaba 方案，附完整可运行源码与生产落地建议。

344 0 0

modelscope

|

4月前

|

JSON 人工智能 Shell

|

博文

用 4B 小模型做Code Agent的SubAgent？这个开源项目做到了

LocoOperator-4B 是 LocoreMind 推出的 4B 开源蒸馏模型，专为代码库探索优化：本地运行、零 API 成本，结构化工具调用（Read/Grep/Glob/Bash 等）准确率达 100%。它替代 Code Agent 中的子智能体，显著降本增效。（239 字）

815 18 18

modelscope

|

4月前

|

人工智能文字识别物联网

|

博文

ModelScope魔搭社区发布月报 -- 26年2月

临近年关，ModelScope迎来春节模型发布潮：Qwen3、GLM-4.7、MiniMax M2.1等大模型密集上新；AIGC生图、语音合成、具身智能全面突破；OpenAPI、OAuth、Gallery等生态基建同步升级，加速AI开源普惠。（239字）

768 7 7

阿尔的代码屋

|

4月前

|

人工智能数据可视化物联网

|

博文

[大模型实战 06] 我的模型我做主：在 Kaggle 上用 Unsloth 极速微调 Qwen3

本文介绍如何用Unsloth+QLoRA高效微调Qwen3-4B模型，仅需Kaggle免费T4显卡，速度提升2–5倍、显存节省60%；三步实现“灵魂认主”，让模型自认“AlgiebaLLM AI”，全程代码简洁，零基础可上手。

1078 7 8

来自：自然语言处理版块

modelscope

|

8月前

|

传感器人工智能 API

|

博文

仅100多元，他给视障人群装上AI“眼睛”

上海两名开发者为验证AI助盲实效，亲手打造百元AI眼镜，蒙眼实测过马路、识盲道，并开源项目鼓励更多人参与。技术导航，人心照亮。

1683 6 8

安全风信子

|

8月前

|

人工智能监控供应链

|

博文

51_安全性测试：提示注入与红队

在2025年，大型语言模型（LLM）已成为企业数字化转型的核心驱动力，但随之而来的安全挑战也日益严峻。数据显示，全球每月监测到超过50万次针对大语言模型的越狱攻击，这些攻击利用LLM的"黑箱"特性和自主生成能力，突破了传统安全边界。特斯拉自动驾驶系统因对抗性贴纸导致12%测试场景意外加速、加拿大航空聊天机器人误导票价信息被勒令退款、韩国初创公司因AI数据泄露被罚9.3万美元、谷歌Bard曾因错误信息导致市值缩水1000亿美元等真实案例，都凸显了LLM安全的重要性

1939 0 0

游客shtkeyumv2k3o

|

11天前

|

运维安全机器人

|

博文

增强现实技术重塑电力行业 | 瑞丰宝丽XR云平台

2026年，AR技术在电力行业规模化落地，深度赋能“源网荷储”一体化。覆盖巡检、培训、应急、建设全场景，运维效率提升45%+，事故率下降72%，缺陷识别准确率达98%。轻便AR眼镜实现“问题找人”、专家远程指导、数字孪生协同，正加速电力智能化与无人化演进。（239字）

115 8 8

游客2ybt27odjah3k

|

19天前

|

存储人工智能 JSON

|

博文

日抛型软件的双链路设计——从"日抛"到"认知进化"的范式革命

本文提出AI时代“日抛型软件”新范式：日抛非终点，而是进化起点。基于AISTUDIO双线架构（Build链即时生成+Designer链持久沉淀），实现“双遗产”——参数权重持续优化（越用越懂用户）与领域知识动态沉淀（生成越来越专业），推动软件从消耗品跃升为认知引擎。（239字）

164 3 3

游客5ghrq7wwljqxu

|

3月前

|

JSON API 数据库

|

博文

如何快速对接德国股票数据 API

德国作为欧洲最大经济体，其法兰克福交易所及DAX指数是全球配置欧洲资产的关键入口。本文详解如何通过StockTV金融API，快速接入德国股票实时行情、历史K线及DAX指数数据，支持毫秒级延迟与多周期分析。

291 4 4

游客vd2226t73ha74

|

4月前

|

人工智能安全前端开发

|

博文

D2大会界面即推理：解读 Google A2UI 如何探索 Agent 交互新标准

Google A2UI开源项目，以声明式JSON协议让AI按需生成安全、跨平台的动态界面，破解Agent交互“最后一公里”难题。D2大会将揭秘其设计哲学、多智能体UI协作及开源路线图。

626 4 4

小刘的大模型笔记

|

4月前

|

数据采集机器学习/深度学习自然语言处理

|

博文

PPO 与 DP

本文通俗解析PPO与DPO两大偏好优化算法：PPO为间接优化，需训练奖励模型，稳定但流程复杂；DPO为直接优化，跳过奖励模型，简洁高效但对数据质量要求高。对比原理、流程、优劣及适用场景，助你按业务需求科学选型。

695 4 4

modelscope

|

5月前

|

人工智能自然语言处理运维

|

博文

业内首发泛娱乐底座大模型！元象开源XVERSE-Ent中英双模型，单卡部署超低门槛

元象开源首款聚焦泛娱乐场景的大模型XVERSE-Ent，含中英双版本，专精角色一致性、长剧情理解与多元语境适配，支持轻量化部署，助力开发者低成本打造AI社交、游戏与创意内容应用。

481 3 3

modelscope

|

6月前

|

人工智能开发框架自然语言处理

|

博文

Mule Agent Builder：面向下一代 Agent 的全新构建范式

MuleRun推出Mule Agent Builder，首创“Base Agent + Skills + Knowledge”范式，通过自然语言对话即可构建高能力、可推理、会调用工具的AI Agent。它大幅降低开发门槛，实现从创意到变现的一站式闭环，助力创作者轻松打造专属Agent并快速上架盈利。现诚邀共建者参与首批内测，共同定义下一代Agent的构建与商业化未来。

683 2 2

modelscope

|

2月前

|

机器学习/深度学习自然语言处理算法

|

博文

OpAgent开源：登顶 WebArena，蚂蚁集团开源全模态网页智能体

蚂蚁集团推出Web智能体OpAgent，仅凭自然语言指令即可在真实网站（如亚马逊）自主完成搜索、识别、加购等复杂操作。其采用视觉驱动理解、在线强化学习与模块化协作架构，在WebArena基准达71.6%任务成功率，刷新SOTA。已开源OpAgent-32B-INT4量化模型，显著降低推理门槛。

406 3 3

游客xvzc7jflshiue

|

4月前

|

API

|

问答

近日，Jina AI 正式发布 jina-embeddings-v4，一款全新的多模态向量模型，参数规模达到 38 亿，并首次实现了对文本与图像的同步处理。

1374 2 2

modelscope

|

2月前

|

编解码自然语言处理文字识别

|

博文

LLaDA2.0-Uni 开源: 打破 AR 桎梏，dLLM定义原生多模态统一新范式

LLaDA2.0-Uni是全球首个开源的多模态MoE离散扩散大模型（dLLM），以16B参数统一实现图像理解、生成与编辑。突破性采用全离散扩散建模，摆脱自回归依赖，支持并行解码与任意分辨率；语义视觉Token+定制Diffusion Decoder，8步即出高质量图。已在21项基准登顶，全面开源。

349 1 1

最新

文章

视频

问答

推荐

写小说时，Claude 4.0 和 4.5 的差别在哪里？

MiniMax M2.1开源：多语言编程SOTA，为真实世界复杂任务而生

94_提示压缩：减少token消耗

qwen3-32b和qwen-2.5-32b-Instruct有什么区别

modelscope显示每天有2000次的API免费额度，在500次的时候，就提示限流了

手把手基于ModelScope MCP协议实现AI短视频创作：零代码自动化工作流

2026年运营岗正在分层：懂AI应用的运营和只会排期的运营差距有多大

五分钟配好向日葵 MCP，让 AI 替你远程安装 OpenClaw！

推荐一款可以简单快速部署开源AI模型的桌面软件 Doo AI

MySQL 实用语句与工具使用指南

One Trick Per Day

通过ollama 编写modelfile的形式创建翻译模型，输出全是思考，老是超限，翻译不出来。

B站开源IndexTTS2，用极致表现力颠覆听觉体验

智谱发布新一代旗舰模型 GLM-4.5，面向推理、代码与智能体的开源SOTA模型！

蚂蚁的可视化图表 MCP 首发上线！支持超过 25 种的可视化图表生成，也支持生成路书！

HTML is the new Markdown：来自 Claude Code 团队的实践

阿里云算力加持 书尖 AI 打造智能高效阅读学习新方案

百度文心开源0.9B参数 PaddleOCR-VL-1.5，全球首个支持异形框定位的文档解析模型！

一文读懂LoRA微调原理：大模型高效适配的核心逻辑

面对"祖传代码"不敢动？用这条指令让AI做你的首席重构架构师

AI Agent Registry and Growth 对比各种AI Agent注册和发布的渠道生态 OpenAI Google Claude 开源工具 agtm等

云栖现场｜让评测与标注成为AI进化引擎！阿里发布全新评测平台，3大创新评测集亮相

Gemma 3n正式版开源：谷歌全新端侧多模态大模型，2GB 内存就能跑，重点提升编码和推理能力！

Harness Engineering 被讲烂之后，Agent 工程真正难的是什么？

WeaveFox，个人创作者的 AI 应用助手

用 Bub 和飞书搭一个更懂群聊上下文的小机器人

DeepAgents 人工介入实战｜LangGraph 实现 Agent 高危工具人工审批

用 4B 小模型做Code Agent的SubAgent？这个开源项目做到了

ModelScope魔搭社区发布月报 -- 26年2月

[大模型实战 06] 我的模型我做主：在 Kaggle 上用 Unsloth 极速微调 Qwen3

仅100多元，他给视障人群装上AI“眼睛”

51_安全性测试：提示注入与红队

增强现实技术重塑电力行业 | 瑞丰宝丽XR云平台

日抛型软件的双链路设计——从"日抛"到"认知进化"的范式革命

如何快速对接德国股票数据 API

D2大会 界面即推理：解读 Google A2UI 如何探索 Agent 交互新标准

PPO 与 DP

业内首发泛娱乐底座大模型！元象开源XVERSE-Ent中英双模型，单卡部署超低门槛

Mule Agent Builder：面向下一代 Agent 的全新构建范式

OpAgent开源：登顶 WebArena，蚂蚁集团开源全模态网页智能体

已经实名，但免费API无法使用

投稿 | Zvec: 开箱即用、高性能的嵌入式向量数据库

九坤量化开源IQuest-Coder-V1，代码大模型进入“流式”训练时代

Python 微服务架构实践：从模块化到轻量级分布式

智谱旗舰模型GLM-4.6开源发布，代码能力对齐Claude Sonnet 4

107_DPO：直接偏好优化

45_混合专家模型：MoE架构详解

52_领域模型：BioBERT与FinBERT

Jina Embeddings V4: 为搜索而生，多模态多语言向量模型

LLaDA2.0-Uni 开源: 打破 AR 桎梏，dLLM定义原生多模态统一新范式

ModelScope模型即服务

活跃用户

相关产品

阿里云算力加持书尖 AI 打造智能高效阅读学习新方案

D2大会界面即推理：解读 Google A2UI 如何探索 Agent 交互新标准