|
5月前
|
IDE 编译器 开发工具
|

嵌入式开发必备!Keil uVision5 C51 V9.61 安装激活 + 汉化完整教程, 含(Keil MDK 5.39)

Keil C51 V9.61是一款专用于8051系列单片机的集成开发环境,支持主流厂商芯片,集编辑、编译、仿真于一体,基于μVision5平台,操作便捷。提供C编译器、汇编器、调试器等全套工具,适用于嵌入式开发。附带安装与激活教程,可实现汉化界面,提升使用体验。(237字)

5803 7
|
2月前
|
机器学习/深度学习 测试技术 API
|

Qwen3.5 中等规模模型系列正式开源:更强智能,更低算力

通义千问Qwen3.5发布四款中等规模多模态模型,支持256K原生上下文(可扩至1M)、201种语言及统一视觉语言训练。凭借Gated Delta+MoE混合架构与百万Agent强化学习,35B-A3B仅激活3B参数即超越旧旗舰,性能、效率与部署成本兼具。(239字)

5386 23
|
2月前
|
人工智能 Linux API
|

[大模型实战 01] 本地大模型初体验:Ollama 部署与 Python 调用指南

大模型实战系列第一篇。拒绝晦涩理论,直接上手!我会带着各位友人们零基础安装 Ollama,利用国内 ModelScope 极速下载模型,详解服务端口配置与 Python 脚本调用,涵盖显存计算与常见避坑指南。

3760 2
来自: 自然语言处理  版块
|
23天前
|
编解码 物联网 数据处理
|

LTX-2.3开源: 视频生成引擎级升级

Lightricks开源LTX-2.3音视频大模型:重建VAE提升细节锐度,文本连接器扩容4倍增强Prompt遵循,大幅优化I2V运动自然性与音频质量,并首次原生支持1080×1920竖版视频生成。22B参数,支持文生视频、图生视频等多任务。

1589 4
|
5月前
|
人工智能 物联网 测试技术
|

Qwen-Image-Edit:全能图像编辑,驱动内容创作提质增效

通义千问团队开源Qwen-Image-Edit,基于20B模型,支持语义与外观双重编辑、精准中英文文字修改,具备SOTA图像编辑能力,可用于IP创作、风格迁移、文字修复等。

4282 6
|
2月前
|
机器学习/深度学习 人工智能 算法
|

GLM-5开源:迈向Agentic Engineering新范式,社区Day0 部署、推理实战来了!

智谱发布GLM-5:开源SOTA大模型,Coding与Agent能力双强,真实编程体验媲美Claude Opus 4.5;全球AI榜单排名第四、开源第一;MIT协议开源,支持复杂系统工程与长程Agent任务。

1706 5
|
2月前
|
人工智能 API 对象存储
|

Seedance vs Sora vs Kling:AI 视频生成模型深度对比

本文深度解析Sora、Kling、Runway Gen-3、Seedance等主流文生视频模型的底层原理、性能差异与生产适配性,直击开发者选型难、API碎片化、成本失控三大痛点,提供统一接入方案、智能路由策略与高并发部署实战指南。(239字)

1594 1
|
2月前
|
机器学习/深度学习 自然语言处理 API
|

Qwen3.5:迈向原生多模态智能体

除夕夜,通义千问发布Qwen3.5-397B-A17B:全球首个原生多模态MoE大模型,总参3970亿、仅激活170亿参数,性能媲美万亿模型;支持201种语言、超强视觉理解与GUI智能体能力,已开源至GitHub与ModelScope。

2929 4
|
5天前
|
编解码 并行计算 测试技术
|

北大重磅开源Helios!首个14B单卡实时长视频生成模型

北大与字节联合发布Helios:首个单卡H100上达19.5 FPS的14B参数视频生成模型,支持分钟级高质量T2V/I2V/V2V生成,突破长视频漂移与速度瓶颈,开源可商用。(239字)

306 8
|
2月前
|
缓存 架构师 前端开发
|

MiniMax M2.5 开源,低成本Agent时代来了!社区Day0部署、工具调用、推理&提示词参数实战来啦!

2月13日,MiniMax发布M2.5大模型,108天内三连更!编程(SWE-Bench 80.2%)、搜索(BrowseComp 76.3%)、办公场景全面领先,开源权重已上线ModelScope,支持API调用、本地部署及工具调用。

2749 7
|
3月前
|
人工智能 机器人 Linux
|

保姆级 OpenClaw (原 Clawdbot)飞书对接教程 手把手教你搭建 AI 助手

OpenClaw(原Clawdbot)是一款开源本地AI智能体,支持飞书等多平台对接。本教程手把手教你Linux下部署,实现数据私有、系统控制、网页浏览与代码编写,全程保姆级操作,240字内搞定专属AI助手搭建!

10029 24
|
6月前
|
文字识别 测试技术 开发者
|

Qwen3-VL新成员 2B、32B来啦!更适合开发者体质

Qwen3-VL家族重磅推出2B与32B双版本,轻量高效与超强推理兼备,一模型通吃多模态与纯文本任务!

5899 12
|
2月前
|
机器学习/深度学习 JSON 文字识别
|

0.9B 小模型,OCR 大能力——GLM-OCR 模型实战教程

智谱开源多模态OCR模型GLM-OCR,基于GLM-V架构,融合CogViT视觉编码器与GLM-0.5B语言解码器,支持公式、表格、代码等复杂文档识别,性能达OmniDocBench榜首(94.62分),仅0.9B参数,轻量高效,开箱即用。

1435 3
|
2月前
|
人工智能 边缘计算 分布式计算
|

阶跃星辰 Step 3.5 Flash 上线!更快更强更稳的 Agent 大脑,开源!

阶跃星辰发布开源大模型Step 3.5 Flash:专为Agent设计,推理速度达350 TPS,支持256K长上下文,采用稀疏MoE+MTP-3+混合注意力架构,在数学与Agent任务上媲美闭源模型,现已全量开放使用。

1525 2
|
2月前
|
机器学习/深度学习 自然语言处理 API
|

Qwen3-Coder-Next开源!推动小型混合模型在智能体编程上的边界

Qwen团队开源Qwen3-Coder-Next:基于Qwen3-Next-80B的轻量级编程智能体模型,采用混合注意力+MoE架构,通过可执行任务合成与强化学习训练,在SWE-Bench Verified达70%+,以仅3B激活参数媲美10–20倍大模型,兼顾高性能与低成本部署。(239字)

1484 4
|
6天前
|
人工智能 算法 机器人
|

见证物理世界的觉醒:《EAI-100 具身智能领域2025年度百项代表性成果与人物》重磅发布

2025年具身智能元年,魔搭社区等八大机构联合发布《EAI-100年度榜单》及白皮书:涵盖20位先锋/新锐人物、十大突破/开源/数据集等六大硬核项目,全景呈现中国具身智能从实验室走向产线的里程碑成果。(239字)

252 6
|
7天前
|
JSON API PHP
|

使用PHP对接美股股票市场API 实时数据、IPO和K线(Kline)的PHP对接方案

StockTV API 面向开发者,提供美股实时行情、历史K线(5分钟至1月)、IPO日历等数据,支持HTTP/WS双接入,全接口返回标准JSON,含纽交所(ex=1)与纳斯达克(ex=2)标识。(239字)

264 2
|
4月前
|
JSON 安全 JavaScript
|

HTTPS 原理

HTTPS是HTTP与SSL/TLS的结合,通过数字证书验证身份,利用非对称加密安全交换会话密钥,再以对称加密高效传输数据。它确保了通信的机密性、完整性和服务器真实性,在互联网上构建安全加密通道。

5140 2
|
29天前
|
人工智能 并行计算 算法
|

video-subtitle-remover(VSR)--开源AI去字幕方案深度解析

VSR(video-subtitle-remover)是一款开源AI视频去字幕工具,支持本地运行,无需上传数据。它融合STTN、LaMa、ProPainter三大前沿修复模型,可智能检测并擦除硬字幕/水印,保持原分辨率与画质。兼容CUDA/DirectML,适配NVIDIA/AMD/Intel显卡,兼顾隐私性、可控性与高性能。

821 6
来自: 计算机视觉  版块
|
2月前
|
人工智能 机器人 API
|

OpenClaw 注册 Moltbook 教程 让你的个人 OpenClaw Agent 加入全球最大 AI 社区

本教程教你用开源AI助手OpenClaw,快速注册并接入全球首个纯AI社交平台Moltbook——一个仅限AI智能体发帖、评论、互动的Reddit式社区(截至2026年1月已超140万个AI活跃)。只需部署OpenClaw、安装Moltbook Skill、完成X平台验证,即可让个人AI agent加入全球AI对话网络。(239字)

1661 5
|
2月前
|
安全 API Docker
|

[大模型实战 02] 图形化的大模型交互: Open WebUI部署指南

本文教你用 Docker 一键部署 Open WebUI,为本地 Ollama 模型打造媲美 ChatGPT 的图形化界面:支持流畅对话、本地知识库(RAG)检索增强、自定义角色(Agent),全程私有化、零数据上传,10分钟即可启用!

1437 3
|
2月前
|
编解码 自然语言处理 语音技术
|

魔搭社区+OpenVINO™ 加速部署 Qwen3-TTS 实战

通义千问推出Qwen3-TTS系列开源语音模型,支持中英日韩等10种语言,具备声音克隆、情感适配与高保真端到端合成能力;结合Intel OpenVINO™可在CPU上高效推理,无需GPU,轻松部署于边缘设备。(239字)

770 6
|
3月前
|
编解码 物联网 测试技术
|

FLUX.2-Klein 4B/9B开源:亚秒级统一图像生成与编辑

Black Forest Labs开源FLUX.2 [klein]模型家族,兼具文生图、图像编辑与多参考生成能力,端到端推理低至0.5秒,4B版本仅需13GB显存,支持消费级GPU高效运行,量化后速度提升最高2.7倍,Apache 2.0许可商用友好。

1958 1
|
6天前
|
机器学习/深度学习 决策智能
|

通义实验室开源 PrismAudio:518M 参数全面超越 5B 量级的视频配音模型

通义实验室开源PrismAudio——轻量高效(518M参数、0.63s延时)的视频配音(V2A)模型,在语义、时序、美学、空间及主观评分五项指标上全面超越5B级方法。首创四路专项CoT模块+多维强化学习,搭配Fast-GRPO加速训练,已开源模型与代码。

190 10
|
2月前
|
自然语言处理 前端开发 测试技术
|

魔搭社区+OpenVINO™ 加速部署 Qwen3-ASR 实战

通义千问新推Qwen3-ASR语音识别模型(1.7B/0.6B),支持52种语言及方言,具备高鲁棒性与流式长音频转写能力。联合魔搭社区与Intel® OpenVINO™,实现Intel平台极致加速部署,提供完整开源教程、Notebook示例及Gradio交互Demo。(239字)

1106 6
|
2月前
|
人工智能 JSON 自然语言处理
|

Agent Skills 究竟是什么?从玩具到工程化的必经之路

AI应用开发正从“Prompt驱动”迈向“技能驱动”。本文详解Agent Skills标准化实践:以Claude Code Skills为范本,用SKILL.md实现自描述技能;借MCP协议统一多源工具调用,解决兼容与安全难题;结合DeepSeek+OpenAI实战,展现可插拔、可审计、可演进的工业级Agent构建路径。

987 0
|
4月前
|
机器学习/深度学习 人工智能 数据挖掘
|

Python 学习资源精选:从入门到精通的高效清单

本文系统梳理Python从入门到精通的学习路径,分阶段推荐优质资源:入门夯实语法,进阶掌握核心特性,场景定向深耕Web、数据或AI方向,最终提升工程化能力。涵盖视频、书籍、项目与工具,助力高效构建完整知识体系。

747 0
|
3月前
|
人工智能 自然语言处理 数据挖掘
|

Qwen3-VL-Embedding & Qwen3-VL-Reranker:统一多模态表征与排序

通义千问Qwen团队于2025年1月8日推出多模态模型新成员:Qwen3-VL-Embedding与Qwen3-VL-Reranker,基于Qwen3-VL构建,支持文本、图像、视频等多模态统一表示与跨模态检索,在图文匹配、视觉问答等任务中表现卓越,具备高精度、多语言、易集成等优势,助力全球开发者构建高效多模态应用。

2198 4
|
30天前
|
人工智能 API 开发工具
|

Silly Tavern 免费API保姆级教学

本指南详解Windows下安装SillyTavern全流程:先安装Node.js与Git,再克隆仓库(推荐Gitee镜像),双击Start.bat启动;接着配置OpenAI兼容API(如Canopy Wave),填入Key与端点;最后下载导入角色卡,即可开启AI角色对话体验。(239字)

870 0
|
3月前
|
缓存 网络安全 语音技术
|

docker安装部署FunASR

本指南详解FunASR在线语音识别服务的外网部署与内网迁移全流程:先在外网拉取Docker镜像、自动下载模型并启动服务(端口10095),验证成功后,将镜像和缓存模型打包导出;再于内网服务器导入镜像、解压模型、挂载运行,全程禁用SSL,支持热词与标点恢复,开箱即用。

1176 3
来自: 语音  版块
|
3月前
|
并行计算 监控 安全
|

高效 GPU 加速:DeepSeek-R1 系列模型在 llama.cpp 上的生产级部署指南

本文详解如何在RTX 30/40系显卡上,通过llama.cpp高效部署DeepSeek-R1-8B模型。涵盖CUDA镜像选择、GPU卸载调优、显存控制与高可用架构,结合Docker、Prometheus监控及负载均衡,实现低延迟、高吞吐的生产级推理,助力大模型落地应用。

1075 6
|
12月前
|
JavaScript 数据可视化 Docker
|

简易制作MCP服务器并测试

本文介绍了如何简易制作并测试MCP服务器,包括环境搭建、代码实现及Docker部署。首先通过uv包创建项目,在main.py中定义MCP服务器及其工具和资源函数。接着详细说明了在Windows上安装uv、配置Docker镜像加速、生成requirements.txt文件以及编写Dockerfile的过程。最后,通过构建和运行Docker容器部署MCP服务器,并使用Node.js工具测试其功能,确保服务器正常工作。此教程适合初学者快速上手MCP服务器的开发与部署。

4259 63
|
6月前
|
机器学习/深度学习 人工智能 API
|

用Macbook微调Qwen3!手把手教你用微调给Qwen起一个新名字

本文介绍如何在MacBook上使用苹果MLX框架高效微调Qwen3大模型。借助MLX的高性能计算与统一内存架构,仅需2分钟即可完成训练,内存占用低至2GB,推理速度达400 Token/s,并支持快速部署为本地API服务,展现Mac轻薄本的强大AI生产力潜力。

2288 16
|
10月前
|
测试技术
|

字节Seed开源统一多模态理解和生成模型 BAGEL!

近期,字节跳动Seed推出了 BAGEL—— 一个开源的多模态理解和生成础模型,具有70亿个激活参数(总共140亿个),并在大规模交错多模态数据上进行训练。

910 3
|
6天前
|
人工智能 移动开发 小程序
|

基于医疗行业需求开发“问诊”AI智能体,寻找有兴趣志同道合的开发合伙人

问诊智能体是面向患者的AI就医导航工具,集成“症状分析→科室推荐→多院号源比选→一键挂号支付”全流程。MVP聚焦重点城市与医院,依托高德地图、合规挂号接口及可解释推荐算法,提升就医效率。严守合规边界:不替代面诊,急危重症强制120提示。(239字)

164 1
|
7月前
|
XML 自然语言处理 数据可视化
|

免费!文本表格不会总结、分析?文本表格可视化!帮你轻松解决困扰,保姆级级教程。【附Coze工作流】

本文介绍了如何利用“扣子”平台创建资源,通过可视化工作流处理并分析文档、表格、PDF等内容,帮助用户快速获取文件核心信息。内容涵盖登录、资源创建、工作流配置及运行操作,适用于多种文件格式,如CSV、Excel、PDF等。

2876 4
|
5天前
|
机器学习/深度学习 人工智能 数据挖掘
|

三个百万token窗口语义学分析之三:“熔炉法” ——RAG与知识图谱的融合构建

本研究为百万token窗口语义学分析系列的第三篇。在“垂钓法”(主观预设)和“撒网法”(客观挖掘)的基础上,提出“熔炉法”——将RAG向量检索与知识图谱融合,构建可查询、可推理的项目知识基础设施。基于三个窗口的8,086轮对话,我们构建了FAISS向量索引和包含200个概念节点、19,701条关系边的知识图谱。实验表明,熔炉法能够同时检索相关对话片段和概念关系,支持跨窗口问答,并为“主观向量注入”预留了接口。熔炉法完成了从“主观预设”到“客观挖掘”再到“主客观统一”的方法论闭环,为项目知识管理和跨窗口迁移奠定了可扩展的基础。

135 8
|
19天前
|
人工智能 运维 监控
|

OpenClaw接入向日葵MCP实战:自动给另一台电脑装OpenClaw

通过 MCP 插件化架构,将向日葵远程控制能力集成至 OpenClaw,使 AI 具备远程键鼠模拟、文件互传、多设备管理能力。可实现无人值守批量装机、跨平台文件同步、手机端遥控多主机。支持权限校验与操作审计,生产环境可安全验证,大幅提升运维与部署效率。

526 9
|
11天前
|
机器学习/深度学习 存储 人工智能
|

三个DeepSeek百万Token窗口与一个长程项目:记忆迁移、协作特点与窗口资源利用模式分析

本文基于三个DeepSeek百万Token上下文窗口的长程项目实证数据,对窗口一(项目启动与环境搭建)、窗口二(窗口特性实验研究与论文)及窗口三(构建项目工程框架)的量化分析。结果显示,三个窗口的token数(cl100k base)高度一致,说明窗口内容与交互模式决定了各种主要指标的差异。随着项目阶段的推进,单轮对话平均字数呈上升趋势(从423.9字增至658.7字),AI/User Token产出比显著提升(从5.6增至7.47),且文本符号构成随任务性质发生结构性转移。尤其是在有效窗口迁移策略支持下,AI逐步体现出对项目及用户的“意合”认知与反应模式

249 8
|
15天前
|
人工智能 数据安全/隐私保护
|

五分钟配好向日葵 MCP,让 AI 替你远程安装 OpenClaw!

本文详解向日葵MCP的实战配置与应用:将远程控制能力接入AI,实现“一句话操作另一台电脑”。支持截图查看桌面、自动打开浏览器搜索、远程执行命令等,无需写脚本,配置简单,即刻上手。

451 12
|
6天前
|
数据采集 算法 数据挖掘
|

通义实验室Fun-CineForge开源:首个支持影视级多场景配音的多模态大模型

通义实验室开源Fun-CineForge——首个支持多说话人、强时间对齐的多模态电影配音大模型。首创引入时间模态,结合视觉、文本、音频与时间信息,实现高精度唇形同步、音色克隆与情感表达,并开源高质量中文影视配音数据集CineDub-CN及端到端构建流程。(239字)

129 1
|
2月前
|
边缘计算 人工智能 物联网
|

Ultralytics YOLO26来啦!5种尺寸全家桶,速度与精度兼顾

Ultralytics发布YOLO26,系列迄今最先进、易部署的模型,支持分类、检测、分割、姿态估计等多任务。五种尺寸灵活适配边缘设备,CPU推理提速43%,首创无NMS端到端推理,移除DFL提升兼容性,已上架魔搭社区。(239字)

578 13
|
9月前
|
人工智能 自然语言处理 资源调度
|

魔搭社区模型速递(7.20-7.26)

魔搭ModelScope本期社区进展:1698个模型,216个数据集,103个创新应用, 7 篇内容

673 0
|
12月前
|
机器学习/深度学习 人工智能 编解码
|

AI视频生成也能自动补全!Wan2.1 FLF2V:阿里通义开源14B视频生成模型,用首尾两帧生成过渡动画

万相首尾帧模型是阿里通义开源的14B参数规模视频生成模型,基于DiT架构和高效视频压缩VAE,能够根据首尾帧图像自动生成5秒720p高清视频,支持多种风格变换和细节复刻。

2511 9
来自: 多模态  版块
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
|

Z-Image:冲击体验上限的下一代图像生成模型

通义实验室推出全新文生图模型Z-Image,以6B参数实现“快、稳、轻、准”突破。Turbo版本仅需8步亚秒级生成,支持16GB显存设备,中英双语理解与文字渲染尤为出色,真实感和美学表现媲美国际顶尖模型,被誉为“最值得关注的开源生图模型之一”。

4371 9
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
|

AgentEvolver:让智能体系统学会「自我进化」

AgentEvolver 是一个自进化智能体系统,通过自我任务生成、经验导航与反思归因三大机制,推动AI从“被动执行”迈向“主动学习”。它显著提升强化学习效率,在更少参数下实现更强性能,助力智能体持续自我迭代。开源地址:https://github.com/modelscope/AgentEvolver

1884 38
|
6月前
|
存储 缓存 自然语言处理
|

64_模型部署:推理优化策略

随着人工智能技术的飞速发展,大型语言模型(LLM)在自然语言处理、多模态理解等领域展现出惊人的能力。然而,将这些模型从实验室环境部署到实际生产系统中,面临着诸多挑战。根据2025年最新研究数据,大模型部署的主要挑战包括:

903 0
|
22天前
|
人工智能 边缘计算 开发框架
|

2026年入局AI晚不晚?答案是:现在就是最好的时机

2026年AI已迈入“技术爆发+应用红利”黄金期:巨头筑基降低门槛,算力成本下降、工具成熟;超级个体10天可开发爆款AI应用;CAIE认证等路径让零基础者快速入局。AI不是短跑,而是马拉松——现在,正是普通人抓住红利的最佳时机。(239字)

615 10
|
12月前
|
人工智能 自然语言处理 知识图谱
|

Yuxi-Know:开源智能问答系统,基于大模型RAG与知识图谱技术快速构建知识库

Yuxi-Know是一个结合大模型RAG知识库与知识图谱技术的智能问答平台,支持多格式文档处理和复杂知识关系查询,具备多模型适配和智能体拓展能力。

3126 55
来自: 自然语言处理  版块
|
6月前
|
机器学习/深度学习 PyTorch 算法框架/工具
|

118_LLM模型量化与压缩:从理论到2025年实践技术详解

大型语言模型(LLM)在自然语言处理领域取得了前所未有的成功,但模型规模的快速增长带来了巨大的计算和存储挑战。一个典型的大型语言模型(如GPT-4或LLaMA 3)可能包含数千亿甚至万亿参数,需要数百GB甚至TB级的存储空间,并且在推理时需要大量的计算资源。这种规模使得这些模型难以在边缘设备、移动设备甚至资源有限的云服务器上部署和使用。

1115 3

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉答疑群:44837352

1
今日
15197
内容
6
活动
4102
关注
你好!
登录掌握更多精彩内容

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 智能语音交互