|
7月前
|
人工智能 自然语言处理 数据中心
|

65_GPU选择:A100 vs RTX系列

在2025年的今天,大语言模型(LLM)已经成为人工智能领域的核心技术之一。从GPT-4到Llama 3.1,从专业领域应用到消费级产品,LLM正在以前所未有的速度改变着我们的工作和生活方式。然而,这些强大模型的训练和部署背后,都离不开高性能计算硬件的支持,尤其是GPU(图形处理单元)的选择,往往直接决定了项目的可行性、效率和成本。

1314 0
|
7月前
|
canal 人工智能 缓存
|

82_Chain-of-Thought:推理步骤拆解

在大语言模型(LLM)的发展历程中,推理能力一直是衡量模型智能水平的关键指标。尽管模型规模的扩大带来了知识覆盖和语言理解能力的显著提升,但在解决复杂推理问题时,单纯增加参数数量并不总能带来预期的性能提升。2022年,Jason Wei等人提出了一项革命性技术——Chain-of-Thought提示(CoT),这项技术通过引导模型生成中间推理步骤,显著增强了LLM在多步推理任务上的表现。

851 0
|
9月前
|
数据采集 人工智能 定位技术
|

分享一个开源的MCP工具使用的AI Agent 支持常用的AI搜索/地图/金融/浏览器等工具

介绍一个开源可用的 MCP Tool Use 通用工具使用的 AI Agent (GitHub: https://github.com/AI-Agent-Hub/mcp-marketplace ,Web App https://agent.deepnlp.org/agent/mcp_tool_use,支持大模型从Open MCP Marketplace (http://deepnlp.org/store/ai-agent/mcp-server) 的1w+ 的 MCP Server的描述和 Tool Schema 里面,根据用户问题 query 和 工具 Tool描述的 相关性,选择出来可以满足

984 9
|
9月前
|

智谱发布GLM-4.5V,全球开源多模态推理新标杆,Day0推理微调实战教程到!

视觉语言大模型(VLM)已经成为智能系统的关键基石。随着真实世界的智能任务越来越复杂,VLM模型也亟需在基本的多模态感知之外,逐渐增强复杂任务中的推理能力,提升自身的准确性、全面性和智能化程度,使得复杂问题解决、长上下文理解、多模态智能体等智能任务成为可能。

1210 0
|
10月前
|
机器学习/深度学习 人工智能 安全
|

AI 真会编程还是只会“背题” | Code Bench 专场直播带你洞悉代码能力的真实象限

AI 编程助手已成为开发者不可或缺的伙伴,但一个核心问题也随之而来:我们该如何衡量它们真正的代码实力?现有 Benchmark(基准测试)正面临严峻挑战——数据污染、测试用例不足等问题频出,导致模型排

626 2
|
11月前
|
人工智能 文字识别 安全
|

趣丸千音MCP首发上线魔搭社区,多重技术引擎,解锁AI语音无限可能

近日,趣丸千音(All Voice Lab)MCP正式首发上线魔搭社区。用户只需简单文本输入,即可调用视频翻译、TTS语音合成、智能变声、人声分离、多语种配音、语音转文本、字幕擦除等多项能力。

1223 32
|
11月前
|
开发框架 定位技术 API
|

AgentScope 与 MCP:实践、思考与展望

AgentScope 作为一款功能强大的开源多智能体开发框架,为开发者提供了智能体构建、工具使用、多智能体编排等全方位支持。

1310 37
|
2月前
|
网络协议 编译器 C语言
|

C语言深度解析:内存对齐与结构体填充的底层逻辑

C语言中,内存对齐是CPU硬件强制要求的底层规则,直接影响结构体大小、访问性能与硬件兼容性。合理排列成员可减少填充、节省内存;滥用`#pragma pack`则易致崩溃或性能暴跌。嵌入式、网络协议与跨平台开发必备核心知识。(239字)

371 14
|
3月前
|
算法 API 网络架构
|

如何高效对接新加坡股票(SGX)实时数据 API

新加坡股市(SGX)汇聚优质REITs、DBS/UOB银行股及航运企业。本文详解如何用StockTV全球金融API(countryId=15)快速获取实时行情、K线、STI指数等数据,支持REST/WS,低门槛、高时效,助力东南亚金融产品开发。(239字)

415 12
|
3月前
|
人工智能 JSON 监控
|

基于 AgentScope x AI Agent A2Z部署平台的生产级别Agent上线Live实战分享

本文分享如何用AgentScope框架+AI Agent A2Z平台,一键完成AI Agent生产级部署:解决“开发易、上线难”痛点,快速生成标准/chat接口(如https://agentscope.aiagenta2z.com/deep_research_agent/chat),支持高并发、实时监控与冷启动。

523 5
|
3月前
|
人工智能 自然语言处理 前端开发
|

写了10万行代码,却毁在配色上?这套指令让后端直男秒变设计总监

这是一篇专为后端及全栈开发者定制的实用指南,旨在解决开发者“代码强但审美弱”的痛点。文章提供了一套核心AI指令,能将DeepSeek等AI变成专业UI设计顾问,快速生成符合大厂规范(Design Token)的配色体系。通过一个后台管理系统的实战案例,演示了如何用AI将“土味”界面瞬间升级为专业级UI,让开发者无需学习设计理论也能搞定高颜值配色。

465 4
|
4月前
|
人工智能 机器人 程序员
|

去年我用一张Excel表"规划"学习,结果把自己逼进了ICU——直到我学会让AI帮我排兵布阵

本文以作者因"完美计划表"累倒入院的亲身经历切入,分享了一套让AI担任私人学习规划师的完整指令模板。通过"目标拆解""遗忘曲线复习""弹性时间"三大机制,解决目标模糊、复习逃避、计划崩溃等常见学习痛点,并提供上班族、学生、转行者三种典型场景的实战案例。

675 18
|
5月前
|
运维 监控 Devops
|

Linux 开发进阶:从初级运维到 DevOps 工程师的能力提升路径

在云计算时代,Linux运维正迈向自动化与智能化。本文梳理从初级运维到DevOps工程师的三阶跃迁路径:先掌握Shell脚本与Ansible实现自动化;再学习Docker容器化技术,构建高可用架构;最终落地CI/CD流水线与全链路监控,打通开发与运维壁垒。通过实战案例详解LNMP环境的DevOps改造,助力运维人员系统提升效率,实现能力突破。(238字)

272 0
|
5月前
|
存储 关系型数据库 MySQL
|

MySQL 项目实战入门:从 0 到 1 搭建电商数据库

本文以电商系统为实战场景,手把手教你从零搭建MySQL数据库。涵盖环境配置、需求分析、表结构设计(遵循三大范式)、数据初始化、关联查询及性能优化,结合SQL语句与设计思路,帮助初学者快速掌握数据库项目落地全流程。

321 0
|
7月前
|
存储 监控 算法
|

117_LLM训练的高效分布式策略:从数据并行到ZeRO优化

在2025年,大型语言模型(LLM)的规模已经达到了数千亿甚至数万亿参数,训练这样的庞然大物需要先进的分布式训练技术支持。本文将深入探讨LLM训练中的高效分布式策略,从基础的数据并行到最先进的ZeRO优化技术,为读者提供全面且实用的技术指南。

779 2
|
7月前
|
缓存 负载均衡 监控
|

135_负载均衡:Redis缓存 - 提高缓存命中率的配置与最佳实践

在现代大型语言模型(LLM)部署架构中,缓存系统扮演着至关重要的角色。随着LLM应用规模的不断扩大和用户需求的持续增长,如何构建高效、可靠的缓存架构成为系统性能优化的核心挑战。Redis作为业界领先的内存数据库,因其高性能、丰富的数据结构和灵活的配置选项,已成为LLM部署中首选的缓存解决方案。

796 25
|
7月前
|
PyTorch 算法框架/工具 异构计算
|

75_TPU集成:Google Cloud加速

在大型语言模型(LLM)训练和推理的竞赛中,计算硬件的选择直接决定了研发效率和成本。Google的Tensor Processing Unit(TPU)作为专为AI计算设计的专用芯片,正逐渐成为大规模LLM开发的首选平台之一。随着2025年第七代TPU架构Ironwood的发布,Google在AI计算领域再次确立了技术领先地位。

1657 0
|
7月前
|
数据采集 机器学习/深度学习 自然语言处理
|

98_数据增强:提升LLM微调效果的关键技术

在大语言模型(LLM)的微调过程中,数据质量与数量往往是决定最终性能的关键因素。然而,获取高质量、多样化且标注准确的训练数据却常常面临诸多挑战:数据标注成本高昂、领域特定数据稀缺、数据分布不均等问题都会直接影响微调效果。在这种背景下,数据增强技术作为一种能够有效扩充训练数据并提升其多样性的方法,正发挥着越来越重要的作用。

734 1
|
9月前
|
机器人 图形学 开发者
|

腾讯混元最新开源:一张图,秒变游戏大片

有没有想过,随手拍的一张风景照,下一秒就能变成可操控的游戏开放世界?

707 3
来自: 计算机视觉  版块
|
10月前
|
人工智能 自然语言处理 资源调度
|

魔搭社区模型速递(7.20-7.26)

魔搭ModelScope本期社区进展:1698个模型,216个数据集,103个创新应用, 7 篇内容

866 0
|
10月前
|
API 调度 决策智能
|

全新平台级 ModelScope MCP 实验场重磅上线!

还在为快速验证MCP在对话中的效果而烦恼? 希望更灵活地组合魔搭开源模型API-Inference与Hosted MCP服务?

690 2
|
10月前
|
人工智能 数据可视化 前端开发
|

蚂蚁的可视化图表 MCP 首发上线!支持超过 25 种的可视化图表生成,也支持生成路书!

蚂蚁 AntV 团队推出可视化图表 MCP 插件,支持 25+ 种图表类型,涵盖统计图、关系图及地图标注、路径地图等,用户只需输入文本即可生成炫酷图表,大幅简化数据可视化流程,提升数据展示效率。

1651 23
|
10月前
|
数据采集 编解码 人工智能
|

Gemma 3n正式版开源:谷歌全新端侧多模态大模型,2GB 内存就能跑,重点提升编码和推理能力!

6月底,Google正式开源发布了全新端侧多模态大模型 Gemma 3n!相较此前的预览版,最新的 Gemma 3n 完整版进一步提升性能表现,支持在 2GB 内存的硬件上本地运行,重点提升了编码和推理方面的能力。

1230 1
|
11月前
|
人工智能 弹性计算 自然语言处理
|

从0到1部署大模型,计算巢模型市场让小白秒变专家

阿里云计算巢模型市场依托阿里云弹性计算资源,支持私有化部署,集成通义千问、通义万象、Stable Diffusion等领先AI模型,覆盖大语言模型、文生图、多模态、文生视频等场景。模型部署在用户云账号下,30分钟极速上线,保障数据安全与权限自主控制,适用于企业级私有部署及快速原型验证场景。

650 9
|
12月前
|
人工智能 自然语言处理 API
|

魔搭社区模型速递(5.18-5.24)

魔搭ModelScope本期社区进展:📟3790个模型,📁307个数据集,🎨90个创新应用,📄 7 篇内容

802 14
|
2月前
|
缓存 JSON API
|

玩转纳斯达克与纽交所:美股数据 API 对接全指南

本文手把手教你用StockTV API对接美股(NYSE/NASDAQ)实时行情、专业K线及IPO数据,支持WebSocket极速推送、多维技术指标与全交易所覆盖,助你快速构建低延迟量化交易或金融App。(239字)

487 7
|
3月前
|
人工智能 安全 前端开发
|

D2大会 界面即推理:解读 Google A2UI 如何探索 Agent 交互新标准

Google A2UI开源项目,以声明式JSON协议让AI按需生成安全、跨平台的动态界面,破解Agent交互“最后一公里”难题。D2大会将揭秘其设计哲学、多智能体UI协作及开源路线图。

576 4
|
3月前
|
数据采集 人工智能 搜索推荐
|

"老师,你讲的我都懂,但下次还是不会用"——一套让课程设计真正落地的AI指令

分享一套课程设计AI指令,能将DeepSeek/Kimi变成教学设计顾问,帮助教师和培训师快速构建目标明确、结构合理的专业课程方案。从"讲得好"跨越到"教得好",让学习真正发生。

429 10
|
5月前
|
关系型数据库 应用服务中间件 Linux
|

Linux 项目实战入门:从 0 到 1 搭建 LNMP 网站环境

本文手把手教你从零搭建LNMP网站环境,涵盖CentOS 7虚拟机配置、Nginx+MySQL+PHP安装与联动设置,提供详细命令与排错指南,并扩展部署WordPress实战,助你快速掌握Linux Web环境核心技能。

410 0
|
5月前
|
JavaScript 前端开发 小程序
|

Vue为何能稳居前端框架主流宝座

自2014年发布以来,Vue凭借“低门槛、渐进式、生态完善、持续进化”四大优势,迅速崛起为前端主流框架。其简洁语法利于新手入门,灵活架构适配各类项目,配合Vue Router、Pinia、Vite等官方工具及丰富社区资源,大幅提升开发效率。Vue3采用Proxy响应式机制,性能飞跃,并通过Uni-app等支持多端部署,被字节、阿里等大厂广泛采用。无论是中小企业快速开发,还是大型复杂系统构建,Vue均展现出强大适应力与竞争力,成为前端技术栈的首选之一。

274 0
|
5月前
|
NoSQL Linux Shell
|

2-MongoDB单机部署

本文档介绍MongoDB在Windows和Linux系统中的安装、配置与启动方法,包括下载地址、版本选择、命令行及配置文件启动方式,Shell连接、图形化工具Compass使用,并提供各环境安装包下载链接。

292 0
|
5月前
|
缓存 前端开发 测试技术
|

GLM-4.7开源!交出“生产级代码”

智谱今日发布并开源GLM-4.7,专注Coding场景,显著提升编程、推理与工具协同能力,在多项基准测试中位居开源模型前列。已上线z.ai与智谱清言,支持API调用。

2414 3
|
7月前
|
缓存 监控 安全
|

80_离线环境搭建:无互联网LLM推理

在当今大语言模型(LLM)蓬勃发展的时代,许多组织和个人面临着一个共同的挑战:如何在无互联网连接的环境中高效部署和使用LLM?这一需求源于多方面的考量,包括数据安全、隐私保护、网络限制、极端环境作业等。2025年,随着企业对数据主权意识的增强和边缘计算的普及,离线LLM部署已成为AI应用落地的关键场景之一。

758 0
|
8月前
|
人工智能 编解码 数据可视化
|

原生支持QwenImage!FlowBench 正式开启公测!本地 + 云端双模生图,AI创作更自由

FlowBench 是由 ModelScope x Muse 团队打造的一站式 AI 工作流创作平台,现已开启全面公测。该平台以工作流为核心,支持本地与云端资源协同运行,面向开发者、设计师及 AI 创作者提供高效、稳定、易用的可视化创作体验。FlowBench 原生支持 QwenImage 图像生成模型,最低仅需 8GB 显存即可实现本地生图,并支持多 LoRA 融合、多图批量生成等强大功能。用户可在 Mac 和 Windows 系统下载使用,同时享受云端与本地自由切换带来的灵活体验。公测期间,FlowBench 团队将持续优化功能,推出更多创新特性,助力用户开启高效 AI 创作之旅。

1612 11
|
8月前
|
人工智能 编解码 数据可视化
|

AI创作更自由: 魔搭FLowBench云端工作流上线AIGC专区!支持QwenImageEdit免费出图!

很高兴向大家宣布,ModelScope AIGC 专区的工作流功能正式上线!

1342 22
|
8月前
|
机器学习/深度学习 人工智能 数据处理
|

混元开源又+1:视频音效可以自动生成了

AI生成的视频音效,已经可以用于视频制作了。

659 18
|
11月前
|
自然语言处理 数据可视化 测试技术
|

告别‘人海战术’!基于EvalScope 的文生图模型智能评测新方案

生成式模型在文本生成图片等领域的快速发展,为社区带来了日新月异的诸多文生图模型。

1064 20
|
12月前
|
机器学习/深度学习 算法 测试技术
|

DeepSeek-R1-0528:小更新大升级

今天,DeepSeek R1 开源发布了其“小版本”升级——DeepSeek-R1-0528。

1381 23
|
1月前
|
机器学习/深度学习 自然语言处理 数据可视化
|

可计算元认知文本分析在细胞生物学中的语义基线构建与边界信号检测

背景:科学研究中的“范式”往往是隐性的、难以量化的;而研究论文正是范式的全部语言载体。 目的:构建细胞生物学的语义基线,并系统检测该领域的边界信号(阈值、开关、检查点等),验证可计算元认知框架在生物学中的适用性。 结论:本文首次在细胞生物学构建了系统的语义基线,证实了可计算元认知框架的跨学科可迁移性;所得到的动词 术语 边界词库为后续流行病学、临床医学等领域的跨域对齐提供了可复用的基准。

367 5
|
3月前
|
数据采集 机器学习/深度学习 人工智能
|

全球Top下载中文开源数据集更新|OpenCSG持续打造中文高质量数据集开源底座

OpenCSG正式发布Fineweb-Edu-Chinese V2.2数据集:覆盖预训练(1.5T tokens,质量分层)与SFT微调(143.7万条DeepSeek V3.2蒸馏问答对)全流程,严格事实锚定、支持溯源,是当前少有的高质量中文教育全栈数据解决方案。

320 13
|
4月前
|
传感器 边缘计算 自动驾驶
|

蚂蚁正式开源 LingBot-Depth,基于掩码深度建模的新一代空间感知模型

蚂蚁灵波科技开源LingBot-Depth空间感知模型,首创“掩码深度建模”技术,显著提升消费级双目相机对透明、反光物体的深度补全能力。实测精度与覆盖率超越顶级工业相机,支持机器人稳定抓取、4D场景理解,已轻量化部署。

679 3
|
4月前
|
JSON 人工智能 自然语言处理
|

基于Qwen-3B-Raw的本地化SD Prompt生成器研究

本项目用NLP技术把人类的模糊美学意图,蒸馏成可重复、可微调、可部署的图像生成指令引擎。

362 13
来自: 自然语言处理  版块
|
4月前
|
人工智能 Kubernetes 数据可视化
|

别再写"面条式文档"了!用AI给你的思维装个"图形渲染引擎"

别让线性文字限制了你的高维思考。本文揭示了大脑作为"图形处理器"的本质,提供了一套专业的AI指令,将复杂的逻辑思维"序列化"为清晰的拓扑结构,像渲染DOM树一样可视化你的知识体系,极大提升沟通与学习效率。

463 12
|
4月前
|
机器学习/深度学习 人工智能 JSON
|

大模型微调实战:从原理到落地的完整指南

本文系统讲解大模型微调的原理与实战,涵盖LoRA等高效方法,手把手教你用少量数据定制专属模型,结合数据准备、训练策略与效果评估,助力开发者低成本实现AI应用落地。

864 11
|
4月前
|
机器学习/深度学习 文字识别 测试技术
|

10B击败200B!阶跃星辰10B视觉语言SOTA模型开源

阶跃星辰发布开源多模态小模型Step3-VL-10B,仅10B参数却媲美百亿级大模型,在视觉感知、逻辑推理、数学竞赛等任务中达同规模SOTA,支持端侧部署,推动智能终端交互革新。

438 6
|
4月前
|
人工智能 自然语言处理 运维
|

业内首发泛娱乐底座大模型!元象开源XVERSE-Ent中英双模型,单卡部署超低门槛

元象开源首款聚焦泛娱乐场景的大模型XVERSE-Ent,含中英双版本,专精角色一致性、长剧情理解与多元语境适配,支持轻量化部署,助力开发者低成本打造AI社交、游戏与创意内容应用。

433 3
|
5月前
|
测试技术
|

发布模式

蓝绿部署通过两套并行系统实现零停机发布,绿色为线上系统,蓝色为新版本待切系统,确保快速回滚;金丝雀发布则逐步替换旧版本,适合大规模集群;A/B测试用于对比多版本业务效果,三者分别应用于发布稳定性与功能优化不同场景。

192 0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉答疑群:44837352

0
今日
15229
内容
6
活动
4194
关注
你好!
登录掌握更多精彩内容

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 智能语音交互