文章标签:
GPU云服务器
资源管理
自然语言处理
性能测试
负载均衡
日志服务
机器学习/深度学习
算法框架/工具
AI芯片
PyTorch
调度
相关实践学习
在云上部署ChatGLM2-6B大模型(GPU版)
ChatGLM2-6B是由智谱AI及清华KEG实验室于2023年6月发布的中英双语对话开源大模型。通过本实验,可以学习如何配置AIGC开发环境,如何部署ChatGLM2-6B大模型。
相关文章
龙蜥社区(OpenAnolis)
|
9月前
|
人工智能
安全
API
Confidential AI 实践:基于 Anolis OS 部署 Intel TDX 保护的 Qwen 模型
Confidential AI 最佳实践。
龙蜥社区(OpenAnolis)
438
1
1
安全风信子
|
6月前
|
监控
安全
数据安全/隐私保护
55_大模型部署:从云端到边缘的全场景实践
随着大型语言模型(LLM)技术的飞速发展,从实验室走向产业化应用已成为必然趋势。2025年,大模型部署不再局限于传统的云端集中式架构,而是向云端-边缘协同的分布式部署模式演进。这种转变不仅解决了纯云端部署在延迟、隐私和成本方面的痛点,还为大模型在各行业的广泛应用开辟了新的可能性。本文将深入剖析大模型部署的核心技术、架构设计、工程实践及最新进展,为企业和开发者提供从云端到边缘的全场景部署指南。
安全风信子
1774
1
2
小攻云攻略
|
7月前
|
人工智能
云栖大会
2025云栖大会大模型应用开发与部署|门票申领
2025云栖大会大模型应用开发与部署门票申领
小攻云攻略
576
9
9
安全风信子
|
6月前
|
缓存
API
调度
70_大模型服务部署技术对比:从框架到推理引擎
在2025年的大模型生态中,高效的服务部署技术已成为连接模型能力与实际应用的关键桥梁。随着大模型参数规模的不断扩大和应用场景的日益复杂,如何在有限的硬件资源下实现高性能、低延迟的推理服务,成为了所有大模型应用开发者面临的核心挑战。
安全风信子
849
0
0
安全风信子
|
6月前
|
人工智能
监控
安全
06_LLM安全与伦理:部署大模型的防护指南
随着大型语言模型(LLM)在各行业的广泛应用,其安全风险和伦理问题日益凸显。2025年,全球LLM市场规模已超过6400亿美元,年复合增长率达30.4%,但与之相伴的是安全威胁的复杂化和伦理挑战的多元化
安全风信子
768
0
0
霍格沃兹测试开发学社
|
7月前
|
算法
安全
开发者
大模型部署指南:从个人玩转到企业级应用,这4款工具必看!
本文介绍了五款主流大语言模型部署工具,帮助用户根据需求选择合适的方案。包括适合个人使用的 Ollama 和 LM Studio、优化低配设备运行的 llama.cpp、企业级部署的 vLLM,以及 Hugging Face 推出的 TGI 框架,覆盖从本地体验到高性能服务的多种场景。
霍格沃兹测试开发学社
3568
0
0
modelscope
|
8月前
|
XML
机器学习/深度学习
人工智能
利用OpenVINO™ 快速部署端侧可用的MiniCPM-V4.0视觉大模型
MiniCPM-V4.0是MiniCPM-V系列中最新的高效模型,参数总量为4B。该模型在 OpenCompass评测中图像理解能力超越了GPT-4.1-mini-20250414、Qwen2.5-VL-3B-Instruct和InternVL2.5-8B。凭借小巧的参数规模和高效的架构,MiniCPM-V4.0是移动端部署的理想选择。
modelscope
387
0
0
武汉肆晟
|
8月前
|
人工智能
JavaScript
前端开发
大模型开发从入门到部署
本内容系统讲解大语言模型技术,涵盖BERT、GPT等主流架构,深入Transformer原理与自注意力机制,结合PyTorch实战,详解张量操作、自动求导与模型训练,并介绍RAG、Agent等典型应用场景,助你掌握AI核心技术。
武汉肆晟
978
0
0
mozzie.
|
9月前
|
人工智能
搜索推荐
Linux
ollama部署本地DeepSeek大模型
本地部署大模型具有省钱省心、数据安全、使用自由、无需联网、量身定制及响应高效等优势。DeepSeek 提供满血版与多种蒸馏版模型,适配不同硬件条件。通过 Ollama 可便捷部署,并结合客户端工具如 AnythingLLM 提升交互体验,打造个性化本地 AI 助手。
mozzie.
1014
0
0
热门文章
最新文章
1
中文竞技场(MS)大模型评测
2
科普神文,一次性讲透AI大模型的核心概念
3
Qwen2.5 全链路模型体验、下载、推理、微调、部署实战!
4
全新开源通义千问Qwen3,它来了!
5
阿里云百炼已上线超强推理开源模型QwQ-32B,尺寸更小,性能比肩DeepSeek满血版
6
通义千问72B、1.8B、Audio模型开源!魔搭社区最佳实践来啦!
7
企业AI落地实践(三):使用 AI 网关解决 AI Agent 与 LLM 的交互挑战
8
全球首次!时序大模型突破十亿参数,华人团队发布Time-MoE,预训练数据达3000亿个时间点
9
NL2SQL基础系列(2):主流大模型与微调方法精选集,Text2SQL经典算法技术回顾七年发展脉络梳理
10
AI大模型进阶系列(01)看懂AI大模型的主流技术 | AI对普通人的本质影响是什么
1
大模型强化学习的熵控制:CE-GPPO、EPO与AsyPPO技术方案对比详解
438
2
当AI开始“思考”:为什么大模型的尽头是推理?
558
3
大模型分布式推理:张量并行与流水线并行技术
1571
4
构建AI智能体:一、初识AI大模型与API调用
2275
5
【大模型微调】一文掌握5种大模型微调的方法
5881
6
从“看见”到“预见”:合合信息“多模态文本智能技术”如何引爆AI下一场革命。
284
7
AI Agent的未来之争:任务规划,该由人主导还是AI自主?——阿里云RDS AI助手的最佳实践
1225
8
C3仓库AI代码门禁通用实践:基于Qwen3-Coder+RAG的代码评审
1203
9
Qwen3-VL新成员 2B、32B来啦!更适合开发者体质
5922
10
AI Agent越用越笨?阿里云AnalyticDB「AI上下文工程」一招破解!
738
相关商品
相关解决方案
更多
快速部署DeepSeek-OCR
零代码微调,打造领域专属大模型
触手可及,函数计算玩转 AI 大模型
一键部署幻兽帕鲁游戏服务器
OpenAI 重磅开源,快速部署GPT-OSS模型
相关课程
更多
阿里云大模型工程师ACA认证课程
阿里云百炼大模型产品实践
ADB-PG+大模型一站式AIGC解决方案
阿里云百炼,手把手教你如何构建企业大模型应用服务
云原生AI套件:一键训练大模型及部署GPU共享推理服务
【开眼界】大模型时代的个人应对策略
相关电子书
更多
OpenSearch向量检索和大模型方案
通义万相:视觉生成大模型的进化与应用
达摩院通义视觉生成大模型
相关实验场景
更多
通过GPU云服务器生成个人版对话大模型
如何快速训练大模型
如何快速体验调用通义大模型
在云上部署ChatGLM2-6B大模型(GPU版)
使用AI容器镜像部署Qwen大语言模型
下一篇
PHP:将本地文件上传到阿里云OSS存储