文章标签：

GPU云服务器

资源管理

自然语言处理

性能测试

负载均衡

日志服务

机器学习/深度学习

算法框架/工具

AI芯片

PyTorch

调度

相关实践学习

在云上部署ChatGLM2-6B大模型（GPU版）

ChatGLM2-6B是由智谱AI及清华KEG实验室于2023年6月发布的中英双语对话开源大模型。通过本实验，可以学习如何配置AIGC开发环境，如何部署ChatGLM2-6B大模型。

龙蜥社区（OpenAnolis）

9月前

人工智能安全 API

Confidential AI 实践：基于 Anolis OS 部署 Intel TDX 保护的 Qwen 模型

Confidential AI 最佳实践。

龙蜥社区（OpenAnolis）

438 1 1

安全风信子

6月前

监控安全数据安全/隐私保护

55_大模型部署：从云端到边缘的全场景实践

随着大型语言模型(LLM)技术的飞速发展，从实验室走向产业化应用已成为必然趋势。2025年，大模型部署不再局限于传统的云端集中式架构，而是向云端-边缘协同的分布式部署模式演进。这种转变不仅解决了纯云端部署在延迟、隐私和成本方面的痛点，还为大模型在各行业的广泛应用开辟了新的可能性。本文将深入剖析大模型部署的核心技术、架构设计、工程实践及最新进展，为企业和开发者提供从云端到边缘的全场景部署指南。

安全风信子

1774 1 2

小攻云攻略

7月前

人工智能云栖大会

2025云栖大会大模型应用开发与部署｜门票申领

2025云栖大会大模型应用开发与部署门票申领

小攻云攻略

576 9 9

安全风信子

6月前

缓存 API 调度

70_大模型服务部署技术对比：从框架到推理引擎

在2025年的大模型生态中，高效的服务部署技术已成为连接模型能力与实际应用的关键桥梁。随着大模型参数规模的不断扩大和应用场景的日益复杂，如何在有限的硬件资源下实现高性能、低延迟的推理服务，成为了所有大模型应用开发者面临的核心挑战。

安全风信子

849 0 0

安全风信子

6月前

人工智能监控安全

06_LLM安全与伦理：部署大模型的防护指南

随着大型语言模型(LLM)在各行业的广泛应用，其安全风险和伦理问题日益凸显。2025年，全球LLM市场规模已超过6400亿美元，年复合增长率达30.4%，但与之相伴的是安全威胁的复杂化和伦理挑战的多元化

安全风信子

768 0 0

霍格沃兹测试开发学社

7月前

算法安全开发者

大模型部署指南：从个人玩转到企业级应用，这4款工具必看！

本文介绍了五款主流大语言模型部署工具，帮助用户根据需求选择合适的方案。包括适合个人使用的 Ollama 和 LM Studio、优化低配设备运行的 llama.cpp、企业级部署的 vLLM，以及 Hugging Face 推出的 TGI 框架，覆盖从本地体验到高性能服务的多种场景。

霍格沃兹测试开发学社

3568 0 0

modelscope

8月前

XML 机器学习/深度学习人工智能

利用OpenVINO™ 快速部署端侧可用的MiniCPM-V4.0视觉大模型

MiniCPM-V4.0是MiniCPM-V系列中最新的高效模型，参数总量为4B。该模型在 OpenCompass评测中图像理解能力超越了GPT-4.1-mini-20250414、Qwen2.5-VL-3B-Instruct和InternVL2.5-8B。凭借小巧的参数规模和高效的架构，MiniCPM-V4.0是移动端部署的理想选择。

modelscope

387 0 0

武汉肆晟

8月前

人工智能 JavaScript 前端开发

大模型开发从入门到部署

本内容系统讲解大语言模型技术，涵盖BERT、GPT等主流架构，深入Transformer原理与自注意力机制，结合PyTorch实战，详解张量操作、自动求导与模型训练，并介绍RAG、Agent等典型应用场景，助你掌握AI核心技术。

武汉肆晟

978 0 0

mozzie.

9月前

人工智能搜索推荐 Linux

ollama部署本地DeepSeek大模型

本地部署大模型具有省钱省心、数据安全、使用自由、无需联网、量身定制及响应高效等优势。DeepSeek 提供满血版与多种蒸馏版模型，适配不同硬件条件。通过 Ollama 可便捷部署，并结合客户端工具如 AnythingLLM 提升交互体验，打造个性化本地 AI 助手。

mozzie.

1014 0 0

热门文章

最新文章

相关解决方案

相关课程

相关电子书

相关实验场景