Swift的搜索结果_热门_第3页-阿里云开发者社区

阿里云开发者

|

12月前

|

博文

千问团队开源了强大的 Qwen2.5-Coder 系列模型，涵盖 0.5B 到 32B 六种尺寸，旨在推动开放代码模型的发展。该系列模型在代码生成、修复和推理等方面表现出色，支持多种编程语言，并在多个基准测试中达到 SOTA 水平。此外，Qwen2.5-Coder 还提供了丰富的应用场景，如代码助手、Artifacts 和 Interpreter，满足不同开发者的需求。

# 数据采集 # 小程序 # API # 开发者 # Swift

AIweker

|

博文

介绍一个大语言模型的微调框架Swift | AIGC

介绍一个大语言模型的微调框架Swift 【7月更文挑战第4天】

# 物联网 # PyTorch # 算法框架/工具 # Swift # 开发者

ModelScope运营小助手

|

博文

|

来自： ModelScope模型即服务

大模型时代，还缺一只雨燕｜ SWIFT：魔搭社区轻量级微调推理框架

伴随着大数据的发展和强大的分布式并行计算能力，以预训练+微调的模型开发范式渐渐成为深度学习领域的主流。 2023年各家推出的大模型浩如烟海，如GPT4、Llama、ChatGLM、Baichuan、RWKV、Stable-Diffusion等。这些模型在达到越来越好的效果的同时也需要越来越多的算力资源：全量finetune它们动辄需要几十至上百G显存训练部署，一般的实验室和个人开发者无力承担。

# 机器学习/深度学习 # 人工智能 # 物联网 # Swift # 开发者

汀丶人工智能

|

博文

LLM 大模型学习必知必会系列(十二)：VLLM性能飞跃部署实践：从推理加速到高效部署的全方位优化[更多内容：XInference/FastChat等框架]

# GPU云服务器 # 机器学习/深度学习 # 缓存 # 算法 # Swift # 异构计算

小小爱吃香菜

|

问答

|

来自： ModelScope模型即服务

请问modelscope的swift如何单机多卡微调？

# GPU云服务器 # Swift

ModelScope运营小助手

|

博文

|

来自： ModelScope模型即服务

零一万物开源Yi-VL多模态大模型，魔搭社区推理&微调最佳实践来啦！

近期，零一万物Yi系列模型家族发布了其多模态大模型系列，Yi Vision Language（Yi-VL）多模态语言大模型正式面向全球开源。

# 自然语言处理 # 物联网 # Swift # 计算机视觉 # 异构计算

ModelScope运营小助手

|

博文

|

来自： ModelScope模型即服务

DeepSeek VL系列开源，魔搭社区模型微调最佳实践教程来啦！

3月11日，DeepSeek-AI开源了全新多模态大模型DeepSeek-VL系列，包含1.3b、7b两种不同规模的4个版本的模型。

# 编解码 # JSON # 数据可视化 # 物联网 # Swift

modelscope

|

7月前

|

博文

|

来自： ModelScope模型即服务

Qwen3 X ModelScope工具链: 飞速训练 + 全面评测

Qwen于近日发布了Qwen3系列模型，包含了各个不同规格的Dense模型和MoE模型。开源版本中，Dense模型基本沿用了之前的模型结构，差别之处在于对于Q和K两个tensor增加了RMSNorm；MoE模型去掉了公共Expert，其他结构基本与前一致。在模型大小上，涵盖了从0.6B到32B（Dense）和235B（MoE）不同的尺寸。

# 算法 # 物联网 # Swift # 开发者 # 异构计算

JoanKing

|

博文

iOS 应用之间的跳转(OC&Swift)

# 域名与网站 # 编解码 # Swift # iOS开发

ModelScope内容运营小助手

|

博文

Liger kernel训练加速，一行代码训练吞吐量提高 20%，显存使用量降低 60%

在LLM的训练/微调过程中，开发者通常会遇到一些瓶颈，包括GPU显存不够，经常遇到OOM，GPU使用率100%而且非常慢等。

# GPU云服务器 # 测试技术 # 开发工具 # Swift # 开发者 # 异构计算

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Swift