Swift

首页 标签 Swift
# Swift #
关注
3132内容
[大模型实战 06] 我的模型我做主:在 Kaggle 上用 Unsloth 极速微调 Qwen3
本文介绍如何用Unsloth+QLoRA高效微调Qwen3-4B模型,仅需Kaggle免费T4显卡,速度提升2–5倍、显存节省60%;三步实现“灵魂认主”,让模型自认“AlgiebaLLM AI”,全程代码简洁,零基础可上手。
框架选错全白费:主流微调工具横向对比与选型指南
本文系统对比大模型微调主流框架:HuggingFace PEFT(生态完善、开箱即用)、DeepSpeed(超大模型分布式训练利器)、国产SWIFT(中文优化、轻量易上手)及集成平台LLaMA-Factory Online(可视化一站式方案),助开发者按需选型,提升效率。
|
14天前
|
《Android瘦LTO与Swift集成层启动优化实战指南》
本文聚焦Android瘦LTO构建与Swift重写Apple集成层对跨平台应用启动性能的优化实践,解析两项技术的核心优化逻辑与落地思路。瘦LTO通过精准的编译分层优化,聚焦启动关键路径精简产物、提升加载效率;Swift原生集成层则摒弃中间桥接链路,实现与系统API的直接对接,压缩初始化耗时。文章还阐释了双端技术的协同优化闭环,以及基于应用实际场景的精准适配方法。
ModelScope魔搭社区发布月报 -- 25年12月
魔搭社区12月重磅更新DeepSeek 3.2、Mistral-3等模型,Z-Image-Turbo引领文生图生态,平台全面升级加速开源模型落地。
|
2月前
|
Xcode 26.2 (17C52) 发布 - Apple 平台 IDE
IDE for iOS/iPadOS/macOS/watchOS/tvOS/visonOS
|
3月前
|
Kotlin vs Swift:现代移动开发的“双子星”全面对比
Kotlin与Swift是现代移动开发的两大主流语言,分别主导Android与iOS生态。本文全面对比二者在语法、空安全、并发、性能及跨平台等方面的异同,深入解析其设计理念与适用场景,助你根据平台需求与技术战略做出最优选择。
ModelScope魔搭社区发布月报 -- 25年11月
魔搭ModelScope三周年庆!见证开源大模型从追赶到领跑,11月硬核更新不断:Qwen3-VL、MiniMax-M2等新模态齐发,AIGC生态爆发,OCR、语音、Agent全面进化。11月22日杭州AI开源生态大会,不见不散!
Thinking Machines Lab最新研究结果如何复现?On-Policy Distillation让训练成本直降10倍
Thinking Machines Lab提出On-Policy Distillation技术,让小模型高效继承大模型能力。相比传统强化学习,训练成本降低90%,效率提升十倍,支持本地部署、降低成本与延迟。结合vLLM加速与独立DeepSpeed配置,MS-SWIFT框架实现开箱即用的高效蒸馏训练,助力轻量模型具备“会思考、能纠错、可进化”的智能。
用Macbook微调Qwen3!手把手教你用微调给Qwen起一个新名字
本文介绍如何在MacBook上使用苹果MLX框架高效微调Qwen3大模型。借助MLX的高性能计算与统一内存架构,仅需2分钟即可完成训练,内存占用低至2GB,推理速度达400 Token/s,并支持快速部署为本地API服务,展现Mac轻薄本的强大AI生产力潜力。
|
5月前
| |
来自: 倚天
建造者模式
建造者模式是一种经典的设计模式,专注于分离复杂对象的构建过程与表示。它通过封装构建逻辑,提升代码可读性与可维护性,广泛应用于文档处理、游戏开发、订单系统等领域。该模式不仅体现了关注点分离的设计哲学,还展现了良好的扩展性与灵活性,是现代软件开发中不可或缺的重要思想。
免费试用