总览
苹果正在为开发人员提供新的工具,用于在其硬件上训练和运行大型语言模型。
主要介绍
开发理念
苹果公司通过发布一系列新的开源人工智能工具,向开源人工智能领域致敬。
用于机器学习的MLX框架是专门为苹果的Silicon处理器架构开发的。MLX可通过GitHub获得,旨在简化苹果硬件上的机器学习模型培训和部署。
开发细节
苹果表示,MLX的设计受到了其他流行框架的“启发”,包括PyTorch、Jax和ArrayFire。然而,MLX的不同之处在于统一的内存模型——MLX中的阵列位于共享内存中,而操作可以在任何支持的设备类型上执行,而无需执行数据复制。
MLX存储库中写道:“该框架旨在用户友好,但仍然可以高效地训练和部署模型。框架本身的设计在概念上也很简单。我们打算让研究人员更容易地扩展和改进MLX,以快速探索新想法。”。
MLX有一个Python API,它紧跟NumPy——一个流行的Python编程库。MLX还包含C++API和更高级别的包,这些包遵循PyTorch构建更复杂的模型。
MLX功能
MLX的其他关键功能包括:
- 可组合函数转换:MLX具有用于自动微分、自动矢量化和计算图优化的可组合函数变换。
- 惰性计算:MLX中的计算是惰性的,只有在需要时才具体化数组。
- 动态图构建:MLX中的计算图是动态构建的。如果用户更改函数的形状,参数不会触发缓慢的编译,从而使调试更容易、更直观。
用途
为了展示MLX的能力,苹果机器学习研究科学家Awni Hannun在X(推特)上发布了一段视频,显示了Meta的LLaMA的70亿参数版本在M2 Ultra芯片上运行,该芯片在苹果的高端计算系统Mac Studio和Mac Pro中都有。
苹果展示MLX的其他例子包括使用稳定扩散生成图像、使用OpenAI的Whisper进行语音识别以及使用LoRA进行参数高效微调。
与大多数公司一样,苹果一直在加强其人工智能工作。今年夏天有报道称,该公司正在开发自己的基于网络应用程序的聊天机器人服务**“Apple GPT”**
MLX可以用于商业软件吗?
苹果的MLX是根据麻省理工学院的许可证提供的,该许可证允许广泛的使用自由,包括商业用途。
许可证的条件要求在软件的所有副本中包含版权声明和许可声明。