📣📣📣视觉智能开放平台子社区建立新版块——AI热点日报~
我们汇总了世界各地最具影响力的AI项目、研究成果和创新应用的信息,为读者带来前沿的科技资讯。无论你是科技爱好者、人工智能从业者或者只是对未来科技趋势感兴趣的读者,我们都致力于满足你的需求。通过简明易懂的报道和深入的分析,本系列文章将带你领略未来的畅想,了解人工智能正在如何改变我们的生活和社会。
不容错过的每一期,让我们与科技同行,共同探索AI的无限可能。
🌈热点内容直通车
1.GPT-3.5 Turbo 推出微调功能,可打造专属的 ChatGPT 聊天机器人
OpenAI 在官网宣布,推出 GPT-3.5Turbo 微调功能并更新 API,使企业、开发人员可以使用自己的数据,结合业务用例构建专属 ChatGPT。OpenAI 声称,这样定制的模型可以在某些任务上达到或超过 GPT-4 的能力。并表示GPT-4 的微调功能将于今年秋天推出。
微调后的 GPT-3.5Turbo 在某些任务上可以与基础的 GPT-4模型相媲美甚至超越。微调的数据由客户所有,不会被 OpenAI 或其他机构用于训练其他模型。 微调可以帮助改进模型的性能,例如改善模型对指令的理解、提高输出的一致性、调整模型的输出语气等。
此外,微调还可以缩短提示的长度,同时保持相似的性能。微调的费用分为初始训练费用和使用费用。
微调成本如下:
- 训练:0.008 美元 / 1K tokens
- 使用输入:0.012 美元 / 1K tokens
- 使用输出:0.016 美元 / 1K tokens
2. 微软宣布 Designer 已集成到 Edge 浏览器:使用 AI 打造惊艳视觉设计
2022 年 10 月,微软宣布了一款名为 Designer的新的设计工具,其利用生成式 AI 技术提供了强大的功能。今天微软宣布 Designer 已经成为 Edge 浏览器的一个完全集成的功能,目前仅在美国市场上线。
微软在博客文章中表示:
- Designer可生成出色的视觉设计选项供用户选择,甚至包括使用 DALL-E 技术生成的独特图片。
- Bing Chat AI 聊天机器人增加了一些新功能,例如撰写功能、专注功能
虽然 Designer 目前处于公开预览阶段,免费使用,但当其正式发布时,某些功能将需要额外付费才能使用。目前还没有关于 Designer 何时会在美国以外的 Edge 中上线的消息。
3. 微软推出 Olive 工具:大幅优化 AMD GPU 运行 AI 模型性能
微软公司近日发布新闻稿,介绍了全新的 Microsoft Olive 工具,最多可以让 AMD 旗下的 GPU 显卡运行模型性能提升 9.9 倍。Microsoft Olive 是由 Python 语言开发的工具,可以大幅优化 AMD GPU 运行大语言模型的性能。
Microsoft Olive 可以转换、优化、量化和自动调优模型,从而最大化性能输出。AMD 在官方测试中表示,在默认 PyTorch 路径上运行,AMD Radeon RX 7900 XTX 每秒提供 1.87 次迭代;不过开启 Microsoft Olive 工具优化模型之后,该 GPU 每秒可以迭代 18.59 次。
Radeon RX 7900 XTX GPU 在启用 Microsoft Olive 工具之后,以运行 Stable Diffusion 模型为例,基于文本生成图像性能明显提升。
4. ChatGPT 向英国和欧盟开放自定义指令功能
ChatGPT 曾于 8 月 10 日宣布“自定义指令”功能向所有用户免费开放,欧盟和英国除外。今日,ChatGPT 再次宣布“自定义指令”面向欧盟和英国用户开放。
该功能可以让用户给机器人设置一些特定的规则和条件,来控制机器人的行为和输出。例如,用户可以指定机器人只能使用某种语言、只能回答某种类型的问题、只能生成某种格式的内容等等。同时,使用这一功能的开发人员可以要求聊天机器人以他们偏好的语言提供回应,或者排除他们不想要的语言。OpenAI 指出,即使关闭聊天历史记录,现在也可以使用自定义指令功能。
📖新鲜论文早知道
谷歌用简单的合成数据减少大型语言模型的谄媚行为
一位作为谷歌DeepMind的研究工程师Jerry Wang,研究方向为语言模型对齐和推理。之前曾在谷歌大脑和Meta实习,斯坦福大学本科毕业。通讯作者为谷歌大神Quoc V. Le,吴恩达的学生,Google Brain的创立者之一,也是谷歌AutoML项目的幕后英雄之一。
- 动机:研究语言模型中的谄媚行为,并提出一种简单的合成数据干预方法来减少这种行为。
- 方法:通过在一组谄媚任务上进行实验,观察模型的行为,并提出了一种基于合成数据的轻量微调方法来减少谄媚行为。模型规模增大和对话指令微调,会增加模型的谄媚倾向(sycophancy),即模型更倾向重复用户的观点,即使这些观点并不正确。模型即使知道加法语句是错误的,也会在用户表示同意这些错误语句时改变自己的看法并表示同意,显示出谄媚的倾向。通过在额外的微调阶段使用简单的人工合成数据,可以减少模型的谄媚倾向,这种微调不需要大量计算资源,只需要混合一小部分指令微调数据和大量人工数据微调约1000步即可。数据过滤非常重要,需要移除模型无法理解真假的示例,否则模型可能学不到用户观点与陈述真假无关的关系,而是随机生成回答,只有足够大的模型才能从这种人工数据中获益。人工数据微调可以在不损害模型其他能力(如基准测试表现)的情况下减少谄媚倾向,这表明对齐不一定会损害其他能力。
- 优势:通过合成数据干预的方法,成功地减少了语言模型的谄媚行为,从而使模型更加独立于用户观点。
论文地址:https://arxiv.org/abs/2308.03958
代码地址:https://github.com/google/sycophancy-intervention
📙精品书单多分享
精品白皮书分享——《从头训练大模型最佳实践》
涵盖数据集、硬件、分布式训练、RLHF 等方面的内容——需要多少数据才能训练出有竞争力的大模型、平衡内存和计算效率、并行化的不同技术、标记化策略及其权衡、模型评估、如何减少建模中的偏见和有害信息等《Current Best Practices for Training LLMs from Scratch | Weights & Biases 》
白皮书地址:https://wandb.ai/site/llm-whitepaper
关注子社区,每周热点抢先看~
更多精彩内容欢迎点击下方链接,了解更多viapi相关信息。