CV - 计算机视觉 | ML - 机器学习 | RL - 强化学习 | NLP 自然语言处理
New
1.GPT-4震憾发布!
今天凌晨,OpenAI 发布了多模态预训练大模型 GPT-4。GPT-4 实现了以下几个方面的飞跃式提升:强大的识图能力;文字输入限制提升至 2.5 万字;回答准确性显著提高;能够生成歌词、创意文本,实现风格变化。GPT4 公告中最明显和最令人惊奇的部分是它如何在编写 HTML/CSS/JS 代码的同时重写手写网络草图中的笑话以生成功能齐全的网站。最终,无代码工具类型将消失,生成式 AI 一切皆有可能。总结要点:提升专业学术能力,各类考试超过90%的人类;真正的多模态,可以把纸笔画的原型直接写出网页代码。读论文时可以知道插图含意。英文准确度提升,70%到85.5% ;中文准确度提升,达到 GPT3.5 的英文水平。
2.百度文心一言发布
3月16日下午,文心一言发布会在百度科技园举行。百度创始人李彦宏介绍,百度在过去十几年间一直在AI研发上持续投入,文心大模型的第一个版本在2019年就发布了,此后每一年都要发布一个新的版本。“全球大厂中百度是第一个发布的”,李彦宏坦承,这段时间不断有人问他为什么现在发布文心一言,百度是否真的准备好了,“从我自己在内测过程中体验到的文心一言的能力来说,(当前)确实不能叫作‘完美’”。李彦宏表示,发布是因为有市场需求——百度的各个产品线都在等待这样的技术,客户也在等待,因而需要尽早推出。李彦宏介绍,文心一言这类大语言模型产品一旦发布,就会获得真实的用户反馈,而有用户反馈,它的迭代速度会非常快,能力提升就会非常快。“我们大家都希望文心一言能够快速成长,能够尽早地给用户和客户带来价值。”
3.Google 的通用语音模型 (USM):适用于 100 多种语言的最先进的语音 AI
USM 是一系列最先进的语音模型,其 2B 参数经过 1200 万小时的语音和 280 亿个文本句子的训练,涵盖 300 多种语言。USM 用于 YouTube(例如,隐藏式字幕),不仅可以对英语和普通话等广泛使用的语言执行自动语音识别 (ASR),还可以对阿姆哈拉语、宿雾语、阿萨姆语等资源贫乏的语言执行自动语音识别 (ASR),和阿塞拜疆仅举几例。该系统被该公司描述为实现其目标的“关键的第一步”,现在更接近其创建支持 1,000 种不同语言的 AI 语言模型的目标,击败聊天GPT。
4.Meta继续大幅度裁员
在以极快的速度招聘多年后,扎克伯格先生正在裁员。随着其应用程序系列(其中还包括 WhatsApp)在全球范围内流行起来,他的公司开始大量招聘员工。冠状病毒大流行还促进了移动应用程序的使用,从而带来了更多增长。在去年的巅峰时期,Meta 拥有 87,000 名全职员工。这次裁员将是这家科技公司自去年 11 月以来的第二轮裁员。其首席执行官马克扎克伯格宣布 2023 年为“效率年”。扎克伯格先生在公司网站上发布的一份备忘录中表示,裁员将影响本周的 Meta 招聘团队,其技术和业务部门的重组将在 4 月和 5 月进行。该公告是该公司近半年来的第二轮裁员。11 月,Meta 裁员超过 11,000 人,约占当时员工总数的 13%。扎克伯格先生在备忘录中说,Meta 还计划关闭大约 5,000 个尚未填补的招聘职位。其他重组工作包括计划在今年夏天完成对 Meta 混合复工模式的分析,该模式于去年 3 月开始测试。
5.硅谷银行破产
成立于1983年的硅谷银行,是美国第16大银行,也是硅谷本地最大的银行之一。硅谷银行的地位非常特殊,因为它在高科技初创企业投融资领域最为活跃。它的客户,多为科技创业公司和投资机构,并不像普通银行那样依赖家庭储蓄账户。长期以来,硅谷银行一直声誉良好(包括在中国市场),而且被认为经营稳健。根据海外媒体的统计,迄今为止硅谷银行已经支持了3万多家初创公司(包括meta,推特等)和700多家投资机构,在初创企业的信贷市场占据了50%以上的份额。截至2022年底,公司管理资产2120亿美元。这家曾在美国科创圈风靡一时、拥有2090亿美元资产的明星银行于3月10日被美国联邦存款保险公司(FDIC)接管,宣告破产。
6.Pytorch2.0正式版发布
我们很高兴地宣布发布 PyTorch 2.0!PyTorch 2.0 提供相同的急切模式开发和用户体验,同时从根本上改变和增强 PyTorch 在编译器级别的运行方式,具有更快的性能和对动态形状和分布式的支持。PyTorch 2.0 引入了新的编译器技术,可以提高 PyTorch 的性能,同时保持您熟悉和喜爱的急切模式开发和用户体验。Meta 的开发倡导者 Shashank Prasanna 将介绍新的 PyTorch 2.0,并概述为新的 torch.compile() API 提供支持的技术堆栈:TorchDynamo、AITAutograd、PrimTorch 和 TorchInductor。新的编译器堆栈减少了各种工作负载的训练时间,同时完全向后兼容。
7.谷歌新的 AI 写作工具将嵌入到 Gmail 帐户中
谷歌计划将新的人工智能工具引入其 Workspace 应用程序套件。在周二的一篇博客文章中,这家搜索巨头表示,它开始测试 Gmail 和 Docs 中的生成式 AI 写作功能,这些功能可以帮助人们开始写作过程。“只需输入一个你想写的主题,草稿就会立即为你生成,”谷歌的帖子中写道。“与您的协作 AI 合作伙伴一起,您可以继续完善和编辑,根据需要获得更多建议。”谷歌建议,该工具可用于帮助创建诸如定制的工作描述或孩子生日聚会的邀请之类的东西。该公司还在探索将 AI 工具整合到 Slides、Sheets、Meet 和 Chat 中的方法。
8.微软深夜放炸弹!GPT-4 Office全家桶发布
AI 桌面革命深夜打响,GPT-4 全面接入微软 Office 全家桶,势必颠覆人类办公!微软今天宣布,Microsoft 365 服务已全面接入 AI 驱动工具 Copilot。现在,每个人都可以用人工智能自动生成文档、电子邮件、演示文稿了。具体来说,Copilot 以两种方式集成到了 Microsoft 365 中,包括 Word、Excel、PowerPoint、Outlook、Teams 等等。Copilot 可以在所有 Office 的应用程序中被召唤出来,并在 Word 中被用来起草基于其他文件的文档。然后,这些 AI 生成的文本可以被自由编辑和改编。
期待下周与您相见