AI_News周刊:第六期

简介: 3月16日下午,文心一言发布会在百度科技园举行。百度创始人李彦宏介绍,百度在过去十几年间一直在AI研发上持续投入,文心大模型的第一个版本在2019年就发布了,此后每一年都要发布一个新的版本。“全球大厂中百度是第一个发布的”,李彦宏坦承,这段时间不断有人问他为什么现在发布文心一言,百度是否真的准备好了

CV - 计算机视觉 |  ML - 机器学习 |  RL - 强化学习 | NLP 自然语言处理


New


1.GPT-4震憾发布!


199fe6186afba4bef4e3221e6abacb0d.png

 

       今天凌晨,OpenAI 发布了多模态预训练大模型 GPT-4。GPT-4 实现了以下几个方面的飞跃式提升:强大的识图能力;文字输入限制提升至 2.5 万字;回答准确性显著提高;能够生成歌词、创意文本,实现风格变化。GPT4 公告中最明显和最令人惊奇的部分是它如何在编写 HTML/CSS/JS 代码的同时重写手写网络草图中的笑话以生成功能齐全的网站。最终,无代码工具类型将消失,生成式 AI 一切皆有可能。总结要点:提升专业学术能力,各类考试超过90%的人类;真正的多模态,可以把纸笔画的原型直接写出网页代码。读论文时可以知道插图含意。英文准确度提升,70%到85.5% ;中文准确度提升,达到 GPT3.5 的英文水平。


2.百度文心一言发布


      3月16日下午,文心一言发布会在百度科技园举行。百度创始人李彦宏介绍,百度在过去十几年间一直在AI研发上持续投入,文心大模型的第一个版本在2019年就发布了,此后每一年都要发布一个新的版本。“全球大厂中百度是第一个发布的”,李彦宏坦承,这段时间不断有人问他为什么现在发布文心一言,百度是否真的准备好了,“从我自己在内测过程中体验到的文心一言的能力来说,(当前)确实不能叫作‘完美’”。李彦宏表示,发布是因为有市场需求——百度的各个产品线都在等待这样的技术,客户也在等待,因而需要尽早推出。李彦宏介绍,文心一言这类大语言模型产品一旦发布,就会获得真实的用户反馈,而有用户反馈,它的迭代速度会非常快,能力提升就会非常快。“我们大家都希望文心一言能够快速成长,能够尽早地给用户和客户带来价值。”


0d805fb897d8976fa59627f1910a00c3.jpg


3.Google 的通用语音模型 (USM):适用于 100 多种语言的最先进的语音 AI


39b167b124b311fe12fc2650e52085bb.png


      USM 是一系列最先进的语音模型,其 2B 参数经过 1200 万小时的语音和 280 亿个文本句子的训练,涵盖 300 多种语言。USM 用于 YouTube(例如,隐藏式字幕),不仅可以对英语和普通话等广泛使用的语言执行自动语音识别 (ASR),还可以对阿姆哈拉语、宿雾语、阿萨姆语等资源贫乏的语言执行自动语音识别 (ASR),和阿塞拜疆仅举几例。该系统被该公司描述为实现其目标的“关键的第一步”,现在更接近其创建支持 1,000 种不同语言的 AI 语言模型的目标,击败聊天GPT。


4.Meta继续大幅度裁员


a1024f7159636ea2c623704aa0522b2a.png


     在以极快的速度招聘多年后,扎克伯格先生正在裁员。随着其应用程序系列(其中还包括 WhatsApp)在全球范围内流行起来,他的公司开始大量招聘员工。冠状病毒大流行还促进了移动应用程序的使用,从而带来了更多增长。在去年的巅峰时期,Meta 拥有 87,000 名全职员工。这次裁员将是这家科技公司自去年 11 月以来的第二轮裁员。其首席执行官马克扎克伯格宣布 2023 年为“效率年”。扎克伯格先生在公司网站上发布的一份备忘录中表示,裁员将影响本周的 Meta 招聘团队,其技术和业务部门的重组将在 4 月和 5 月进行。该公告是该公司近半年来的第二轮裁员。11 月,Meta 裁员超过 11,000 人,约占当时员工总数的 13%。扎克伯格先生在备忘录中说,Meta 还计划关闭大约 5,000 个尚未填补的招聘职位。其他重组工作包括计划在今年夏天完成对 Meta 混合复工模式的分析,该模式于去年 3 月开始测试。


5.硅谷银行破产


10cff034ba26ac74719e69db439a667d.png


       成立于1983年的硅谷银行,是美国第16大银行,也是硅谷本地最大的银行之一。硅谷银行的地位非常特殊,因为它在高科技初创企业投融资领域最为活跃。它的客户,多为科技创业公司和投资机构,并不像普通银行那样依赖家庭储蓄账户。长期以来,硅谷银行一直声誉良好(包括在中国市场),而且被认为经营稳健。根据海外媒体的统计,迄今为止硅谷银行已经支持了3万多家初创公司(包括meta,推特等)和700多家投资机构,在初创企业的信贷市场占据了50%以上的份额。截至2022年底,公司管理资产2120亿美元。这家曾在美国科创圈风靡一时、拥有2090亿美元资产的明星银行于3月10日被美国联邦存款保险公司(FDIC)接管,宣告破产。


5c1086bccfc14d06f81137afae4c165c.png


6.Pytorch2.0正式版发布


e05554a6ab3780c3d0e881381036a49c.png


       我们很高兴地宣布发布 PyTorch 2.0!PyTorch 2.0 提供相同的急切模式开发和用户体验,同时从根本上改变和增强 PyTorch 在编译器级别的运行方式,具有更快的性能和对动态形状和分布式的支持。PyTorch 2.0 引入了新的编译器技术,可以提高 PyTorch 的性能,同时保持您熟悉和喜爱的急切模式开发和用户体验。Meta 的开发倡导者 Shashank Prasanna 将介绍新的 PyTorch 2.0,并概述为新的 torch.compile() API 提供支持的技术堆栈:TorchDynamo、AITAutograd、PrimTorch 和 TorchInductor。新的编译器堆栈减少了各种工作负载的训练时间,同时完全向后兼容。


7.谷歌新的 AI 写作工具将嵌入到 Gmail 帐户中


5f8dae6af252b6a62cb00d28e0690066.gif


      谷歌计划将新的人工智能工具引入其 Workspace 应用程序套件。在周二的一篇博客文章中,这家搜索巨头表示,它开始测试 Gmail 和 Docs 中的生成式 AI 写作功能,这些功能可以帮助人们开始写作过程。“只需输入一个你想写的主题,草稿就会立即为你生成,”谷歌的帖子中写道。“与您的协作 AI 合作伙伴一起,您可以继续完善和编辑,根据需要获得更多建议。”谷歌建议,该工具可用于帮助创建诸如定制的工作描述或孩子生日聚会的邀请之类的东西。该公司还在探索将 AI 工具整合到 Slides、Sheets、Meet 和 Chat 中的方法。


8.微软深夜放炸弹!GPT-4 Office全家桶发布


a3c811e20183d313ce5ec3d8b175e9b4.gif


       AI 桌面革命深夜打响,GPT-4 全面接入微软 Office 全家桶,势必颠覆人类办公!微软今天宣布,Microsoft 365 服务已全面接入 AI 驱动工具 Copilot。现在,每个人都可以用人工智能自动生成文档、电子邮件、演示文稿了。具体来说,Copilot 以两种方式集成到了 Microsoft 365 中,包括 Word、Excel、PowerPoint、Outlook、Teams 等等。Copilot 可以在所有 Office 的应用程序中被召唤出来,并在 Word 中被用来起草基于其他文件的文档。然后,这些 AI 生成的文本可以被自由编辑和改编。


期待下周与您相见


b5c121911c629a0f5b8d173a8bdd0262.png

目录
相关文章
|
6月前
|
数据采集 人工智能 Rust
『GitHub项目圈选周刊01』一款构建AI数字人项目开源了!自动实现音视频同步!
『GitHub项目圈选周刊01』一款构建AI数字人项目开源了!自动实现音视频同步!
1022 0
|
机器学习/深度学习 编解码 自然语言处理
AI_Papers周刊:第六期
大型语言模型 (LLM) 因其令人印象深刻的能力而广受欢迎,但对特定于模型的微调或特定于任务的提示工程的需求可能会阻碍它们的泛化。我们提出了 UPRISE(用于改进零样本评估的通用提示检索),它调整了一个轻量级且多功能的检索器,该检索器可以自动检索给定零样本任务输入的提示。
157 0
|
机器学习/深度学习 人工智能 缓存
AI_Papers周刊:第五期
我们研究了语言模型中的上下文学习 (ICL) 如何受到语义先验与输入标签映射的影响。我们研究了两种设置——带有翻转标签的 ICL 和带有语义无关标签的 ICL——跨越各种模型系列(GPT-3、InstructGPT、Codex、PaLM 和 Flan-PaLM)。
185 0
|
机器学习/深度学习 人工智能 分布式计算
AI_News周刊:第五期
OpenAI 以比预期低得多的价格发布了 ChatGPT 和 Whisper API,部分原因是为了响应开源 LLM 和竞争对手模型的进步。ChatGPT 可通过 GPT-Turbo 以每 1k 代币 0.002 美元的价格获得,比其达芬奇模型便宜 10 倍(9 月份其价格降低了 3 倍)并且与 OpenAI 较小的居里模型的定价一致(居里估计为7-100 亿个参数对比达芬奇的 1750 亿个参数)。
121 0
|
机器学习/深度学习 人工智能 自然语言处理
AI_Papers周刊:第四期
语言、多模式感知、动作和世界建模的大融合是通向通用人工智能的关键一步。在这项工作中,我们介绍了 Kosmos-1,这是一种多模态大型语言模型 (MLLM),它可以感知一般模态、在上下文中学习(即少镜头)并遵循指令(即零镜头)。
205 0
|
机器学习/深度学习 人工智能 自然语言处理
AI_News周刊:第四期
据两位直接了解这项工作的人士和另一位了解情况的人士透露,埃隆·马斯克最近几周与人工智能研究人员接洽,商讨成立一个新的研究实验室,以开发 ChatGPT 的替代品,ChatGPT 是初创公司 OpenAI 开发的备受瞩目的聊天机器人。
102 0
|
机器学习/深度学习 人工智能 自然语言处理
AI_Papers周刊:第三期
我们介绍了 LLaMA,这是一组基础语言模型,参数范围从 7B 到 65B。我们在数万亿个令牌上训练我们的模型,并表明可以仅使用公开可用的数据集来训练最先进的模型,而无需诉诸专有和不可访问的数据集。特别是,LLaMA-13B 在大多数基准测试中都优于 GPT-3 (175B),而 LLaMA-65B 可与最佳模型 Chinchilla70B 和 PaLM-540B 竞争。我们将所有模型发布给研究社区。
74 0
|
机器学习/深度学习 人工智能 自然语言处理
AI_News周刊:第三期
2023 年 2 月 21 日——贝恩公司今天宣布与 OpenAI 建立全球服务联盟,OpenAI 是人工智能系统 ChatGPT、DALL·E 和 Codex 背后的研究和部署公司,这些系统正在改变人们交流和创造的方式。贝恩和 OpenAI 正在合作,将 OpenAI 的突破性功能带给全球客户。通过该联盟,贝恩将其深厚的数字化实施能力和战略专长与 OpenAI 的人工智能工具和平台(包括 ChatGPT)相结合,帮助其全球客户识别和实施人工智能的价值,以最大限度地发挥商业潜力。
84 0
|
机器学习/深度学习 自然语言处理 算法
AI_Papers周刊:第二期
心理理论 (ToM),或将不可观察的心理状态归因于他人的能力,是人类社会互动、沟通、同理心、自我意识和道德的核心。我们在没有任何示例或预训练的情况下,对多种语言模型执行广泛用于测试人类 ToM 的经典错误信念任务。我们的结果表明,2022 年之前发布的模型几乎没有能力解决 ToM 任务。
145 0
|
人工智能 自然语言处理 机器人
AI_News周刊:第二期
这一转变标志着自社交媒体以来最重要的技术突破。近几个月来,好奇、震惊的公众如饥似渴地采用了生成式人工智能工具,这要归功于诸如 ChatGPT 之类的程序,它对几乎任何查询做出连贯(但并不总是准确)的响应,以及 Dall-E,它允许你召唤任何你想要的图像做梦。1 月份,ChatGPT 的月用户达到 1 亿,采用率高于 Instagram 或 TikTok。从 Midjourney 到 Stable Diffusion 再到 GitHub 的 Copilot,数以百计同样惊人的生成式 AI 都在呼吁采用,它可以让你将简单的指令转化为计算机代码。
100 0

热门文章

最新文章

下一篇
无影云桌面